cda

数字化人才认证

首页 > 行业图谱 >

克服大数据集群的挑战

克服大数据集群的挑战
2018-01-04
克服大数据集群的挑战 数据存储曾经是大数据的最大挑战。由于云计算基础设施的进步,存储数据不再是关键问题。如今,数据科学家所面临的最大问题是数据收集。 集群化使得大数据分析更容易。然而,集群也给数 ...

数据分析师&数据科学家&数据工程师——哪个角色最适合你

数据分析师&数据科学家&数据工程师——哪个角色最适合你
2018-01-02
What\'s the difference between a data analyst, scientist and engineer? 数据越来越多的影响并塑造着那些我们每天都要交互的系统。不管是你使用Siri,google搜索,还是浏览facebook的好友动态,你 ...

业界共同开掘大数据文化价值

业界共同开掘大数据文化价值
2017-12-21
业界共同开掘大数据文化价值 使用深度学习方法按照本文所介绍的步骤处理结构化数据有这样的好处: 快 无需领域知识 表现优良 在机器学习/深度学习或任何类型的预测建模任务中,都是先有数据然后再 ...

站在巨人的肩膀上做数据挖掘与机器学习—R帮你实现

站在巨人的肩膀上做数据挖掘与机器学习—R帮你实现
2018-01-03
R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站 ...

深入浅出,一篇超棒的机器学习入门文章

深入浅出,一篇超棒的机器学习入门文章
2017-12-19
深入浅出,一篇超棒的机器学习入门文章 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇 ...

数据挖掘中,分类与聚类的区别

数据挖掘中,分类与聚类的区别
2017-12-11
数据挖掘中,分类与聚类的区别 本文对数据挖掘中,极为常见的两类算法:分类与聚类,做个梳理。 首先,来看看分类和聚类各自的一些定义描述。 分类(classification ): 分类算法需要学习,它通过学习找出描述 ...

数据聚类的简单应用

数据聚类的简单应用
2017-12-09
数据聚类的简单应用 数据聚类data clustering:用来寻找紧密相关的事物,并将其可视化的方法。 1. 聚类时常被用于数据量很大(data-intensive)的应用中。 2. 聚类是无监督学习(unsupervised learning) ...
R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

数据工作的本质:从业务中来,到业务中去

数据工作的本质:从业务中来,到业务中去
2017-10-17
数据工作的本质:从业务中来,到业务中去 数据工作就组成结构和流程来说还是比较简单的,因为这个工作本来就很年轻,分工还没有很细。总体来讲,我把数据工作看成相互连接的三部分:取数、理数、用数,这是一个 ...

【每周一本书第6波】R 语言数据分析项目精解:理论、方法、实战

【每周一本书第6波】R 语言数据分析项目精解:理论、方法、实战
2017-09-28
【每周一本书第6波】R 语言数据分析项目精解:理论、方法、实战 读书是一件很私人的事,读什么、怎么读、为什么读都是因人而异的。读书很像是和好友的一次畅谈,更像是一次和伟人间私密的对话。找到一本适合自 ...

10个令人相见恨晚的R语言包

10个令人相见恨晚的R语言包
2017-09-15
10个令人相见恨晚的R语言包 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 ...

深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家

深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家
2017-09-06
深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家 最近有很多人咨询,想学习大数据,但不知道怎么入手,从哪里开始学习,需要学习哪些东西?对于一个初学者,学习大数据挖 ...

机器学习及大数据相关面试的职责和面试问题

机器学习及大数据相关面试的职责和面试问题
2017-06-06
机器学习及大数据相关面试的职责和面试问题 各个企业对这类岗位的命名可能有所不同,比如推荐算法/数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入 ...

 2017年最流行的15个数据科学Python库

2017年最流行的15个数据科学Python库
2017-06-02
Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程师将在 2017 年最常使用的 Python 库。 核心 ...

18本数据科学家必读的R语言和Python相关书籍

18本数据科学家必读的R语言和Python相关书籍
2017-05-25
前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是 ...

利用Python,四步掌握机器学习

利用Python,四步掌握机器学习
2017-05-18
利用Python,四步掌握机器学习 为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得 ...

机器学习的道、法、术、势、器

机器学习的道、法、术、势、器
2017-05-13
机器学习的道、法、术、势、器 “道、法、术、器”出于老子的《道德经》,后人又加了一个“势”,并且也有了不同的排列。很多人习惯用“道、法、术、势、器”的顺序,原因很简单:道以明向、法以立本、术以立策 ...

模式识别和机器学习、数据挖掘的区别与联系

模式识别和机器学习、数据挖掘的区别与联系
2017-05-05
模式识别和机器学习、数据挖掘的区别与联系 (一)模式识别的诞生与人工智能 自动控制起始是从工业革命之后,人们就希望设计出减少人工干预,能自己进行调节(regulate)的机器,工程领域开始想出了根轨迹等等 ...

如何通过数据挖掘手段分析网民的评价内容

如何通过数据挖掘手段分析网民的评价内容
2017-05-05
如何通过数据挖掘手段分析网民的评价内容 近年来微博等用户自媒体的爆炸式增长,使得利用计算机挖掘网民意见不但变得可行,而且变得必须。这其中很重要的一项任务就是挖掘网民意见所讨论的对象,即评价对象。本 ...

利用Python练习数据挖掘

利用Python练习数据挖掘
2017-05-03
利用Python练习数据挖掘 覆盖使用Python进行数据挖掘查找和描述数据结构模式的实践工具。 第一节 介绍 数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式。它使用广泛,并且是众多应用的技术基础。 ...

OK