cda

数字化人才认证

首页 > 行业图谱 >

大数据热词科普(六)

大数据热词科普(六)
2019-02-11
在前面的文章中我们给大家介绍了不少关于大数据热词的科普知识,从中我们可以发现大数据中的热词之间都是有一些联系的,如果我们学习大数据的话了解这些词汇以后就会不断地激发灵感,下面我们继续给大家 ...

带你轻松看懂机器学习工作流——以“点一份披萨外卖”为例

带你轻松看懂机器学习工作流——以“点一份披萨外卖”为例
2019-01-03
  作者 | Daniel Godoy 翻译 | Mika 本文为 CDA 数据分析师原创作品,转载需授权 想象一下你点了一份披萨外卖,过了一会儿美味热腾腾的披萨就送到家门口了。 你有没有想过从下单点外卖到披萨送过 ...

作为数据科学家,我都有哪些弱点?

作为数据科学家,我都有哪些弱点?
2018-12-24
作者 | William Koehrsen 翻译 | Mika 本文为 CDA 数据分析师原创作品,转载需授权 如果现代工作面试教会了我们什么,那就是关于“你最大的弱点是什么?”这个问题,正确答案是“我工作太努力了 ...

学数据分析需要学的知识详解(四)

学数据分析需要学的知识详解(四)
2018-12-14
我们在上一篇文章中给大家讲了数据预处理、概率论和统计这两方面的知识,这两个模块在数据分析中也是十分重要的。当然了学会这些去分析数据的时候还是不够的,因为这些知识去分析数据还差点火候,还需要 ...

大数据分析与数据分析的根本区别在哪里?

大数据分析与数据分析的根本区别在哪里?
2018-11-12
作者:CDA数据分析师 大数据分析与数据分析这几年一直都是个高频词,很多人都开始纷纷转行到这个领域,也有不少人开始跃跃欲试,想找准时机进到大数据或数据分析领域。如今大数据分析和数据分析火爆,要 ...

机器学习中几个常见模型的优缺点

机器学习中几个常见模型的优缺点
2018-08-20
机器学习中几个常见模型的优缺点 朴素贝叶斯:优点:对小规模的数据表现很好,适合多分类任务,适合增量式训练。 缺点:对输入数据的表达形式很敏感(连续数据的处理方式)。 决策树:优点:计算量简单, ...

在实际项目中,如何选择合适的机器学习模型

在实际项目中,如何选择合适的机器学习模型
2018-08-20
在实际项目中,如何选择合适的机器学习模型 在这个文章中,我们主要面向初学者或中级数据分析师,他们对识别和应用机器学习算法都非常感兴趣,但是初学者在面对各种机器学习算法时,都会遇到一个问题是 “在实 ...

决策树算法基础:ID3与C4.5

决策树算法基础:ID3与C4.5
2018-08-07
决策树算法基础:ID3与C4.5 设X是一个取有限个值得离散随机变量,其概率分布为P(X=xi)=pi,   i=1,2,…,n。则随机变量X的信息熵为 条件熵H(Y|X)表示在已知随机变量X的条件下随机变量Y的不确定 ...

数据挖掘常用算法及其在医学大数据研究中的应用

数据挖掘常用算法及其在医学大数据研究中的应用
2018-08-05
数据挖掘常用算法及其在医学大数据研究中的应用 医院信息化的发展及云计算、大数据、物联网、人工智能等在医疗领域的应用,为医学数据的获取、存储及处理提供了极大便利。数据挖掘也随着计算机技术得到了广泛应 ...

如何透彻的掌握一门机器学习算法

如何透彻的掌握一门机器学习算法
2018-07-23
如何透彻的掌握一门机器学习算法 机器学习算法都是一个个复杂的体系,需要通过研究来理解。学习算法的静态描述是一个好的开始,但是这并不足以使我们理解算法的行为,我们需要在动态中来理解算法。 机器 ...

数据科学入门丨选Python还是R

数据科学入门丨选Python还是R
2018-07-10
数据科学入门丨选Python还是R 对于想入门数据科学的新手来说,选择学Python还是R语言是一个难题,本文对两种语言进行了比较,希望能帮助你做出选择。 我是德勤的数据科学家主管,多年来我一直在使用Python和 ...

算法太多挑花眼?教你如何选择正确的机器学习算法

算法太多挑花眼?教你如何选择正确的机器学习算法
2018-07-05
算法太多挑花眼?教你如何选择正确的机器学习算法 机器学习算法虽多,却没有什么普适的解决方案。决策树、随机森林、朴素贝叶斯、深度网络等等等等,是不是有时候觉得挑花了眼呢?福利来啦~本文将教你慧眼识精 ...

干货 | 上手机器学习,从搞懂这十大经典算法开始

干货 | 上手机器学习,从搞懂这十大经典算法开始
2018-07-03
干货 | 上手机器学习,从搞懂这十大经典算法开始 在机器学习领域,“没有免费的午餐”是一个不变的定理。简而言之,没有一种算法是完美的,可以作为任何问题的最佳解决方案。认清这一点,对于解决监督学习问题 ...

Python能用来做什么?以下是Python的三大主要用途

Python能用来做什么?以下是Python的三大主要用途
2018-07-01
Python能用来做什么?以下是Python的三大主要用途 如果你想学Python,或者你刚开始学习Python,那么你可能会问:“我能用Python做什么?” 这个问题不好回答,因为Python有很多用途。 但是随着时间,我 ...

听说你立志要做数据分析,不如先听听老司机的建议

听说你立志要做数据分析,不如先听听老司机的建议
2018-06-29
听说你立志要做数据分析,不如先听听老司机的建议 每年总有很多人,怀揣着对世界的一知半解、满腔似火的热情、还有对美好生活的向往,走出象牙塔,投身社会。 世界很大,诱惑很多。对于未来,甚至在工作多年 ...

机器学习的第一步:先学会这6种常用算法

机器学习的第一步:先学会这6种常用算法
2018-06-15
机器学习的第一步:先学会这6种常用算法 机器学习领域不乏算法,但众多的算法中什么是最重要的?哪种是最适合您使用的?哪些又是互补的?使用选定资源的最佳顺序是什么?今天笔者就带大家一起来分析一下。 通用 ...

完整的R语言预测建模实例-从数据清理到建模预测

完整的R语言预测建模实例-从数据清理到建模预测
2018-05-23
完整的R语言预测建模实例-从数据清理到建模预测 本文使用Kaggle上的一个公开数据集,从数据导入,清理整理一直介绍到最后数据多个算法建模,交叉验证以及多个预测模型的比较全过程,注重在实际数据建模过程中 ...

R语言之-caret包应用

R语言之-caret包应用
2018-05-19
R语言之-caret包应用 caret包应用之一:数据预处理 在进行数据挖掘时,我们会用到R中的很多扩展包,各自有不同的函数和功能。如果能将它们综合起来应用就会很方便。caret包(Classification and Regressio ...

R语言深度学习不同模型对比分析案例

R语言深度学习不同模型对比分析案例
2018-05-16
R语言深度学习不同模型对比分析案例 深度学习是机器学习最近的一个趋势,模拟高度非线性的数据表示。在过去的几年中,深度学习在各种应用中获得了巨大的发展势头(Wikipedia 2016a)。其中包括图像和语音识别 ...

数据科学家需要掌握的十大统计技术详解

数据科学家需要掌握的十大统计技术详解
2018-05-15
数据科学家需要掌握的十大统计技术详解 「数据科学家比程序员擅长统计,比统计学家擅长编程。」本文介绍了数据科学家需要掌握的十大统计技术,包括线性回归、分类、重采样、降维、无监督学习等。 不管你对数 ...

OK