cda

数字化人才认证

首页 > 行业图谱 >

数学建模五大数据挖掘领域的经典算法

数学建模五大数据挖掘领域的经典算法
2017-05-05
数学建模五大数据挖掘领域的经典算法 1. C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率 ...

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)
2017-05-04
数据挖掘算法(logistic回归,随机森林,GBDT和xgboost) 面网易数据挖掘工程师岗位,第一次面数据挖掘的岗位,只想着能够去多准备一些,体验面这个岗位的感觉,虽然最好心有不甘告终,不过继续加油。 不过 ...

教育大数据的核心技术、应用现状与发展趋势

教育大数据的核心技术、应用现状与发展趋势
2017-05-03
教育大数据的核心技术、应用现状与发展趋势 大数据是近年来快速发展的技术领域。关于大数据的研究与应用与日俱增,并不断深入影响社会生活。购物推荐、路况分析乃至高考预测等与大众密切相关的应用,充分 ...

北京空气质量数据可视化

北京空气质量数据可视化
2017-04-10
还记得之前推送过的一篇讲大连天气数据可视化的文章吗,后来有小伙伴儿直呼不过瘾,墙裂要求来一个北京版。 小编我日夜赶工,终于出炉了北京版的空气质量数据可视化,而且相比之前大连版的有所升级: ...

统计挖掘那些事:分层抽样与交叉验证

统计挖掘那些事:分层抽样与交叉验证
2017-03-30
统计挖掘那些事:分层抽样与交叉验证 1留出法(Hold out)与分层抽样 留出法的意思就是直接将总数据D划分为两个对立集合,训练集S以及测试集T,我们有S+T=D,以及S交T等于空集; 举个简单例子说明, ...

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost
2017-03-28
简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法,随机森林算法是基于Bagging思想的机器学习算法,在Bagging方法中,主要通过对训练数据集 ...

简单易学的机器学习算法—分类回归树CART

简单易学的机器学习算法—分类回归树CART
2017-03-22
简单易学的机器学习算法—分类回归树CART 分类回归树(Classification and Regression Tree,CART)是一种典型的决策树算法,CART算法不仅可以应用于分类问题,而且可以用于回归问题。 一、树回归的概念   ...

数据挖掘十大算法之决策树详解(2)

数据挖掘十大算法之决策树详解(2)
2017-03-17
数据挖掘十大算法之决策树详解(2) ID3算法 ID3和C4.5都是由澳大利亚计算机科学家Ross Quinlan开发的决策树构建算法,其中C4.5是在ID3上发展而来的。 ID3算法的核心是在决策树各个结点上应用信息增益准 ...

数据挖掘十大算法之决策树详解(1)

数据挖掘十大算法之决策树详解(1)
2017-03-17
数据挖掘十大算法之决策树详解(1) 从分类问题开始 分类(Classification)任务就是确定对象属于哪个预定义的目标类。分类问题不仅是一个普遍存在的问题,而且是其他更加复杂的决策问题的基础,更是机器学习 ...

如何设计成功而有价值的数据可视化

如何设计成功而有价值的数据可视化
2017-03-12
如何设计成功而有价值的数据可视化 【what】什么是数据可视化? 塔夫特所说,“图形表现数据。实际上比传统的统计分析法更加精确和有启发性。”对于广大的编辑、设计师、运营分析师、大数据研究者等等都需要 ...

干货 | 基础机器学习算法

干货 | 基础机器学习算法
2017-03-10
本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。 哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机器学习的套路:组织数据->挖掘知识->预测未来。 ...

利用R语言制作出漂亮的交互数据可视化

利用R语言制作出漂亮的交互数据可视化
2017-02-21
利用R语言制作出漂亮的交互数据可视化 利用R语言也可以制作出漂亮的交互数据可视化,下面和大家分享一些常用的交互可视化的R包。 rCharts包 说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接 ...

R语言-妹子被追后的选择分析

R语言-妹子被追后的选择分析
2017-01-25
R语言-妹子被追后的选择分析 前提假设 妹子们一生中可以遇到100个追求者,追求者的优秀程度符合正态分布; 每个妹子都具备判断并比较追求者优秀程度的能力; 接受或拒绝一个追求者后永远无法后悔。 那么,问题 ...
【杭州奥点科技股份有限公司】招聘数据分析师
2017-01-18
【杭州奥点科技股份有限公司】招聘数据分析师 杭州奥点科技有限公司成立于2006年,拥有超过10年的互联网音视频开发经验。奥点云专注为网络媒体电台、电视台、在线教育、游戏直播、社交娱乐等新媒体行业提供专业的新 ...

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
2020-04-20
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析  今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析。希望这篇文章 ...

用excel完全可以代替SPSS软件

用excel完全可以代替SPSS软件
2017-01-03
用excel完全可以代替SPSS软件 市场研究界习惯使用SPSS软件进行统计计算与分析,大家都说效果非常不错。当年刚刚创业时,我们也慕名准备使用该软件。到同行处去看了一下,不仅英文多,而且与Window不兼容(当时 ...

如何用EXCEL制作成绩分析的正态分布图

如何用EXCEL制作成绩分析的正态分布图
2016-12-20
如何用EXCEL制作成绩分析的正态分布图 教育评价学是教育科学领域中的一个重要的应用性很强的分支学科。在当今世界教育领域中,教育评价、教育基础理论和教育发展被认为是三大研究范围。教育是人类有目的 ...

数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法

数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法
2016-12-14
数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描 ...

数据挖掘分类技术_数据挖掘分类

数据挖掘分类技术_数据挖掘分类
2016-12-13
数据挖掘分类技术_数据挖掘分类 1、过分拟合问题: 造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易 ...

当产品经理遇到数据分析这个槛,怎么办

当产品经理遇到数据分析这个槛,怎么办
2016-12-03
当产品经理遇到数据分析这个槛,怎么办 大数据时代的到来,对产品经理提出了更加严格的数据分析要求。一个懂数据分析的产品经理可以利用数据驱动产品设计优化,并高效提升客户体验。 那么,产品经理到底该关 ...

OK