cda

数字化人才认证

首页 > 行业图谱 >

为什么R语言是学习数据分析的第一选择?

为什么R语言是学习数据分析的第一选择?
2017-07-14
刚开始学习数据科学的人都会面对同一个问题: 不知道该先学习哪种编程语言。 不仅仅是编程语言,像Tableau,SPSS等软件系统也是同样的情况。有越来越多的工具和编程语言,很难知道该选择哪一种。 事实是,你的时 ...

sas信用评分卡之番外哑变量的生成

sas信用评分卡之番外哑变量的生成
2017-07-06
sas信用评分卡之番外哑变量的生成 哑变量是:举一个例子,假设变量“职业”的取值分别为:工人、农民、学生、企业职员、其他,5种选项,我们可以增加4个哑变量来代替“职业”这个变量,分别为D1(1=工人/0=非工 ...

机器学习中的特征—特征选择的方法以及注意点

机器学习中的特征—特征选择的方法以及注意点
2017-07-04
机器学习中的特征—特征选择的方法以及注意点 关于机器学习中的特征我有话要说 在这次校园招聘的过程中,我学到了很多的东西,也纠正了我之前的算法至上的思想,尤其是面试百度的过程中,让我渐渐意识到 ...

R语言实现Xbar-R控制图

R语言实现Xbar-R控制图
2017-06-07
R语言实现Xbar-R控制图 Xbar-R控制图在质量管理中主要用于对计量数据进行检测,以达到控制对象质量的目的。 虽然用Excel可以轻松实现控制图的操作,不过作为R软件初学者,我试着用仅有的一点R语言知识进行了 ...
【湖南弗彗影像文化传媒有限公司】招聘数据分析师
2017-06-01
【湖南弗彗影像文化传媒有限公司】招聘数据分析师 湖南弗彗影像文化传媒有限公司是在2009年5月6日成立的有限责任公司,公司注册地址为湖南省长沙市芙蓉区车站中路21号鸿运凯旋国际5001房,法定代表人周璟,注册资本 ...

利用WEKA编写数据挖掘算法

利用WEKA编写数据挖掘算法
2017-05-16
利用WEKA编写数据挖掘算法 WEKA是由新西兰怀卡托大学开发的开源项目。WEKA是由JAVA编写的,并且限制在GNU通用公众证书的条件下发布,可以运行在所有的操作系统中。WEKA工作平台包含能处理所有标准数据挖掘问题 ...
【北京英诺威尔科技股份有限公司】招聘数据分析师
2017-05-09
【北京英诺威尔科技股份有限公司】招聘数据分析师 北京英诺威尔科技有限公司成立于2005年,是一家注册资金6000万人民币的股份制企业,坐落于北京中关村科技园区丰台园总部基地。公司致力于面向各大电信运营商及铁路 ...

数学建模五大数据挖掘领域的经典算法

数学建模五大数据挖掘领域的经典算法
2017-05-05
数学建模五大数据挖掘领域的经典算法 1. C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率 ...

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)
2017-05-04
数据挖掘算法(logistic回归,随机森林,GBDT和xgboost) 面网易数据挖掘工程师岗位,第一次面数据挖掘的岗位,只想着能够去多准备一些,体验面这个岗位的感觉,虽然最好心有不甘告终,不过继续加油。 不过 ...

教育大数据的核心技术、应用现状与发展趋势

教育大数据的核心技术、应用现状与发展趋势
2017-05-03
教育大数据的核心技术、应用现状与发展趋势 大数据是近年来快速发展的技术领域。关于大数据的研究与应用与日俱增,并不断深入影响社会生活。购物推荐、路况分析乃至高考预测等与大众密切相关的应用,充分 ...

北京空气质量数据可视化

北京空气质量数据可视化
2017-04-10
还记得之前推送过的一篇讲大连天气数据可视化的文章吗,后来有小伙伴儿直呼不过瘾,墙裂要求来一个北京版。 小编我日夜赶工,终于出炉了北京版的空气质量数据可视化,而且相比之前大连版的有所升级: ...

统计挖掘那些事:分层抽样与交叉验证

统计挖掘那些事:分层抽样与交叉验证
2017-03-30
统计挖掘那些事:分层抽样与交叉验证 1留出法(Hold out)与分层抽样 留出法的意思就是直接将总数据D划分为两个对立集合,训练集S以及测试集T,我们有S+T=D,以及S交T等于空集; 举个简单例子说明, ...

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost
2017-03-28
简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法,随机森林算法是基于Bagging思想的机器学习算法,在Bagging方法中,主要通过对训练数据集 ...

简单易学的机器学习算法—分类回归树CART

简单易学的机器学习算法—分类回归树CART
2017-03-22
简单易学的机器学习算法—分类回归树CART 分类回归树(Classification and Regression Tree,CART)是一种典型的决策树算法,CART算法不仅可以应用于分类问题,而且可以用于回归问题。 一、树回归的概念   ...

数据挖掘十大算法之决策树详解(2)

数据挖掘十大算法之决策树详解(2)
2017-03-17
数据挖掘十大算法之决策树详解(2) ID3算法 ID3和C4.5都是由澳大利亚计算机科学家Ross Quinlan开发的决策树构建算法,其中C4.5是在ID3上发展而来的。 ID3算法的核心是在决策树各个结点上应用信息增益准 ...

数据挖掘十大算法之决策树详解(1)

数据挖掘十大算法之决策树详解(1)
2017-03-17
数据挖掘十大算法之决策树详解(1) 从分类问题开始 分类(Classification)任务就是确定对象属于哪个预定义的目标类。分类问题不仅是一个普遍存在的问题,而且是其他更加复杂的决策问题的基础,更是机器学习 ...

如何设计成功而有价值的数据可视化

如何设计成功而有价值的数据可视化
2017-03-12
如何设计成功而有价值的数据可视化 【what】什么是数据可视化? 塔夫特所说,“图形表现数据。实际上比传统的统计分析法更加精确和有启发性。”对于广大的编辑、设计师、运营分析师、大数据研究者等等都需要 ...

干货 | 基础机器学习算法

干货 | 基础机器学习算法
2017-03-10
本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。 哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机器学习的套路:组织数据->挖掘知识->预测未来。 ...

利用R语言制作出漂亮的交互数据可视化

利用R语言制作出漂亮的交互数据可视化
2017-02-21
利用R语言制作出漂亮的交互数据可视化 利用R语言也可以制作出漂亮的交互数据可视化,下面和大家分享一些常用的交互可视化的R包。 rCharts包 说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接 ...

R语言-妹子被追后的选择分析

R语言-妹子被追后的选择分析
2017-01-25
R语言-妹子被追后的选择分析 前提假设 妹子们一生中可以遇到100个追求者,追求者的优秀程度符合正态分布; 每个妹子都具备判断并比较追求者优秀程度的能力; 接受或拒绝一个追求者后永远无法后悔。 那么,问题 ...

OK