cda

数字化人才认证

首页 > 行业图谱 >

sas字符变量基于iv值的最优分类

sas字符变量基于iv值的最优分类
2017-03-27
sas字符变量基于iv值的最优分类 1.IV的用途 IV的全称是Information Value,中文意思是信息价值,或者信息量。 我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如 ...

如何快速搭建一篇数据化运营的大纲?

如何快速搭建一篇数据化运营的大纲?
2017-03-23
于是我希望,在七周成为数据分析师的系列后,把数据化运营作为第二个系列来完成。每次写文章,对自己也是一种总结和提升。 下面是一份「简略」的大纲,更恰当地说是草稿。当不久的将来开始正式写 ...

简单易学的机器学习算法—分类回归树CART

简单易学的机器学习算法—分类回归树CART
2017-03-22
简单易学的机器学习算法—分类回归树CART 分类回归树(Classification and Regression Tree,CART)是一种典型的决策树算法,CART算法不仅可以应用于分类问题,而且可以用于回归问题。 一、树回归的概念   ...

从曲线拟合问题窥视机器学习中的相关概念

从曲线拟合问题窥视机器学习中的相关概念
2017-03-20
从曲线拟合问题窥视机器学习中的相关概念 一直徘徊在机器学习的边缘未敢轻易造次并畏惧其基本原理思想,从每一本厚厚的参考资料中都可以看出机器学习是一门跨越概率论、决策论、信息论以及最优化的学科的综合学 ...

数据挖掘十大算法之Apriori详解

数据挖掘十大算法之Apriori详解
2017-03-17
数据挖掘十大算法之Apriori详解 有时候,人们会对机器学习与数据挖掘这两个名词感到困惑。如果你翻开一本冠以机器学习之名的教科书,再同时翻开一本名叫数据挖掘的教材,你会发现二者之间有相当多重合的内容。 ...

数据挖掘十大算法之CART详解

数据挖掘十大算法之CART详解
2017-03-16
数据挖掘十大算法之CART详解 CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将 ...

机器学习中特征选择概述

机器学习中特征选择概述
2017-03-11
机器学习中特征选择概述 1. 背景 1.1 问题 在机器学习的实际应用中,特征数量可能较多,其中可能存在不相关的特征,特征之间也可能存在相关性,容易导致如下的后果:  (1) 特征个数越多,分析特征 ...

干货 | 基础机器学习算法

干货 | 基础机器学习算法
2017-03-10
本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。 哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机器学习的套路:组织数据->挖掘知识->预测未来。 ...
【广州聚房宝网络科技股份有限公司】招聘数据分析师
2017-03-07
【广州聚房宝网络科技股份有限公司】招聘数据分析师 广州聚房宝网络科技股份有限公司(简称:聚房宝)成立于2011年,是一家致力于打造居住新生态的智慧服务平台公司;聚房宝秉承“让居住更美好”的理念,为中国消费 ...

数据科学家的66个工作面试问题

数据科学家的66个工作面试问题
2017-03-06
数据科学家的66个工作面试问题 我们现在有91个问题。我们还添加了50个新的人  在这里,并开始提供这些问题的答案  在这里。这些都是开放式问题,以评估一个高级职位的高级候选人的技术水平知识,例如 ...

浅谈机器学习在市场营销中的应用

浅谈机器学习在市场营销中的应用
2017-03-06
目前,在线展示广告越来越流行。在线展示广告的目的是获取更多的潜在客户,吸引客户购买商品。在线展示广告的一个基本要求就是通过广告获取用户所需费用要小于用户购买商品所耗费用,进而使得通过广告吸引来 ...

R语言中的缺失值处理

R语言中的缺失值处理
2017-02-27
R语言中的缺失值处理 在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2017-02-26
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户 ...

R语言炫技必备基本功

R语言炫技必备基本功
2017-02-20
R语言炫技必备基本功 R语言主要用于统计分析和绘图,可以理解为是一种数学计算软件,可编程,有很多有用的函数库和数据集,它强大的作图工具是做数据分析的好帮手,在高手如云的大数据江湖中,不炫个技都不敢说 ...

电商社交数据在大数据风控的应用实践

电商社交数据在大数据风控的应用实践
2017-02-17
电商社交数据在大数据风控的应用实践 随着普惠金融业务的深入,以及消费金融业务竞争的白热化,针对信用白户的风控显得尤为重要。如何面向信用白户进行快速有效的信用评级,卧龙大数据根据自己的实践经验,就电 ...

R语言初学者必须要知道的事儿

R语言初学者必须要知道的事儿
2017-02-16
R语言初学者必须要知道的事儿 2017年1月24日晚8点半,乐逗游戏挖掘团队负责人、资深R语言用户谢佳标带来了主题为“数据分析利器:R语言快速入门”的Chat交流。以下是主持人孙莫默整理的实录,记录了谢佳标与读 ...
【成都轻松益家电子商务有限公司】招聘数据分析师
2017-01-26
【成都轻松益家电子商务有限公司】招聘数据分析师 成都轻松益家电子商务有限公司是一家初创B2B电商公司,致力于利用科技的力量和自身独有的渠道优势,通过电子商务平台连接制造商和零售商,优化消费品的供应链,降低 ...
【东信和平科技股份有限公司】招聘数据分析师
2017-01-20
【东信和平科技股份有限公司】招聘数据分析师 信和平科技股份有限公司(以下简称“东信和平”或“公司”)是专业从事智能卡产品及其相关设备研发、生产、销售的国家火炬计划重点高新技术企业,成立于1998年,注册资本2 ...

如果我们心存偏见,还能做好数据分析吗

如果我们心存偏见,还能做好数据分析吗
2017-01-16
如果我们心存偏见,还能做好数据分析吗 马克·安德森(Marc Andreessen)的一句名言:“软件正在吞噬整个世界。”各行各业发现,分析对保持竞争力至关重要。政府则发现,分析对履行政府义务至关重要。 我们可 ...

OK