cda

数字化人才认证

首页 > 行业图谱 >

机器学习项目中的数据预处理与数据整理之比较

机器学习项目中的数据预处理与数据整理之比较
2017-05-10
机器学习项目中的数据预处理与数据整理之比较 要点 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。 市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的 ...
【北京初识科技有限公司】招聘数据分析师
2017-05-03
【北京初识科技有限公司】招聘数据分析师 北京初识科技有限公司是国内唯一专注研究储值卡产品和策略的科技公司,将传统的储值与最新的金融科技和共享经济相结合,帮助广大中小商户迅速建立自身的储值会员运营体系, ...

从模型选择到超参调整,六步教你如何为机器学习项目选择算法

从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...

揭秘丨备战CDA数据分析竞赛!

揭秘丨备战CDA数据分析竞赛!
2017-01-16
 Kaggle是一个数据分析建模的应用竞赛平台,有点类似KDD-CUP(国际知识发现和数据挖掘竞赛),企业或者研究者可以将问题背景、数据、期望指标等发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案 ...

从商业视角理解数据:数据科学家的思维之路

从商业视角理解数据:数据科学家的思维之路
2016-12-28
从商业视角理解数据:数据科学家的思维之路 在过去的几个月内,来自不同行业人不约而同问我能否提供一个端到端的视图,使他们了解成为一个数据科学家的思维过程。为这个问题寻找答案时,我想的不仅仅是提供一个 ...

数据挖掘如何就业

数据挖掘如何就业
2016-11-24
数据挖掘如何就业 1.数据挖掘主要是做算法还是做应用?分别都要求什么? 这个问题太笼统,基本上算法和应用是两个人来做的,可能是数据挖掘职位。做算法的比较少,也比较高级。 其实所谓做算法大多数时 ...

使用sklearn优雅地进行数据挖掘

使用sklearn优雅地进行数据挖掘
2016-08-17
使用sklearn优雅地进行数据挖掘 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模 ...

如果会用数据挖掘,对业务和用户的理解会更上层楼

如果会用数据挖掘,对业务和用户的理解会更上层楼
2016-08-07
如果会用数据挖掘,对业务和用户的理解会更上层楼 数据挖掘的特点;数据挖掘可以做哪些事情、有什么应用价值;要发挥数据的价值,你们应该怎么与数据挖掘岗协作,你们不可替代的价值在哪里。文章有点长,良心 ...

机器学习基础与实践之数据清洗!

机器学习基础与实践之数据清洗!
2016-07-04
想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实际 ...

数据挖掘在实际领域中的那些事儿

数据挖掘在实际领域中的那些事儿
2016-05-25
数据挖掘在实际领域中的那些事儿 今天非常荣幸能给大家分享在大数据挖掘方面做的一些事情。 企业中的数据挖掘 我们先来看看在企业中数据挖掘都是怎么做的,以及有着哪些问题。 图中的左边是SPSS在 ...

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林
2016-04-20
WePay机器学习反欺诈实践:Python+scikit-learn+随机森林 什么是shell selling? 虽然欺诈几乎涉及各种领域,但相对于传统的买方或卖方仅仅担心对方是否是骗子,支付平台需要担心的是交易双方。如果其中任何 ...

十个问题让你了解数据挖掘工程师

十个问题让你了解数据挖掘工程师
2016-04-15
十个问题让你了解数据挖掘工程师 对于如何学习大数据技能?大多资深数据分析师都会建议在学习书本的基础上参加竞赛,从实践中发现问题提升自己。今天跟我们分享的就是一位长期参加比赛的数据挖掘工程师,他有四 ...

以性别预测为例,谈谈数据挖掘中的分类问题

以性别预测为例,谈谈数据挖掘中的分类问题
2016-03-02
以性别预测为例,谈谈数据挖掘中的分类问题 互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘 ...

基于R语言的梯度推进算法介绍

基于R语言的梯度推进算法介绍
2015-11-14
基于R语言的梯度推进算法介绍 通常来说,我们可以从两个方面来提高一个预测模型的准确性:完善特征工程(feature engineering)或是直接使用Boosting算法。通过大量数据科学竞赛的试炼,我们可以发现人们更 ...

大数据的开放式创新:如何才能实现大数据的深发展

大数据的开放式创新:如何才能实现大数据的深发展
2015-11-09
大数据的开放式创新:如何才能实现大数据的深发展 围墙里的大数据注定成为死数据。大数据需要开放式创新,从数据的开放、共享和交易,到价值提取能力的开放,再到基础处理和分析平台的开放,让数据如同血 ...
MIT做了一个全自动大数据分析
2015-10-21
MIT做了一个全自动大数据分析 信息爆炸引爆了大数据时代的到来,前一两年大数据到达了炒作的高峰,而马云则称今后 30年 属于数据技术(DT)。但是最近一段时间大数据似乎没有那么大的动静了,这固然有技 ...

数据分析师成长之路 · CDA数据分析师科学体系

数据分析师成长之路 · CDA数据分析师科学体系
2019-01-18
基于CDA多年的数据分析教学经验以及对当下企业数据相关岗位、薪资待遇的调查研究,总结出来了一套职场“岗位模型”。最左侧是经典的CDA LEVEL 1 2 3,每个等级对应企业相关数据岗位及薪资范围。图片中部为对 ...

光“大”是不行的,开放才能实现大数据的深发展

光“大”是不行的,开放才能实现大数据的深发展
2015-04-01
光“大”是不行的,开放才能实现大数据的深发展 围墙里的大数据注定成为死数据。大数据需要开放式创新,从数据的开放、共享和交易,到价值提取能力的开放,再到基础处理和分析平台的开放,让数据如同血 ...

光“大”是不行的,开放才能实现大数据的深发展_数据分析师

光“大”是不行的,开放才能实现大数据的深发展_数据分析师
2014-12-31
光“大”是不行的,开放才能实现大数据的深发展_数据分析师 围墙里的大数据注定成为死数据。大数据需要开放式创新,从数据的开放、共享和交易,到价值提取能力的开放,再到基础处理和分析平台的开放,让 ...
分析:大数据深入发展怎样实现?
2014-11-01
       围墻里的大数据註定成为死数据。大数据需要开放式创新,从数据的开放、共享和交易,到价值提取能力的开放,再到基础处理和分析平臺的开放,让数据如同血液在数据社会的躯体中长流, ...

OK