cda

数字化人才认证

首页 > 行业图谱 >

大数据分析与机器学习领域Python兵器谱

大数据分析与机器学习领域Python兵器谱
2016-11-23
大数据分析与机器学习领域Python兵器谱 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第 ...

Python读取外部数据文件

Python读取外部数据文件
2016-09-21
不论是数据分析,数据可视化,还是数据挖掘,一切的一切全都是以数据作为最基础的元素。利用Python进行数据分析,同样最重要的一步就是如何将数据导入到Python中,然后才可以实现后面的数据分析、数据可视化、数据挖 ...

提升R代码运算效率的11个实用方法

提升R代码运算效率的11个实用方法
2016-09-15
提升R代码运算效率的11个实用方法 众所周知,当我们利用R语言处理大型数据集时,for 循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍 ...

如何高效地学好R语言?

如何高效地学好R语言?
2016-07-21
如何高效地学好R语言? 学R语言主要在于5点三阶段: 第一阶段有一点:基础的文件操作(read.*, write.*)、数据结构知识,认识什么是数据框(data.frame)、列表(list)、矩阵(matrix)、向量(vector),如何提取(包 ...

机器学习基础与实践之数据清洗!

机器学习基础与实践之数据清洗!
2016-07-04
想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实际 ...

工具 | Python数据分析学习指南揭秘

工具 | Python数据分析学习指南揭秘
2016-05-27
摘要:灵蛇出现,必有异像,Python最热的领域,估计非数据分析、挖掘领域莫属了。以Scikit-Learn为代表的数据分析领域,从这里开始,便是Python的天下;一边操作实例,一边阅读文档,再辅助以相关的理论基础 ...

scikit-learn的线性回归模型

scikit-learn的线性回归模型
2016-05-05
scikit-learn的线性回归模型 特征选择的方法 作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。 1. 使用pandas来读取数据 Panda ...
大数据工作职位所需的数据场技能包
2016-03-29
摘要:数据分析师除了报表统计外,还需要对数据的有很强的解读能力。电商中的个性推荐技术,商业与银行中的欺骗检测,智能手机中语音识别等等技术,让我们浑身便散发出大数据与机器学习的各种场信息,给人以满满的 ...

 数据科学家和大数据技术人员工具包

数据科学家和大数据技术人员工具包
2016-03-17
数据科学家和大数据技术人员工具包 数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分 ...

Spark 2015年回顾:四个大版本更迭、数以百计的改进

Spark 2015年回顾:四个大版本更迭、数以百计的改进
2016-02-01
原文 | Spark 2015 Year In Review 翻译 | 牛亚真 来自 | CSDN   Apache Spark在2015年得到迅猛发展,开发节奏比以前任何时候都快,在 ...

机器学习算法一览

机器学习算法一览
2016-01-18
文 | 寒小阳 来源  | CSDN博客 引言 提起笔来写这篇博客,突然有点愧疚和尴尬。愧疚的是,工作杂事多,加之懒癌严重,导致这个系列一直没有更新,向关注该系列的同学们道个 ...

大数据盘点之Spark篇

大数据盘点之Spark篇
2016-01-13
文 | 谭政 来源 | 炼数成金 作者简介 谭政,Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。专注于大数据存储和处理,对 Hadoop、HBase 以及 Spark 等 ...

入门必学!在Python中利用Pandas库处理大数据

入门必学!在Python中利用Pandas库处理大数据
2015-12-09
来源 | 脚本之家 在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。 ...

八大工具,透析Python数据生态圈最新趋势!

八大工具,透析Python数据生态圈最新趋势!
2015-08-31
文 | 刘旭坤 来自数盟 我们前一阵子参加了在旧金山举办的Dato数据科学峰会。来自业界和学界的千余名数据科学研究人员在大会上对数据科学、机器学习和预测应用方面的最新发展进行了交流和探讨。 ...
用于大数据的嵌入式分析和统计
2015-06-13
用于大数据的嵌入式分析和统计 用于大数据[注]的嵌入式分析和统计已经成为了业内一个重要的主题。随着数据量的不断增长,我们需要软件工程师对数据分析提供支持,并对数据进行一些统计计算。本文概要地介 ...

OK