cda

数字化人才认证

首页 > 行业图谱 >

机器学习入门:K-近邻算法

机器学习入门:K-近邻算法
2017-03-11
机器学习入门:K-近邻算法 先来一个简单的例子,我们如何来区分动作类电影与爱情类电影呢?动作片中存在很多的打斗镜头,爱情片中可能更多的是亲吻镜头,所以我们姑且通过这两种镜头的数量来预测这部电影的主题 ...

2017,要这样学数据分析

2017,要这样学数据分析
2017-03-07
2017,要这样学数据分析 视野决定了境界和能力,而所处的环境又决定了视野。好多人不知道什么是数据分析师,认为会熟练使用Excel就是数据分析师,如果你还会使用Excel中的一些高级功能如透视和函数等等,可能别 ...

python数据分析笔记—数据加载与整理

python数据分析笔记—数据加载与整理
2017-02-18
python数据分析笔记—数据加载与整理 数据加载 导入文本数据 1、导入文本格式数据(CSV)的方法: 方法一:使用pd.read_csv(),默认打开csv文件。 9、10、11行三种方式均可以导入文本 ...

揭秘丨备战CDA数据分析竞赛!

揭秘丨备战CDA数据分析竞赛!
2017-01-16
 Kaggle是一个数据分析建模的应用竞赛平台,有点类似KDD-CUP(国际知识发现和数据挖掘竞赛),企业或者研究者可以将问题背景、数据、期望指标等发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案 ...

Python数据挖掘之线性回归知识及预测糖尿病实例

Python数据挖掘之线性回归知识及预测糖尿病实例
2017-01-15
Python数据挖掘之线性回归知识及预测糖尿病实例 今天主要讲述的内容是关于一元线性回归的知识,Python实现,包括以下内容:         1.机器学习常用数据集介绍    ...

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
2020-04-20
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析  今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析。希望这篇文章 ...

Python数据挖掘之Kmeans聚类代码实现、作业及优化

Python数据挖掘之Kmeans聚类代码实现、作业及优化
2017-01-15
Python数据挖掘之Kmeans聚类代码实现、作业及优化 这篇文章直接给出上次关于Kmeans聚类的篮球远动员数据分析案例,同时介绍这次作业同学们完成的图例,最后介绍Matplotlib包绘图的优化知识。   &nbs ...

Python数据挖掘之Kmeans聚类数据分析及Anaconda介绍

Python数据挖掘之Kmeans聚类数据分析及Anaconda介绍
2017-01-15
Python数据挖掘之Kmeans聚类数据分析及Anaconda介绍   这次课程主要讲述一个关于Kmeans聚类的数据分析案例,通过这个案例让同学们简单了解大数据分析的基本流程,以及使用Python实现相关的聚类分析。 &nbs ...

大数据分析与机器学习领域Python兵器谱

大数据分析与机器学习领域Python兵器谱
2016-11-23
大数据分析与机器学习领域Python兵器谱 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第 ...
短文本主题建模方法
2016-11-22
短文本主题建模方法 1. 引言 许多数据分析应用都会涉及到从短文本中提取出潜在的主题,比如微博、短信、日志文件或者评论数据。一方面,提取出潜在的主题有助于下一步的分析,比如情感评分或者文本分类模型 ...

如何成为一名真正的数据分析师或者数据工程师

如何成为一名真正的数据分析师或者数据工程师
2016-10-16
如何成为一名真正的数据分析师或者数据工程师 一.入门:高屋建瓴 数据分析的坑很大,一开始走上这条路,就要明确基本的方向,依托于核心的思想,不然只会越走越偏,最后觉得山太高水太深,不了了之。 ...

使用sklearn优雅地进行数据挖掘

使用sklearn优雅地进行数据挖掘
2016-08-17
使用sklearn优雅地进行数据挖掘 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模 ...

如何高效地学好R语言?

如何高效地学好R语言?
2016-07-21
如何高效地学好R语言? 学R语言主要在于5点三阶段: 第一阶段有一点:基础的文件操作(read.*, write.*)、数据结构知识,认识什么是数据框(data.frame)、列表(list)、矩阵(matrix)、向量(vector),如何提取(包 ...

如何高效地学好 R?

如何高效地学好 R?
2016-07-18
R在统计和数据分析领域占据着越来越重要的作用,那么如何着手学习R呢? 学R主要在于5点三阶段: 第一阶段有一点:基础的文件操作(read.*,write.*)、数据结构知识,认识什么是数据框(data.frame)、列表(list ...

scikit-learn的线性回归模型

scikit-learn的线性回归模型
2016-05-05
scikit-learn的线性回归模型 特征选择的方法 作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。 1. 使用pandas来读取数据 Panda ...

深入对比数据科学工具箱:Python和R之争

深入对比数据科学工具箱:Python和R之争
2016-04-10
概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型 ...

一篇文章透彻解读聚类分析及案例实操(二)

一篇文章透彻解读聚类分析及案例实操(二)
2016-04-05
一篇文章透彻解读聚类分析及案例实操(二) 4  SAS聚类分析案例 1 问题背景 考虑下面案例,一个棒球管理员希望根据队员们的兴趣相似性将他们进行分组。显然,在该例子中,没有响应变量。管理 ...

Python 爬虫的工具列表

Python 爬虫的工具列表
2016-03-26
Python 爬虫的工具列表 这个列表包含与网页抓取和数据处理的Python库 网络 通用 urllib -网络库(stdlib)。 ...

 数据科学家和大数据技术人员工具包

数据科学家和大数据技术人员工具包
2016-03-17
数据科学家和大数据技术人员工具包 数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分 ...

分析引力波数据的Python包:GWPY!

分析引力波数据的Python包:GWPY!
2016-02-14
美国科学家11日宣布,他们去年9月首次探测到引力波。这一发现印证了物理学大师爱因斯坦100年前的预言。宣布这一发现的,是激光干涉引力波天文台(LIGO)的负责人。 这个机构诞生于上世纪90年代,进行 ...

OK