cda

数字化人才认证

首页 > 行业图谱 >

我用 Python 爬取了全国 4500 个热门景点,告诉你国庆哪里去不得?

我用 Python 爬取了全国 4500 个热门景点,告诉你国庆哪里去不得?
2017-09-21
我用 Python 爬取了全国 4500 个热门景点,告诉你国庆哪里去不得? 金秋九月,丹桂飘香,在这秋高气爽,阳光灿烂的收获季节里,我们送走了一个个暑假余额耗尽哭着走向校园的孩子们,又即将迎来一年一度伟大祖 ...

10个令人相见恨晚的R语言包

10个令人相见恨晚的R语言包
2017-09-15
10个令人相见恨晚的R语言包 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 ...

用Python的pandas框架操作Excel文件中的数据教程

用Python的pandas框架操作Excel文件中的数据教程
2017-08-04
用Python的pandas框架操作Excel文件中的数据教程 本文的目的,是向您展示如何使用pandas 来执行一些常见的Excel任务。有些例子比较琐碎,但我觉得展示这些简单的东西与那些你可以在其他地方找到的复杂功能同等 ...

大数据分析如何在企业中落地?

大数据分析如何在企业中落地?
2017-07-24
一、大数据分析师和JAVA程序员有什么区别? Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快地进入了这个行业,成为了最早的大数据分析师。但IT人士的宿命就在 ...

一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)

一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重)
2017-07-17
一句python,一句R︱列表、元组、字典、数据类型、自定义模块导入(格式、去重) 先学了R语言,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。 ...

IBM数据科学与机器学习师资研修班-成都站

IBM数据科学与机器学习师资研修班-成都站
2017-07-14
欢迎参加为期三天的 IBM 数据科学与机器学习师资研修班师资研修班! 机器学习正逐步成为主流技术,在众多行业成为主要的竞争优势:无论是零售企业、安全企业、旅游度假胜地、有线电视公司,还是竞争性体 ...

针对SAS用户:Python数据分析库pandas

针对SAS用户:Python数据分析库pandas
2017-06-21
针对SAS用户:Python数据分析库pandas 这篇文章是Randy Betancourt的用于SAS用户的快速入门中的一章。Randy编写这本指南,让SAS用户熟悉Python和Python的各种科学计算工具。 本文包括的主题: 导入包 ...

R语言处理XML文件

R语言处理XML文件
2017-06-18
R语言处理XML文件 XML是分享的文件格式在万维网,内联网中的数据,和其他地方使用标准ASCII文本的文件格式。它代表着可扩展标记语言(XML)。类似于 HTML 包含标记标签。但不同于HTML标记标签描述了页面的结构,x ...

如何使用Python处理Missing Data

如何使用Python处理Missing Data
2017-06-05
如何使用Python处理Missing Data 现实世界的数据中常常包含缺失的数据。原因很多,比如观察结果没有记录,或数据损坏。处理缺失的数据很重要,因为许多机器学习算法不支持具有缺失值的数据库。 本教 ...

用Python处理数据集中的缺失值

用Python处理数据集中的缺失值
2017-05-18
用Python处理数据集中的缺失值 现实生活中的数据经常存在缺失值。产生缺失值的原因有很多,如观察资料未被记录、数据损坏等。由于很多机器学习算法不支持存在缺失值的数据集,正确处理缺失值就显得比较重要了。 ...

对自己的上网搜索记录进行爬虫是怎样一种体验

对自己的上网搜索记录进行爬虫是怎样一种体验
2017-05-11
前言 国外习惯用 Google 进行搜索,可以毫不夸张的说 Google 已经彻底地融入了日常生活。如今人们一有什么问题都习惯谷歌一下,敲敲键盘,你就能找到想要的答案。 与此同时,你的 Google 搜索记录也反映了某段时间 ...

使用Python进行线性回归

使用Python进行线性回归
2017-05-09
使用Python进行线性回归 线性回归是最简单同时也是最常用的一个统计模型。线性回归具有结果易于理解,计算量小等优点。如果一个简单的线性回归就能取得非常不错的预测效果,那么就没有必要采用复杂精深的模型了 ...

使用R写入Excel方法总结

使用R写入Excel方法总结
2017-02-27
使用R写入Excel方法总结 数据部门在和公司其他部门打交道过程中,将数据写入Excel文件经常会涉及到(从各种临时需求到日常数据报告Dashboard等等)。 通过 Rdocumentation 查询write to excel,会 ...

2016年终盘点大数据篇:跨越巅峰,迈向成熟

2016年终盘点大数据篇:跨越巅峰,迈向成熟
2017-02-19
2016年终盘点大数据篇:跨越巅峰,迈向成熟 大数据技术在2016年继续取得高速的发展,并且在大数据相关的每个细分的环节,都有不同的创新的点。让我们来看看这一年,大数据技术的一些重要进展和趋势。 大数据 ...

python数据分析笔记—数据加载与整理

python数据分析笔记—数据加载与整理
2017-02-18
python数据分析笔记—数据加载与整理 数据加载 导入文本数据 1、导入文本格式数据(CSV)的方法: 方法一:使用pd.read_csv(),默认打开csv文件。 9、10、11行三种方式均可以导入文本 ...

使用Python进行大数据分析

使用Python进行大数据分析
2017-01-31
使用Python进行大数据分析 毫不夸张地说,大数据已经成为任何商业交流中不可或缺的一部分。桌面和移动搜索向全世界的营销人员和公司以空前的规模提供着数据,并且随着物联网的到来,大量用以消费的数据还会呈指 ...

R语言XML格式数据导入与处理

R语言XML格式数据导入与处理
2017-01-25
R语言XML格式数据导入与处理 数据解析 XML是一种可扩展标记语言,它被设计用来传输和存储数据。XML是各种应用程序之间进行数据传输的最常用的工具。它与Access,Oracle和SQL Server等数据库不同,数据库提供 ...

揭秘丨备战CDA数据分析竞赛!

揭秘丨备战CDA数据分析竞赛!
2017-01-16
 Kaggle是一个数据分析建模的应用竞赛平台,有点类似KDD-CUP(国际知识发现和数据挖掘竞赛),企业或者研究者可以将问题背景、数据、期望指标等发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案 ...

Python股市数据分析(一)

Python股市数据分析(一)
2017-01-11
本篇文章是”Python股市数据分析”两部曲中的第一部分,内容基于我在犹他州立大学MATH 3900 (Data Mining)课程上的一次讲座。在这些文章中,我将介绍一些关于金融数据分析的基础知识,例如,使用pandas获取雅虎财经 ...

聚类分析基础知识总结及实战解析

聚类分析基础知识总结及实战解析
2016-11-28
聚类分析基础知识总结及实战解析 聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分 ...

OK