cda

数字化人才认证

首页 > 行业图谱 >

数据科学入门丨选Python还是R

数据科学入门丨选Python还是R
2018-07-10
数据科学入门丨选Python还是R 对于想入门数据科学的新手来说,选择学Python还是R语言是一个难题,本文对两种语言进行了比较,希望能帮助你做出选择。 我是德勤的数据科学家主管,多年来我一直在使用Python和 ...

统计学笔记:箱型图以及python实践

统计学笔记:箱型图以及python实践
2020-05-11
最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析的工作。其中,大家都可能非 ...

写量化策略时常用的技巧

写量化策略时常用的技巧
2018-05-15
写量化策略时常用的技巧 1.善用panel保存数据 说明:pandas有三种数据结构,分别是Series(一维),DataFrame(二维),panel(三维) 例子:沪深300成分股所有股票[stock list]在某些特征指标如成交量、收盘 ...

利用Python进行异常值分析实例代码

利用Python进行异常值分析实例代码
2018-04-29
利用Python进行异常值分析实例代码 异常值是指样本中的个别值,也称为离群点,其数值明显偏离其余的观测值。常用检测方法3σ原则和箱型图。其中,3σ原则只适用服从正态分布的数据。在3σ原则下,异常值被定义 ...

量化分析:把Tushare数据源,规整成PyalgoTrade所需格式

量化分析:把Tushare数据源,规整成PyalgoTrade所需格式
2018-04-27
量化分析:把Tushare数据源,规整成PyalgoTrade所需格式 分析A股历史数据,首先需要确定数据来源。如果只想做日k线、周k线的技术分析,可以用PyalgoTrade直接从yahoo、google等下载数据,用不着Tushare。但是,如 ...

spark机器学习-聚类

spark机器学习-聚类
2018-04-05
spark机器学习-聚类 聚类算法是一种无监督学习任务,用于将对象分到具有高度相似性的聚类中,聚类算法的思想简单的说就是物以类聚的思想,相同性质的点在空间中表现的较为紧密和接近,主要用于数据探索与异常 ...

教你用Python实现简单监督学习算法

教你用Python实现简单监督学习算法
2018-04-05
教你用Python实现简单监督学习算法 监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。 这篇监督学习教程 ...

数据挖掘实战:带你做客户价值分析(附代码)

数据挖掘实战:带你做客户价值分析(附代码)
2018-03-27
数据挖掘实战:带你做客户价值分析(附代码) 背景与挖掘目标 1. 背景     航空公司业务竞争激烈,从产品中心转化为客户中心     针对不同类型客户,进行精准营销,实现利润最大 ...

数据预处理--数据降维

数据预处理--数据降维
2018-03-01
数据预处理--数据降维 数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映 ...

Python股票历史数据的获取

Python股票历史数据的获取
2018-02-20
Python股票历史数据的获取 获取股票数据的接口很多,免费的接口有新浪、网易、雅虎的API接口,收费的就是证券公司及相应的公司提供的接口。 收费试用的接口一般提供的数据只是最近一年或三年的,限制比较多, ...

R语言XML文件

R语言XML文件
2018-02-20
R语言XML文件 XML是万维网上使用标准ASCII文本,内部网和其他地方共享文件格式和数据的文件格式。 它代表可扩展标记语言(XML)。 与HTML类似,它包含标记标签。但与标记标签描述页面结构的HTML不同,标记标签描 ...

当我用python爬了公司BD王同事的微信好友...

当我用python爬了公司BD王同事的微信好友...
2022-01-20
当我用python爬了公司BD王同事的微信好友... 某日,BD王同事找我聊天,聊着聊着就抱怨起来,这一年跑市场跑太猛了,工作微信的好友加到了5000人上限,只能换个双微信的手机了,但是这个X刚买没多久啊......5 ...

Python读csv文件去掉一列后再写入新的文件实例

Python读csv文件去掉一列后再写入新的文件实例
2018-01-28
Python读csv文件去掉一列后再写入新的文件实例 下面小编就为大家分享一篇Python读csv文件去掉一列后再写入新的文件实例,具有很的参考价值,希望对大家有所帮助。 用了两种方式解决该问题,都是网上现有的解 ...

数据工程师常用的几个小工具(附python源代码)

数据工程师常用的几个小工具(附python源代码)
2018-01-12
数据工程师常用的几个小工具(附python源代码) 作为数据工程师或者数据分析师,经常会跟各种数据打交道,其中,获取数据这一关是无法避免的,下面,我就将自己时常工作中用到的数据连接配置模型分享出来,供大 ...

Python数据分析常用函数笔记

Python数据分析常用函数笔记
2018-01-10
Python数据分析常用函数笔记 1、生成随机数列表 import numpy as np array = np.random.permutation(20) 结果: array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19]) 2、合并两个p ...

数据分析行业薪资的秘密,你想知道的都在这里(二)

数据分析行业薪资的秘密,你想知道的都在这里(二)
2018-01-03
数据分析行业薪资的秘密,你想知道的都在这里(二) 接上篇:数据分析行业薪资的秘密,你想知道的都在这里(1) 第二部分:职位信息清洗及数据提取 数据分析师的收入怎么样?哪些因素对于数据分析的薪资影响 ...

数据分析行业薪资的秘密,你想知道的都在这里(一)

数据分析行业薪资的秘密,你想知道的都在这里(一)
2018-01-03
数据分析行业薪资的秘密,你想知道的都在这里 第一部分,数据分析职位信息抓取 数据分析师的收入怎么样?哪些因素对于数据分析的薪资影响最大?哪些行业对数据分析人才的需求量最高?我想跳槽,应该选择大公司 ...

使用python和tableau对数据进行抓取及可视化

使用python和tableau对数据进行抓取及可视化
2017-10-15
使用python和tableau对数据进行抓取及可视化 本篇文章介绍使用python抓取贷款及理财平台的数据,并将数据拼接和汇总。最终通过tableau进行可视化。与之前的python爬虫文章 不同之处在于之前是一次性抓取 ...

建立数据场的七大技能

建立数据场的七大技能
2017-10-12
建立数据场的七大技能 成为数据极客,建立自己的数据场需要哪些技能呢?遇到普通的数据,通过SQL做分析。如果数据量比较大,可以使用Hadoop等大数据框架处理。在深入挖掘上,可用Python或者R语言进行编程。 0 ...

python读取oracle函数返回值

python读取oracle函数返回值
2017-09-25
python读取oracle函数返回值 这篇文章主要介绍了python读取oracle函数返回值的相关资料,感兴趣的小伙伴们可以参考一下 在oracle中创建一个函数,本来是想返回一个index table的,没有成功。想到文本也可以 ...

OK