首页 > 行业图谱 >
- 数据科学入门丨选Python还是R
- 2018-07-10
-
数据科学入门丨选Python还是R
对于想入门数据科学的新手来说,选择学Python还是R语言是一个难题,本文对两种语言进行了比较,希望能帮助你做出选择。
我是德勤的数据科学家主管,多年来我一直在使用Python和 ...
- 统计学笔记:箱型图以及python实践
- 2020-05-11
-
最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析的工作。其中,大家都可能非 ...
- 写量化策略时常用的技巧
- 2018-05-15
-
写量化策略时常用的技巧
1.善用panel保存数据
说明:pandas有三种数据结构,分别是Series(一维),DataFrame(二维),panel(三维)
例子:沪深300成分股所有股票[stock list]在某些特征指标如成交量、收盘 ...
- 利用Python进行异常值分析实例代码
- 2018-04-29
-
利用Python进行异常值分析实例代码
异常值是指样本中的个别值,也称为离群点,其数值明显偏离其余的观测值。常用检测方法3σ原则和箱型图。其中,3σ原则只适用服从正态分布的数据。在3σ原则下,异常值被定义 ...
- 量化分析:把Tushare数据源,规整成PyalgoTrade所需格式
- 2018-04-27
-
量化分析:把Tushare数据源,规整成PyalgoTrade所需格式
分析A股历史数据,首先需要确定数据来源。如果只想做日k线、周k线的技术分析,可以用PyalgoTrade直接从yahoo、google等下载数据,用不着Tushare。但是,如 ...
- spark机器学习-聚类
- 2018-04-05
-
spark机器学习-聚类
聚类算法是一种无监督学习任务,用于将对象分到具有高度相似性的聚类中,聚类算法的思想简单的说就是物以类聚的思想,相同性质的点在空间中表现的较为紧密和接近,主要用于数据探索与异常 ...
- 教你用Python实现简单监督学习算法
- 2018-04-05
-
教你用Python实现简单监督学习算法
监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。
这篇监督学习教程 ...
- 数据挖掘实战:带你做客户价值分析(附代码)
- 2018-03-27
-
数据挖掘实战:带你做客户价值分析(附代码)
背景与挖掘目标
1. 背景
航空公司业务竞争激烈,从产品中心转化为客户中心
针对不同类型客户,进行精准营销,实现利润最大 ...
- 数据预处理--数据降维
- 2018-03-01
-
数据预处理--数据降维
数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。
机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映 ...
- Python股票历史数据的获取
- 2018-02-20
-
Python股票历史数据的获取
获取股票数据的接口很多,免费的接口有新浪、网易、雅虎的API接口,收费的就是证券公司及相应的公司提供的接口。
收费试用的接口一般提供的数据只是最近一年或三年的,限制比较多, ...
- R语言XML文件
- 2018-02-20
-
R语言XML文件
XML是万维网上使用标准ASCII文本,内部网和其他地方共享文件格式和数据的文件格式。 它代表可扩展标记语言(XML)。 与HTML类似,它包含标记标签。但与标记标签描述页面结构的HTML不同,标记标签描 ...
- 当我用python爬了公司BD王同事的微信好友...
- 2022-01-20
-
当我用python爬了公司BD王同事的微信好友...
某日,BD王同事找我聊天,聊着聊着就抱怨起来,这一年跑市场跑太猛了,工作微信的好友加到了5000人上限,只能换个双微信的手机了,但是这个X刚买没多久啊......5 ...
- Python读csv文件去掉一列后再写入新的文件实例
- 2018-01-28
-
Python读csv文件去掉一列后再写入新的文件实例
下面小编就为大家分享一篇Python读csv文件去掉一列后再写入新的文件实例,具有很的参考价值,希望对大家有所帮助。
用了两种方式解决该问题,都是网上现有的解 ...
- 数据工程师常用的几个小工具(附python源代码)
- 2018-01-12
-
数据工程师常用的几个小工具(附python源代码)
作为数据工程师或者数据分析师,经常会跟各种数据打交道,其中,获取数据这一关是无法避免的,下面,我就将自己时常工作中用到的数据连接配置模型分享出来,供大 ...
- Python数据分析常用函数笔记
- 2018-01-10
-
Python数据分析常用函数笔记
1、生成随机数列表
import numpy as np
array = np.random.permutation(20)
结果:
array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19])
2、合并两个p ...
- 数据分析行业薪资的秘密,你想知道的都在这里(二)
- 2018-01-03
-
数据分析行业薪资的秘密,你想知道的都在这里(二)
接上篇:数据分析行业薪资的秘密,你想知道的都在这里(1)
第二部分:职位信息清洗及数据提取
数据分析师的收入怎么样?哪些因素对于数据分析的薪资影响 ...
- 数据分析行业薪资的秘密,你想知道的都在这里(一)
- 2018-01-03
-
数据分析行业薪资的秘密,你想知道的都在这里
第一部分,数据分析职位信息抓取
数据分析师的收入怎么样?哪些因素对于数据分析的薪资影响最大?哪些行业对数据分析人才的需求量最高?我想跳槽,应该选择大公司 ...
- 使用python和tableau对数据进行抓取及可视化
- 2017-10-15
-
使用python和tableau对数据进行抓取及可视化
本篇文章介绍使用python抓取贷款及理财平台的数据,并将数据拼接和汇总。最终通过tableau进行可视化。与之前的python爬虫文章 不同之处在于之前是一次性抓取 ...
- 建立数据场的七大技能
- 2017-10-12
-
建立数据场的七大技能
成为数据极客,建立自己的数据场需要哪些技能呢?遇到普通的数据,通过SQL做分析。如果数据量比较大,可以使用Hadoop等大数据框架处理。在深入挖掘上,可用Python或者R语言进行编程。
0 ...
- python读取oracle函数返回值
- 2017-09-25
-
python读取oracle函数返回值
这篇文章主要介绍了python读取oracle函数返回值的相关资料,感兴趣的小伙伴们可以参考一下
在oracle中创建一个函数,本来是想返回一个index table的,没有成功。想到文本也可以 ...