cda

数字化人才认证

首页 > 行业图谱 >

秒懂!图解四个实用的pandas函数!

秒懂!图解四个实用的pandas函数!
2020-10-28
作者:Baijayanta Roy 来源:towardsdatascience 编译&内容补充:早起Python 在用python进行机器学习或者日常的数据处理中,pandas是最常用的Python库之一,熟练掌握pandas是每一个数据科学家的必备 ...

6种数据格式对比,用Jupyter+pandas高效数据分析

6种数据格式对比,用Jupyter+pandas高效数据分析
2020-10-27
编译:刘早起(有删改) 来源:towardsdatascience、GitHub等 在使用python进行数据分析时,Jupyter Notebook是一个非常强力的工具,在数据集不是很大的情况下,我们可以使用pandas轻松对txt或csv等纯文 ...

分析5万多场英雄联盟比赛,教你如何轻松用python预测胜负

分析5万多场英雄联盟比赛,教你如何轻松用python预测胜负
2020-10-27
 CDA数据分析师 出品   作者:真达、Mika 数据:真达   后期:Mika 【导读】 今天教大家用Python预测英雄联盟比赛胜负。Show me data,用数据说话!今天我们聊一聊 python预测LOL胜负。 ...

用python转换PDF/Word/Excel/PPT等!

用python转换PDF/Word/Excel/PPT等!
2020-10-23
作者:刘早起 来源:早起Python 大家好,又到了python办公自动化专题。今天讲的是各位一定会接触到的PDF转换,关于各种格式的文件转换为PDF有很多第三方工具与网站可以实现,但是使用Python的好处不仅可 ...

python办公自动化|批量处理文件,一学就会

python办公自动化|批量处理文件,一学就会
2020-10-15
作者:刘早起 来源:早起Python 大家好,又到了python办公自动化专题。要说在工作中最让人头疼的就是用同样的方式处理一堆文件夹中文件,这并不难,但就是繁。所以在遇到机械式的操作时一定 ...

豆瓣9.2!17万条弹幕告诉你《沉默的真相》凭什么高口碑!

豆瓣9.2!17万条弹幕告诉你《沉默的真相》凭什么高口碑!
2020-09-27
 CDA数据分析师 出品   作者:Mika 数据:真达   【导读】今天教大家用Python分析《沉默的真相》的17万条弹幕。距离上一部国产良心剧《隐秘的角落》刷屏还不到2个月,“秃 ...

用python分析《世界幸福指数报告》后我们发现…

用python分析《世界幸福指数报告》后我们发现…
2020-09-21
CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 今天教大家用python分析《世界幸福指数报告》。《世界幸福指数报告》是对全球幸福状况的一次具有里程碑意义的 ...

实例 | 教你用python写一个电信客户流失预测模型

实例 | 教你用python写一个电信客户流失预测模型
2020-09-15
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 今天教大家如何用python写一个电信用户流失预测模型。之前我们用Python写了员工流失预测模型 ...
基于Spark的机器学习经验
2018-07-19
基于Spark的机器学习经验 如何基于spark做机器学习 Spark发展到1.5版本,算是全平台了,实时批计算,批处理,算法库,SQL,hadoop能做的,基本他都能做,而且做的比Hadoop好。 当然,这里我要提及的是,S ...

基于随机梯度下降的矩阵分解推荐算法

基于随机梯度下降的矩阵分解推荐算法
2018-03-24
基于随机梯度下降的矩阵分解推荐算法 SVD是矩阵分解常用的方法,其原理为:矩阵M可以写成矩阵A、B与C相乘得到,而B可以与A或者C合并,就变成了两个元素M1与M2的矩阵相乘可以得到M。 矩阵分解推荐的思想就是基于 ...

Python实现的随机森林算法与简单总结

Python实现的随机森林算法与简单总结
2018-02-15
Python实现的随机森林算法与简单总结 本文实例讲述了Python实现的随机森林算法。分享给大家供大家参考,具体如下: 随机森林是数据挖掘中非常常用的分类预测算法,以分类或回归的决策树为基分类器。算法 ...

使用Python连接MySQL数据库

使用Python连接MySQL数据库
2018-01-10
使用Python连接MySQL数据库 本篇文章使用python中的pymysql库连接MySQL数据库,并完成建表,数据写入和查询的过程。为了保证内容的完整性,我们将内容分为两个 阶段,第一阶段简单介绍数据的爬取过程。看过之 ...

用Python的pandas框架操作Excel文件中的数据教程

用Python的pandas框架操作Excel文件中的数据教程
2018-01-04
用Python的pandas框架操作Excel文件中的数据教程 本文的目的,是向您展示如何使用pandas 来执行一些常见的Excel任务。有些例子比较琐碎,但我觉得展示这些简单的东西与那些你可以在其他地方找到的复杂功能同等 ...

缺失数据处理-插值法

缺失数据处理-插值法
2017-12-04
缺失数据处理-插值法 在数据挖掘中,原始海量的数据中存在着大量不完整、不一致、有异常、偏离点的数据。这些问题数据轻则影响数据挖掘执行效率,重则影响执行结果。因此数据预处理工作必不可少,而其中常见工 ...
数据探索之缺失值处理及代码实现
2017-11-30
数据探索之缺失值处理及代码实现 在数据挖掘中,前期数据预处理,会涉及到很多缺失值的处理问题。 现以python代码实现为例,看如何具体处理的。 所需python包 from pandas import Series, DataFrame import pan ...

箱形图以及python实践

箱形图以及python实践
2017-10-25
箱形图以及python实践 最近在接触kaggle的竞赛示例,练习了一下,感觉受益匪浅。同时,心中也有个问题。拿到数据之后第一件事是什么?分析数据的情况?怎么分析?分析之后如何去处理数据呢?等等一些数据分析 ...
Python数据分析之真实IP请求Pandas详解
2017-08-04
Python数据分析之真实IP请求Pandas详解 这篇文章主要给大家介绍了Python数据分析之真实IP请求Pandas,文中通过示例嗲吗给大家介绍的很详细,相信对大家的学习或者理解具有一定的参考借鉴价值.pandas 是基于 Num ...
python绘图:matplotlib和pandas的应用
2017-07-01
python绘图:matplotlib和pandas的应用  在进行数据分析时,绘图是必不可少的模式探索方式。用Python进行数据分析时,matplotlib和pandas是最常用到的两个库。 1、matplotlib库的应用 准备工作如下:打开i ...

R语言天气可视化应用

R语言天气可视化应用
2017-05-07
R语言天气可视化应用 在很多人看来,R语言还只是个玩具,完全不具备企业级应用的能力。说这些话的人,根本就不了解R语言,更不清楚如何做企业级应用开发。从我最早接触R语言时,就把R做为可视化引擎嵌入到了晒 ...

使用Python分析纽约出租车搭乘数据

使用Python分析纽约出租车搭乘数据
2017-03-27
使用Python分析纽约出租车搭乘数据 在纽约,出租车分为两类:黄色和绿色。黄色出租(Yellow TAXI)车可以在纽约五大区(布朗克斯区、布鲁克林区、曼哈顿、皇后区、斯塔滕岛)内任何地点搭载乘客。绿色出租车(Gree ...

OK