cda

数字化人才认证

首页 > 行业图谱 >

pandas也能修改样式?快速给你的数据换个Style!

pandas也能修改样式?快速给你的数据换个Style!
2020-07-14
Pandas是一款很强大的Python库,具有很多方便的功能,今天小编就给大家分享用Pandas修改样式。 以下内容转载于早起Python微信公众号。 作者:刘早起 文章来源:早起Python 前言 在之前的很多文章中 ...

带你用python解读高考数据:全国哪里的高校最多?什么专业最热门?

带你用python解读高考数据:全国哪里的高校最多?什么专业最热门?
2020-07-13
CDA数据分析师 出品 作者:Mika 数据:真达 后期:泽龙 【导读】 今天我们用数据来聊一聊高考。Python技术分析请看第二部分。 Show me data,用数据说话 今天我们聊一聊 高考 高考是 ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

python数据挖掘常用工具有哪几种?

python数据挖掘常用工具有哪几种?
2020-07-10
python有强大的第三方库,广泛用于数据分析,数据挖掘、机器学习等领域,下面小编整理了python数据挖掘的一些常用库,希望对各位小伙伴学习python数据挖掘有所帮助。 1. Numpy 能够提供数组支持,进行 ...

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?
2020-07-07
CDA数据分析师 出品 作者:泽龙、Mika 数据:真达 后期:泽龙 【导读】 CBA重启开赛,辽宁为什么从冠军队变成鱼腩队?是侄子坑叔,还是亚洲第一控卫变身综艺咖,本期我们用全面的数据证明到底 ...

pandas缺失值的填补方法——fillna

pandas缺失值的填补方法——fillna
2020-07-06
在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介 ...
pandas模块的数据结构有哪几种?
2020-07-06
pandas 是 Python 的外部模块,基于NumPy ,是为了解决数据分析任务而创建的,对数据挖掘前期数据的处理工作十分有用。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,而且 纳入了大量库和一些标 ...

对比python字符串函数,学习pandas的str矢量化字符串函数

对比python字符串函数,学习pandas的str矢量化字符串函数
2020-06-30
文章来源:数据分析与统计学之美 作者:黄伟呢 1.概述 python字符串应该是python里面最重要的数据类型了,因此学会怎么处理各种各样的字符串,显得尤为重要。 我们不仅要学会怎么处理单个字符串, ...

分析20万条弹幕告诉你,8.9分的高分剧《隐秘的角落》到底好看在哪儿?

分析20万条弹幕告诉你,8.9分的高分剧《隐秘的角落》到底好看在哪儿?
2020-06-30
最近这部《隐秘的角落》彻底火了,目前在豆瓣高达8.9分,有45万余人进行了评论。 一时间剧中张东升那句「爬山」、「你说我还有机会吗」 承包了6月份的梗。各种表情包和段子齐飞。 ...

9万条弹幕告诉你,《乘风破浪的姐姐》里谁才是真正的C位?

9万条弹幕告诉你,《乘风破浪的姐姐》里谁才是真正的C位?
2020-06-23
如果说最近最热门的综艺,那《乘风破浪的姐姐》(下文简称《姐姐》)可谓实至名归。30位出道多年的姐姐辈女艺人,一个个风格各异、个性鲜明。她们将通过合宿生活与舞台竞演,最终选出5位组成逆龄女团。 《乘 ...

线上服务器崩溃,线下门店破万,社交新宠「剧本杀」是如何迅速爆火的?

线上服务器崩溃,线下门店破万,社交新宠「剧本杀」是如何迅速爆火的?
2020-06-20
【导语】:今天我们来聊聊最近的社交游戏新宠--剧本杀,Python技术部分请看第三部分。 Show me data,用数据说话 今天我们聊一聊 剧本杀 如果问,线下聚会可以玩儿什么?狼人杀?密室逃脱? nonono,说 ...

pandas数据结构:Series

pandas数据结构:Series
2020-06-16
pandas有Series和DataFrame两种数据结构,我们之前已经讲过了DataFrame,接下来给大家介绍下另一种数据结构Series。 什么是Series? # 自定义Series索引 arr = np.random.rand(5) s = pd.Series(arr, ind ...

百闻不如一练:随机森林等可视化调试模型超参数

百闻不如一练:随机森林等可视化调试模型超参数
2020-06-10
以下使用scikit-learn中数据集进行分享。 如果选用随机森林作为最终的模型,那么找出它的最佳参数可能有1000多种组合的可能,你可以使用使用穷尽的网格搜索(Exhaustive Grid Seaarch)方法,但时间成本将会很 ...

加快python算法的四个方法:Dask篇

加快python算法的四个方法:Dask篇
2020-06-08
CDA数据分析师 出品 相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下python的计算时间,减少大家在算法上的等待 ...

加快python算法的四个方法:数据并行化篇

加快python算法的四个方法:数据并行化篇
2020-06-09
CDA数据分析师 出品 相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待 ...

pandas数据处理:常用却不甚了解的函数,pd.read_excel()

pandas数据处理:常用却不甚了解的函数,pd.read_excel()
2020-06-01
人们经常用pandas处理表格型数据,时常需要读入excel表格数据,很多人一般都是直接这么用:pd.read_excel(“文件路径文件名”),再多一点的设置可能是转义一下路径中的斜杠,一旦原始的excel表不是很规整,这 ...

你了解matplotlib吗?多类别条形图篇

你了解matplotlib吗?多类别条形图篇
2020-05-29
这篇文章来探索下多类别条形图比如各学校包含语文、数学、英语三科成绩的条形图怎样绘制。在绘图之前,先来复习一下条形图函数中主要参数的含义: x控制的是每个条在x轴方向上的位置; height控制的是 ...

Kmeans优化算法:二分K-means聚类算法

Kmeans优化算法:二分K-means聚类算法
2020-05-29
算法的理解 Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢,就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代 ...

使用python来绘制漂亮的图表:pandas篇!

使用python来绘制漂亮的图表:pandas篇!
2020-05-27
使用Python绘制数据,可以使用三种不同方式,它们分别是pandas,Seaborn和Plotly。 我们将通过利用《 2019年世界幸福报告》中的数据来做到这一点。我用Gapminder和Wikipedia的信息丰富了《世界幸福报告》数据,以便 ...

超详细教程 | pandas合并之append和concat

超详细教程 | pandas合并之append和concat
2020-05-27
本篇文章主要介绍了pandas中对series和dataframe对象进行连接的方法:pd.append()和pd.concat(),文中通过示例代码对这两种方法进行了详细的介绍,希望能对各位python小白的学习有所帮助。 一、df.append(d ...

OK