cda

数字化人才认证

首页 > 行业图谱 >

手把手教你用Pandas库对淘宝原始数据进行数据处理和分词处理

手把手教你用Pandas库对淘宝原始数据进行数据处理和分词处理
2021-08-25
来源:Python爬虫与数据挖掘 作者: Python进阶者 大家好,我是Python进阶者。 一、前言 大家好,我是Python进阶者,上个礼拜的时候,我的Python交流群里有个名叫程序的大佬,头像是绿色菜狗的那 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

Pandas中的宝藏函数-map

Pandas中的宝藏函数-map
2021-07-28
来源:AI入门学习 作者:小伍哥 pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史
2021-07-19
CDA数据分析师 出品 作者:Mika 【导读】 今天带大家用数据可视化解读120 年奥运变迁史。 几经波折,东京奥运会终于即将迎来开幕的时刻,距离7月23日东京奥运会开幕只有不到一周的时间了。 这 ...

时间序列,从开始到结束日期自增扩充数据

时间序列,从开始到结束日期自增扩充数据
2021-07-15
来源:数据STUDIO 作者:云朵君 糖尿病是全球最常见的慢性非传染性疾病之一。流行病学调查显示,我国约11%的成年人患有糖尿病,而在住院患者中这一比例更高。 住院期间将长期服用药物,医院 ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

一个企业级数据挖掘实战项目,教育数据挖掘

一个企业级数据挖掘实战项目,教育数据挖掘
2021-07-06
来源:数据STUDIO 作者:云朵君 导读:大家好,我是云朵君!自从分享了一篇能够写在简历里的企业级数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了 ...

高考旅游火热升温|数据显示,他们都想去这里

高考旅游火热升温|数据显示,他们都想去这里
2021-07-01
来源:数据STUDIO 作者:云朵君 大家好,我是云朵君。 紧张、激烈的高考大战已经告一段落了,经历了十年寒窗苦读的高三学子们,一边焦急等待成绩出来的同时,一边也会不由自主期待随之而来的快乐假期吧? ...

大数据告诉你:粽子甜咸之争谁胜出?吃货最爱买谁家的粽子?

大数据告诉你:粽子甜咸之争谁胜出?吃货最爱买谁家的粽子?
2021-06-15
CDA数据分析师 出品 【导语】:今天我们来聊聊粽子,Python分析部分请看第三部分。 又到一年端午节,作为中华民族的传统节日,传说粽子是为祭奠投江的屈原而传承下来的,如今吃粽子也成了端午的主要习俗 ...

不会用Python提取PDF表格?三种类型数据,轻松转换

不会用Python提取PDF表格?三种类型数据,轻松转换
2021-03-22
来源:早起Python 作者:自动化工作组 大家好,从PDF中提取信息是办公场景中经常需要用到的操作,也是经常又读者在后台问的一个操作。 内容少的话我们可以手动复制粘贴,但如果需要批量提取就可以考虑使 ...

用Python制作处理小工具,多种操作,一键完成,非常实用

用Python制作处理小工具,多种操作,一键完成,非常实用
2021-02-07
作者:GUI工作组 本文将结合GUI工具PySimpleGUI,来讲解如何制作一款属于自己的数据预处理小工具,让这个过程也能够自动化!最终效果如下 本文将分为三部分讲解: 主要涉及将涉及以下模块: 一、G ...

东京奥运会能如期举办吗?带你用数据看120年奥运变迁史

东京奥运会能如期举办吗?带你用数据看120年奥运变迁史
2020-11-30
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 2020年年初,突然袭来的新冠疫情给我们的生活带来了巨大的改变,与此同时也让许多国际体育赛 ...

如何用pandas更快的进行数据可视化

如何用pandas更快的进行数据可视化
2020-11-27
作者:刘早起 来源:早起Python(公众号) 如果你经常使用Python进行数据分析,那么对于pandas一定不会陌生,但是Pandas除了在数据处理上大放异彩,随着版本的不断更新,Pandas的绘图功能在 ...

pandas数据可视化原来也这么厉害

pandas数据可视化原来也这么厉害
2020-11-26
作者:小伍哥  来源:AI入门学习(公众号) 在python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易。 seaborn:是建 ...

38万条数据,用python分析保险产品交叉销售相关因素!

38万条数据,用python分析保险产品交叉销售相关因素!
2020-11-16
CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】今天的内容是一期python实战训练,我们来手把手教你用Python分析保险产品交叉销售和哪些因素有关。 01、实战背 ...

《演员请就位2》的45万条弹幕,看看大家都在吐槽些什么

《演员请就位2》的45万条弹幕,看看大家都在吐槽些什么
2020-11-09
CDA数据分析师 出品 作者:Mika 数据:真达 后期:Mika 【导读】 Show me data,用数据说话 今天我们聊一聊 《演员请就位2》,最近开播的国综里面,热度最高的一定是《演员请就位》了。从第 ...

秒懂!图解四个实用的pandas函数!

秒懂!图解四个实用的pandas函数!
2020-10-28
作者:Baijayanta Roy 来源:towardsdatascience 编译&内容补充:早起Python 在用python进行机器学习或者日常的数据处理中,pandas是最常用的Python库之一,熟练掌握pandas是每一个数据科学家的必备 ...

6种数据格式对比,用Jupyter+pandas高效数据分析

6种数据格式对比,用Jupyter+pandas高效数据分析
2020-10-27
编译:刘早起(有删改) 来源:towardsdatascience、GitHub等 在使用python进行数据分析时,Jupyter Notebook是一个非常强力的工具,在数据集不是很大的情况下,我们可以使用pandas轻松对txt或csv等纯文 ...

OK