cda

数字化人才认证

首页 > 行业图谱 >

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏
2021-12-20
来源:关于数据分析与可视化 01、导入库和读取数据 我们先来大致地看一下数据集中各个特征值的情况,通过info()这个方法 df.info() 02、去除掉缺失值和重复值 要是数据集中存在大量的缺失值, ...

Pyecharts绘制22种超实用精美图表【CDA内容分享】

Pyecharts绘制22种超实用精美图表【CDA内容分享】
2021-12-07
作者:俊欣 今天来给大家分享一下Pyecharts模块,说到它我们就不得不提Echarts,它是由百度开源的一款使用JavaScript实现的开源可视化库,涵盖了各种图表、满足各类业务需求,而pyecharts也就是Python与Echarts ...

手把手教你对文本文件进行分词、词频统计和可视化【CDA内容分享】

手把手教你对文本文件进行分词、词频统计和可视化【CDA内容分享】
2021-12-06
今天CDA给大家分享的内容:手把手教你对文本文件进行分词、词频统计和可视化 作者: Python进阶者 来源:Python爬虫与数据挖掘 大家好!我是Python进阶者。 前言 前几天一个在校大学生问了一些 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

深度学习预测房价:回归问题,K折交叉

深度学习预测房价:回归问题,K折交叉
2021-11-15
作者:AI入门学习 来源:小伍哥 机器学习中,大部分是分类问题,另一种常见的机器学习问题是回归问题,它预测一个连续值而不是离散的标签,例如,根据气象数据预测明天的气温,或者根据软件说明书预测完成软 ...

如何评估机器学习模型的商业价值

如何评估机器学习模型的商业价值
2021-09-22
作者:amitvkulkarni CDA数据分析师编译 概述 对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史
2021-07-19
CDA数据分析师 出品 作者:Mika 【导读】 今天带大家用数据可视化解读120 年奥运变迁史。 几经波折,东京奥运会终于即将迎来开幕的时刻,距离7月23日东京奥运会开幕只有不到一周的时间了。 这 ...

时间序列,从开始到结束日期自增扩充数据

时间序列,从开始到结束日期自增扩充数据
2021-07-15
来源:数据STUDIO 作者:云朵君 糖尿病是全球最常见的慢性非传染性疾病之一。流行病学调查显示,我国约11%的成年人患有糖尿病,而在住院患者中这一比例更高。 住院期间将长期服用药物,医院 ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

比特币一年翻6倍?用Python动态可视化比特币价格变动趋势

比特币一年翻6倍?用Python动态可视化比特币价格变动趋势
2021-03-18
作者:读者投稿 一、获取数据 执行后,当前目录就会生成BTC.csv数据文件 二、动态可视化BTC价格变化 其中两句plt.rcParams[]是用来设置显示中文的 mpl.rcParams['animation.embed_limit ...

C语言排名第一的真相!醒醒吧,这个第一很难找工作的

C语言排名第一的真相!醒醒吧,这个第一很难找工作的
2021-03-16
来源:麦叔编程 作者:麦叔 作为一个有十多年行业经验的人,我深知C语言的重要性。 但是我也时常纳闷,为什么C语言经常排在第一名呢? 放眼望去,我好像不认识一个以C语言为主要工作语言的人。这个排 ...

快速掌握数据分析必备工具,ipython和jupyter notebook

快速掌握数据分析必备工具,ipython和jupyter notebook
2021-03-11
作者:麦叔 本文帮你快速掌握数据分析师必须会用的两个工具 - ipython和jupyter notebook。 建议把本文放到收藏夹。吃灰也好过需要的时候找不到。 iPython是Interactive Python,它是基于Python的一 ...

南方人过冬有多难?用Python带你分析全网取暖器销量数据

南方人过冬有多难?用Python带你分析全网取暖器销量数据
2020-12-08
 CDA数据分析师 出品   作者:Mika 数据:真达   如果说冬天对北方人来说只是一个季节,而对南方人来说是一场“渡劫”。北方的冷是干冷,物理攻击,多穿一点就好了。而 ...

东京奥运会能如期举办吗?带你用数据看120年奥运变迁史

东京奥运会能如期举办吗?带你用数据看120年奥运变迁史
2020-11-30
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 2020年年初,突然袭来的新冠疫情给我们的生活带来了巨大的改变,与此同时也让许多国际体育赛 ...

pandas数据可视化原来也这么厉害

pandas数据可视化原来也这么厉害
2020-11-26
作者:小伍哥  来源:AI入门学习(公众号) 在python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易。 seaborn:是建 ...

38万条数据,用python分析保险产品交叉销售相关因素!

38万条数据,用python分析保险产品交叉销售相关因素!
2020-11-16
CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】今天的内容是一期python实战训练,我们来手把手教你用Python分析保险产品交叉销售和哪些因素有关。 01、实战背 ...

《演员请就位2》的45万条弹幕,看看大家都在吐槽些什么

《演员请就位2》的45万条弹幕,看看大家都在吐槽些什么
2020-11-09
CDA数据分析师 出品 作者:Mika 数据:真达 后期:Mika 【导读】 Show me data,用数据说话 今天我们聊一聊 《演员请就位2》,最近开播的国综里面,热度最高的一定是《演员请就位》了。从第 ...

OK