cda

数字化人才认证

首页 > 行业图谱 >

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

如何用Python数据可视化来分析用户留存率,建议收藏

如何用Python数据可视化来分析用户留存率,建议收藏
2021-12-20
作者:俊欣 来源:关于数据分析与可视化 今天和大家来分享一些数据可视化方向的干货,我们来尝试用Python来绘制一下“漏斗图”,但愿大家在看完本篇文章之后会有所收获。 关于“漏斗图” 漏斗图常用于 ...

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(CDA内容分享)

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(CDA内容分享)
2021-12-14

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(cda干货分享)

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(cda干货分享)
2021-12-13
作者:俊欣 来源:关于数据分析与可视化 大家好,又是新的一周。大家一般会用Pandas模块来对数据集进行进一步的分析与挖掘关键信息,但是当我们遇到数据集特别特别大的时候,内存就会爆掉,今天小编就来分享 ...

Pyecharts绘制22种超实用精美图表【CDA内容分享】

Pyecharts绘制22种超实用精美图表【CDA内容分享】
2021-12-07
作者:俊欣 今天来给大家分享一下Pyecharts模块,说到它我们就不得不提Echarts,它是由百度开源的一款使用JavaScript实现的开源可视化库,涵盖了各种图表、满足各类业务需求,而pyecharts也就是Python与Echarts ...

全文2000字,当Pandas遇上Excel会擦出什么样的火花呢?【CDA内容分享】

全文2000字,当Pandas遇上Excel会擦出什么样的火花呢?【CDA内容分享】
2021-12-06
作者: 俊欣 大家好,又是新的一周。 今天我们要介绍的模块是xlsxwriter,它的主要功能是在Excel表格当中插入数据、插入图表,以及进行一系列数据的处理, 直接在命令行中输入 pip install xlsxw ...

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位
2021-11-30
来源:关于数据分析与可视化 数据抓取的流程与步骤 数据清洗的流程与步骤 可视化的结果与分析 我们用Python当中的requests模块来发送与接收请求,然后用BeautifulSoup模块也解析返回 ...

帅到爆炸!使用管道 Pipe 编写 Python 代码竟如此简洁

帅到爆炸!使用管道 Pipe 编写 Python 代码竟如此简洁
2021-11-29
作者:豆豆 来源:Python 技术 众所周知,Pytnon 非常擅长处理数据,尤其是后期数据的清洗工作。今天派森酱就给大家介绍一款处理数据的神器 Pipe。 什么是 Pipe 简言之,Pipe 是 Python 的一个三 ...

4000字归纳总结 Pandas+Sklearn 带你做数据预处理

4000字归纳总结 Pandas+Sklearn 带你做数据预处理
2021-11-24
作者:俊欣 来源:关于数据分析与可视化 今天我们就来讲讲数据预处理过程当中的一些要点与难点。我们大致会提到数据预处理中的 加载数据 处理缺失值如何处理 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

实战 | 如何制作数据报表并实现自动化?

实战 | 如何制作数据报表并实现自动化?
2021-11-03
本章给大家演示一下在实际工作中如何结合 Pandas 库和 openpyxl 库来自动化生成报表。假设我们现在有如图 1 所示的数据集。 (图1) 现在需要根据这份数据集来制作每天的日报情况, ...

一个 Python 报表自动化实战案例

一个 Python 报表自动化实战案例
2021-10-25
给大家分享新书《对比Excel,轻松学习Python报表自动化》中关于报表自动化实战的一篇内容。 本篇文章将带你了解报表自动化的流程,并教你用Python实现工作中的一个报表自动化实战,篇幅较长,建议先收藏,文章 ...

如何评估机器学习模型的商业价值

如何评估机器学习模型的商业价值
2021-09-22
作者:amitvkulkarni CDA数据分析师编译 概述 对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程 ...

手把手教你用Pandas库对淘宝原始数据进行数据处理和分词处理

手把手教你用Pandas库对淘宝原始数据进行数据处理和分词处理
2021-08-25
来源:Python爬虫与数据挖掘 作者: Python进阶者 大家好,我是Python进阶者。 一、前言 大家好,我是Python进阶者,上个礼拜的时候,我的Python交流群里有个名叫程序的大佬,头像是绿色菜狗的那 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

Pandas中的宝藏函数-map

Pandas中的宝藏函数-map
2021-07-28
来源:AI入门学习 作者:小伍哥 pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史
2021-07-19
CDA数据分析师 出品 作者:Mika 【导读】 今天带大家用数据可视化解读120 年奥运变迁史。 几经波折,东京奥运会终于即将迎来开幕的时刻,距离7月23日东京奥运会开幕只有不到一周的时间了。 这 ...

时间序列,从开始到结束日期自增扩充数据

时间序列,从开始到结束日期自增扩充数据
2021-07-15
来源:数据STUDIO 作者:云朵君 糖尿病是全球最常见的慢性非传染性疾病之一。流行病学调查显示,我国约11%的成年人患有糖尿病,而在住院患者中这一比例更高。 住院期间将长期服用药物,医院 ...

OK