cda

数字化人才认证

首页 > 行业图谱 >

12345678 3/8

全文2500字,详解Pandas与Lambda结合进行高效数据分析

全文2500字,详解Pandas与Lambda结合进行高效数据分析
2021-12-22
来源:关于数据分析与可视化 这篇文章小编来讲讲lambda方法以及它在pandas模块当中的运用,熟练掌握可以极大地提高数据分析与挖掘的效率 我们第一步需要导入模块以及数据集 import pandas as pd df = pd ...

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

Pandas中的宝藏函数-map

Pandas中的宝藏函数-map
2021-07-28
来源:AI入门学习 作者:小伍哥 pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...

时间序列,从开始到结束日期自增扩充数据

时间序列,从开始到结束日期自增扩充数据
2021-07-15
来源:数据STUDIO 作者:云朵君 糖尿病是全球最常见的慢性非传染性疾病之一。流行病学调查显示,我国约11%的成年人患有糖尿病,而在住院患者中这一比例更高。 住院期间将长期服用药物,医院 ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

pandas数据可视化原来也这么厉害

pandas数据可视化原来也这么厉害
2020-11-26
作者:小伍哥  来源:AI入门学习(公众号) 在python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易。 seaborn:是建 ...

pandas向量化字符串操作方法!

pandas向量化字符串操作方法!
2020-11-20
作者:小伍哥  来源:AI入门学习 python内置一系列强大的字符串处理方法,但这些方法只能处理单个字符串,处理一个序列的字符串时,需要用到循环。那么,有没有办法,不用循环就能同时处理多个字符 ...

时序数据处理难题攻略(上)

时序数据处理难题攻略(上)
2020-11-10
作者:计量与统计 来源:公众号计量与统计 时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法 ...

秒懂!图解四个实用的pandas函数!

秒懂!图解四个实用的pandas函数!
2020-10-28
作者:Baijayanta Roy 来源:towardsdatascience 编译&内容补充:早起Python 在用python进行机器学习或者日常的数据处理中,pandas是最常用的Python库之一,熟练掌握pandas是每一个数据科学家的必备 ...

Python办公自动化|自动更新不对称表格

Python办公自动化|自动更新不对称表格
2020-09-28
作者:陈熹 来源:早起Python 大家好,又到了python办公自动化专题。在之前我们详细讲解过如何使用Python自动更新Excel表格并调整样式,在上次的自动化案例中要求两个或多个Excel表格数据要匹配/对称才 ...

Python实现的随机森林算法与简单总结

Python实现的随机森林算法与简单总结
2018-02-15
Python实现的随机森林算法与简单总结 本文实例讲述了Python实现的随机森林算法。分享给大家供大家参考,具体如下: 随机森林是数据挖掘中非常常用的分类预测算法,以分类或回归的决策树为基分类器。算法 ...

Python中的缺失值及其处理

Python中的缺失值及其处理
2017-12-01
Python中的缺失值及其处理 缺失值处理用到的主要工具为 Numpy 库和 Pandas库中的有关函数,要导入 Numpy 和 Pandas: >>>import numpy as np >>>import pandas as pd 在 Python 中,特殊的常量 None 通常被 ...
数据探索之缺失值处理及代码实现
2017-11-30
数据探索之缺失值处理及代码实现 在数据挖掘中,前期数据预处理,会涉及到很多缺失值的处理问题。 现以python代码实现为例,看如何具体处理的。 所需python包 from pandas import Series, DataFrame import pan ...

如何为时间序列数据优化K-均值聚类速度

如何为时间序列数据优化K-均值聚类速度
2017-11-24
时间序列数据(Time Series Data)是按时间排序的数据,利率、汇率和股价等都是时间序列数据。时间序列数据的时间间隔可以是分和秒(如高频金融数据),也可以是日、周、月、季度、年以及甚至更大的时间单位。数据分析 ...
Python数据分析之真实IP请求Pandas详解
2017-08-04
Python数据分析之真实IP请求Pandas详解 这篇文章主要给大家介绍了Python数据分析之真实IP请求Pandas,文中通过示例嗲吗给大家介绍的很详细,相信对大家的学习或者理解具有一定的参考借鉴价值.pandas 是基于 Num ...
python绘图:matplotlib和pandas的应用
2017-07-01
python绘图:matplotlib和pandas的应用  在进行数据分析时,绘图是必不可少的模式探索方式。用Python进行数据分析时,matplotlib和pandas是最常用到的两个库。 1、matplotlib库的应用 准备工作如下:打开i ...

一行R代码来实现繁琐的可视化

一行R代码来实现繁琐的可视化
2017-05-13
一行R代码来实现繁琐的可视化 ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进行二维可视化,这让统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进 ...
12345678 3/8

OK