cda

数字化人才认证

首页 > 行业图谱 >

12345678 3/8
为什么pandas不能直接用df[i][j]=1赋值?
2023-04-03
Pandas 是一个开源的 Python 数据分析库,它提供了大量方便快捷的功能,可以使得数据的处理和分析变得更加高效。其中,DataFrame 是 Pandas 中最常用的数据结构之一,它被设计成类似于表格的形式,通常包含多个列和 ...

Pandas数据挖掘与分析时的常用方法

Pandas数据挖掘与分析时的常用方法
2022-03-07
作者:俊欣 来源:关于数据分析与可视化 今天我们来讲一下用Pandas模块对数据集进行分析的时候,一些经常会用到的配置,通过这些配置的帮助,我们可以更加有效地来分析和挖掘 ...

基于同步行为的反欺诈算法SynchroTrap实现细节

基于同步行为的反欺诈算法SynchroTrap实现细节
2022-02-28
作者:小伍哥 来源:小伍哥聊风控 上次分享了非常牛逼的不需要介质就能进行团伙挖掘的算法,大家都说是个好算法,但是实现细节还是有些问题。 由此可见,风控的实践大于算法,就像绘画,给我同样的材 ...

Pandas宝藏函数-concat()

Pandas宝藏函数-concat()
2022-01-26
作者:小伍哥 来源:AI入门学习 在数据处理过程中,经常会遇到多个表进行拼接合并的需求,在Pandas中有多个拼接合并的方法,每种方法都有自己擅长的拼接方式,本文对pd.concat()进行详细讲解,希望对你有帮 ...

全文4000字、20个案例详解Pandas当中的数据统计分析与排序(CDA干货内容分享)

全文4000字、20个案例详解Pandas当中的数据统计分析与排序(CDA干货内容分享)
2022-01-06
来源:关于数据分析与可视化 今天小编来给大家讲一下Pandas模块当中的数据统计与排序,说到具体的就是value_counts()方法以及sort_values()方法。 导入模块并且读取数据库 output 常规的用法 ...

全文2500字,详解Pandas与Lambda结合进行高效数据分析

全文2500字,详解Pandas与Lambda结合进行高效数据分析
2021-12-22
来源:关于数据分析与可视化 这篇文章小编来讲讲lambda方法以及它在pandas模块当中的运用,熟练掌握可以极大地提高数据分析与挖掘的效率 我们第一步需要导入模块以及数据集 import pandas as pd df = pd ...

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

Pandas中的宝藏函数-map

Pandas中的宝藏函数-map
2021-07-28
来源:AI入门学习 作者:小伍哥 pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...

时间序列,从开始到结束日期自增扩充数据

时间序列,从开始到结束日期自增扩充数据
2021-07-15
来源:数据STUDIO 作者:云朵君 糖尿病是全球最常见的慢性非传染性疾病之一。流行病学调查显示,我国约11%的成年人患有糖尿病,而在住院患者中这一比例更高。 住院期间将长期服用药物,医院 ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

pandas数据可视化原来也这么厉害

pandas数据可视化原来也这么厉害
2020-11-26
作者:小伍哥  来源:AI入门学习(公众号) 在python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易。 seaborn:是建 ...

pandas向量化字符串操作方法!

pandas向量化字符串操作方法!
2020-11-20
作者:小伍哥  来源:AI入门学习 python内置一系列强大的字符串处理方法,但这些方法只能处理单个字符串,处理一个序列的字符串时,需要用到循环。那么,有没有办法,不用循环就能同时处理多个字符 ...

时序数据处理难题攻略(上)

时序数据处理难题攻略(上)
2020-11-10
作者:计量与统计 来源:公众号计量与统计 时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法 ...

秒懂!图解四个实用的pandas函数!

秒懂!图解四个实用的pandas函数!
2020-10-28
作者:Baijayanta Roy 来源:towardsdatascience 编译&内容补充:早起Python 在用python进行机器学习或者日常的数据处理中,pandas是最常用的Python库之一,熟练掌握pandas是每一个数据科学家的必备 ...

Python办公自动化|自动更新不对称表格

Python办公自动化|自动更新不对称表格
2020-09-28
作者:陈熹 来源:早起Python 大家好,又到了python办公自动化专题。在之前我们详细讲解过如何使用Python自动更新Excel表格并调整样式,在上次的自动化案例中要求两个或多个Excel表格数据要匹配/对称才 ...

Python实现的随机森林算法与简单总结

Python实现的随机森林算法与简单总结
2018-02-15
Python实现的随机森林算法与简单总结 本文实例讲述了Python实现的随机森林算法。分享给大家供大家参考,具体如下: 随机森林是数据挖掘中非常常用的分类预测算法,以分类或回归的决策树为基分类器。算法 ...

Python中的缺失值及其处理

Python中的缺失值及其处理
2017-12-01
Python中的缺失值及其处理 缺失值处理用到的主要工具为 Numpy 库和 Pandas库中的有关函数,要导入 Numpy 和 Pandas: >>>import numpy as np >>>import pandas as pd 在 Python 中,特殊的常量 None 通常被 ...
12345678 3/8

OK