数据分析师教程《Python数据分析极简入门》第2节 3 Pandas数据查看

2024-11-21

《Python数据分析极简入门》

第2节 3 Pandas数据查看

这里我们创建一个DataFrame命名为df：

import numpy as np
import pandas as pd
d =  np.array([[81, 28, 24, 25, 96],
       [ 8, 35, 56, 98, 39],
       [13, 39, 55, 36,  3],
       [70, 54, 69, 48, 12],
       [63, 80, 97, 25, 70]])
df = pd.DataFrame(data = d,
                  columns=list('abcde'))
df

	a	b	c	d	e
0	81	28	24	25	96
1	8	35	56	98	39
2	13	39	55	36	3
3	70	54	69	48	12
4	63	80	97	25	70

查看前n行

df.head(2)

	a	b	c	d	e
0	81	28	24	25	96
1	8	35	56	98	39

查看后n行

df.tail(2)

	a	b	c	d	e
3	70	54	69	48	12
4	63	80	97	25	70

查看随机N行

df.sample(2)

	a	b	c	d	e
1	8	35	56	98	39
3	70	54	69	48	12

按列选取

单列选取，我们有3种方式可以实现

第一种，直接在[]里面写上要筛选的列名

df['a']

0    81
1     8
2    13
3    70
4    63
Name: a, dtype: int64

第二种，在.iloc[]里的,前面写上要筛选的行索引，在,后面写上要筛选的列索引。其中:代表所有，0:3代表从索引0到2

df.iloc[0:3,0]

0    81
1     8
2    13
Name: a, dtype: int64

第三种，直接.后面写上列名

df.a

0    81
1     8
2    13
3    70
4    63
Name: a, dtype: int64

同样的，选择多列常见的也有3种方式：

第一种，直接在[]里面写上要筛选的列名组成的列表['a','c','d']

df[['a','c','d']]

	a	c	d
0	81	24	25
1	8	56	98
2	13	55	36
3	70	69	48
4	63	97	25

第二种，在.iloc[]里面行索引位置写：选取所有行，列索引位置写上要筛选的列索引组成的列表[0,2,3]

df.iloc[:,[0,2,3]]

	a	c	d
0	81	24	25
1	8	56	98
2	13	55	36
3	70	69	48
4	63	97	25

第三种，在.loc[]里面的行索引位置写：来选取所有行，在列索引位置写上要筛选的列索引组成的列表['a','c','d']

df.loc[:,['a','c','d']]

	a	c	d
0	81	24	25
1	8	56	98
2	13	55	36
3	70	69	48
4	63	97	25

按行选取

直接选取第一行

df[0:1]

	a	b	c	d	e
0	81	28	24	25	96

用loc选取第一行

df.loc[0:0]

	a	b	c	d	e
0	81	28	24	25	96

选取任意多行

df.iloc[[1,3],]

	a	b	c	d	e
1	8	35	56	98	39
3	70	54	69	48	12

选取连续多行

df.iloc[1:4,:]

	a	b	c	d	e
1	8	35	56	98	39
2	13	39	55	36	3
3	70	54	69	48	12

指定行列

指定行列值

df.iat[2,2] # 根据行列索引

df.at[2,'c'] # 根据行列名称

指定行列区域

df.iloc[[2,3],[1,4]]

	b	e
2	39	3
3	54	12

以上是关于如何查看一个DataFrame里的数据，包括用[]、iloc、iat等方式选取数据，接下来我们来看如何用条件表达式来筛选数据：

下一节《第2节 4 Pandas数据查看》

这里分享一个你一定用得到的小程序——CDA数据分析师考试小程序。它是专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分，通过该小程序，考生可以享受更便捷的服务。扫码加入CDA小程序，与圈内考生一同学习、交流、进步！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

索引 DataFrame 数据分析 pandas numpy

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇数据分析师的工作内容是什么？岗位职责与发展前景

下一篇如何成为商业分析师？从入门到高级的职业规划

数据分析师教程《Python数据分析极简入门》第2节 3 Pandas数据查看

《Python数据分析极简入门》

第2节 3 Pandas数据查看

按列选取

按行选取

指定行列

CDA考试动态

CDA报考指南

热门栏目

最新资讯

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...

tensorflow_datasets 如何load本地的数据集？ ...

《CDA二级教材》试读版上线CDA网校，助你轻松拿下二 ...

【干货】3步带你画出用户DNA，精准营销更进一步 ...

什么是随机森林，它的优缺点是什么？：面试标准答案 ...

【干货】电商营收暴跌40%，如何排查？ ...

【干货】如何通过精细化运营提升 DAU 指标？ ...

【干货】AB test 在业务中的落地应用

自上而下的指标体系构建全攻略

解锁数据分析师高薪密码，CDA 脱产就业班助你逆袭！ ...

如何在mysql语句中查询一个表,但不包含某字段? ...

深度解析用户画像：数据运营的核心力量 ...

2025年AI智能体元年，数据分析师会被替代吗？ ...

【案例】业务数据分析方法之多维度拆解 ...

【干货】我手里有好几个产品，该怎么分配资源？-波 ...

【干货】5步搞定数据异常分析

CDA数据人才能力模型与认证体系简介