热线电话:13121318867

登录
首页大数据时代数据分析师教程《Python数据分析极简入门》第2节 3 Pandas数据查看
数据分析师教程《Python数据分析极简入门》第2节 3 Pandas数据查看
2024-11-21
收藏

《Python数据分析极简入门》

第2节 3 Pandas数据查看

这里我们创建一个DataFrame命名为df

import numpy as np
import pandas as pd
d =  np.array([[8128242596],
       [ 835569839],
       [13395536,  3],
       [7054694812],
       [6380972570]])
df = pd.DataFrame(data = d,
                  columns=list('abcde'))
df
a b c d e
0 81 28 24 25 96
1 8 35 56 98 39
2 13 39 55 36 3
3 70 54 69 48 12
4 63 80 97 25 70

查看前n行

df.head(2)
a b c d e
0 81 28 24 25 96
1 8 35 56 98 39

查看后n行

df.tail(2)
a b c d e
3 70 54 69 48 12
4 63 80 97 25 70

查看随机N行

df.sample(2)
a b c d e
1 8 35 56 98 39
3 70 54 69 48 12

按列选取

单列选取,我们有3种方式可以实现

第一种,直接在[]里面写上要筛选的列名

df['a']
0    81
1     8
2    13
3    70
4    63
Name: a, dtype: int64

第二种,在.iloc[]里的,前面写上要筛选的行索引,在,后面写上要筛选的列索引。其中:代表所有,0:3代表从索引0到2

df.iloc[0:3,0]
0    81
1     8
2    13
Name: a, dtype: int64

第三种,直接.后面写上列名

df.a
0    81
1     8
2    13
3    70
4    63
Name: a, dtype: int64

同样的,选择多列常见的也有3种方式:

第一种,直接在[]里面写上要筛选的列名组成的列表['a','c','d']

df[['a','c','d']]
a c d
0 81 24 25
1 8 56 98
2 13 55 36
3 70 69 48
4 63 97 25

第二种,在.iloc[]里面行索引位置写选取所有行,列索引位置写上要筛选的列索引组成的列表[0,2,3]

df.iloc[:,[0,2,3]]
a c d
0 81 24 25
1 8 56 98
2 13 55 36
3 70 69 48
4 63 97 25

第三种,在.loc[]里面的行索引位置写来选取所有行,在列索引位置写上要筛选的列索引组成的列表['a','c','d']

df.loc[:,['a','c','d']]
a c d
0 81 24 25
1 8 56 98
2 13 55 36
3 70 69 48
4 63 97 25

按行选取

直接选取第一行

df[0:1]
a b c d e
0 81 28 24 25 96

loc选取第一行

df.loc[0:0]
a b c d e
0 81 28 24 25 96

选取任意多行

df.iloc[[1,3],]
a b c d e
1 8 35 56 98 39
3 70 54 69 48 12

选取连续多行

df.iloc[1:4,:]
a b c d e
1 8 35 56 98 39
2 13 39 55 36 3
3 70 54 69 48 12

指定行列

指定行列值

df.iat[2,2# 根据行列索引
55
df.at[2,'c'# 根据行列名称
55

指定行列区域

df.iloc[[2,3],[1,4]]
b e
2 39 3
3 54 12

以上是关于如何查看一个DataFrame里的数据,包括用[]ilociat等方式选取数据,接下来我们来看如何用条件表达式来筛选数据:


下一节 《第2节 4 Pandas数据查看》

这里分享一个你一定用得到的小程序——CDA数据分析师考试小程序。 它是专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。 扫码加入CDA小程序,与圈内考生一同学习、交流、进步!

最新资讯
更多
客服在线
立即咨询