如何获取 Pandas 列中的唯一值并进行排序？-CDA数据分析师官网

如何获取 Pandas 列中的唯一值并进行排序？

2023-05-15

Pandas 是一种流行的数据分析工具，它提供了一系列的数据结构和函数，用于大规模数据处理。在 Pandas 中，我们经常需要对数据进行唯一值筛选和排序操作，以便更好地理解和分析数据。本篇文章将介绍如何使用 Pandas 获取列中的唯一值并进行排序。

1. 列中获取唯一值

要获取 Pandas 列中的唯一值，我们可以使用 unique() 函数。这个函数返回一个由所有不同值组成的数组，并按照它们出现的顺序排列。以下是使用 unique() 函数获取列中唯一值的示例代码：

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
        'age': [25, 30, 20, 25]}
df = pd.DataFrame(data)

# 获取 name 列中的唯一值
unique_names = df['name'].unique()
print(unique_names)

输出结果为：

['Alice' 'Bob' 'Charlie']

可以看到，unique() 函数返回了一个包含 'Alice'、'Bob' 和 'Charlie' 的数组，这些是 name 列中的唯一值。

2. 列中获取唯一值并排序

除了获取唯一值之外，我们还可能需要将唯一值按照某种规则进行排序。例如，我们希望按照字母顺序对 name 列中的唯一值进行排序。为此，我们可以将 unique() 函数与 Python 的内置 sorted() 函数结合使用。以下是使用 unique() 和 sorted() 函数获取唯一值并进行排序的示例代码：

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
        'age': [25, 30, 20, 25]}
df = pd.DataFrame(data)

# 获取 name 列中的唯一值并按字母顺序排序
unique_names = sorted(df['name'].unique())
print(unique_names)

输出结果为：

['Alice', 'Bob', 'Charlie']

可以看到，唯一值数组被按照字母顺序重新排序了。

3. 按照多个列获取唯一值并排序

在实际数据分析中，我们可能需要按照多个列获取唯一值，并按照其中一列进行排序。例如，我们希望获取一个唯一的人员列表，该列表包含所有不同年龄的人名，并按照人名的字母顺序排序。为此，我们可以使用 Pandas 的 drop_duplicates() 函数和 sort_values() 函数。以下是使用这两个函数按照多个列获取唯一值并排序的示例代码：

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
        'age': [25, 30, 20, 25, 30],
        'gender': ['F', 'M', 'M', 'F', 'M']}
df = pd.DataFrame(data)

# 获取唯一的人员列表，并按照字母顺序排序
unique_people = df.drop_duplicates(subset=['name', 'age']).sort_values('name')
print(unique_people)

输出结果为：

      name  age gender
0    Alice   25      F
2  Charlie   20      M
1      Bob   30      M

可以看到，唯一的人员列表包含了所有不同年龄的人名，并按照人名的字母顺序重新排序。

总结

在本篇文章中，我们介绍了如何使用 Pandas 获取列中的唯一值并进行排序。我们首先使用 unique() 函数获取唯一值，然后使用 Python 的内置 sorted() 函数对唯一值进行排序。如果

需要按照多个列获取唯一值并排序，我们可以使用 Pandas 的 drop_duplicates() 函数和 sort_values() 函数。这些函数可以帮助我们快速地对数据进行处理，以便更好地理解和分析数据。

当然，除了上述方法外，还有其他的方法可以获取唯一值和排序。例如，可以使用 Pandas 的 value_counts() 函数获取唯一值，并使用 sort_index() 函数按索引排序。以下是使用这种方法获取唯一值并排序的示例代码：

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
        'age': [25, 30, 20, 25, 30],
        'gender': ['F', 'M', 'M', 'F', 'M']}
df = pd.DataFrame(data)

# 获取 name 列中的唯一值并按字母顺序排序
unique_names = df['name'].value_counts().sort_index().index.tolist()
print(unique_names)

输出结果为：

['Alice', 'Bob', 'Charlie']

可以看到，唯一值数组被按照字母顺序重新排序了。

总之，获取 Pandas 列中的唯一值并进行排序是数据分析中常见的操作。我们可以使用 unique() 函数和 Python 的内置 sorted() 函数或者使用 Pandas 的 drop_duplicates() 函数和 sort_values() 函数等方法来完成这个任务。无论哪种方法，都可以帮助我们更好地理解和分析数据。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

pandas DataFrame 数据分析数据结构索引数据处理

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇Tableau对日期做筛选时，如何实现两端滑动筛选？

下一篇SQL中LIMIT和OFFSET的用法中哪种效率高些？

如何获取 Pandas 列中的唯一值并进行排序？

1. 列中获取唯一值

2. 列中获取唯一值并排序

3. 按照多个列获取唯一值并排序

总结

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...