热线电话:13121318867

登录
首页大数据时代数据分析师教程《Python数据分析极简入门》第2节 1 Pandas简介
数据分析师教程《Python数据分析极简入门》第2节 1 Pandas简介
2024-11-20
收藏

《Python数据分析极简入门》

第2节 1 Pandas简介

说好开始学Python,怎么到了Pandas?

前面说过,既然定义为极简入门,我们只抓核心中的核心。

那怎么样挑核心重点呢?

在你不熟悉的情况下,肯定需要请教别人,需要注意的是,不要去问应该学什么编程语言,而是去问,如果只学一门编程语言,应该学什么?

这样,问题就从多分类的选择题,变成了一道优化题!有人说选择大于努力,而现实中的情况是,我们选的不是答案只有对与错的问题,而是在好、次好与更好之间选更好,这个道理看似简单,但却不容易做到,小到你学Python应该优先学什么,大到一个国家的资源配置应该优先发展什么?本质上都是最优化问题。

回到今天的主题,如果学Python语言,但只学一个库,你要学什么?有人说人工智能好啊,我要学算法,错!算法再牛也需要你从底层的数据开始,所以答案肯定是Pandas,这属于做数据分析处理数据必知必会的内容。

今天的故事,要从08年北京奥运会那年说起,远在纽约一家量化投资公司的打工人Wes McKinney ,由于在日常数据分析工作中 想多摸会儿鱼 备受Excel与SQL等工具的折磨,于是他开始构建了一个新项目 Pandas,用来解决数据处理过程中遇到的全部任务。

Wes McKinney
Wes McKinney

什么是Pandas?

Pandas是一个开源的Python库,主要用于数据分析、数据处理数据可视化

Pandas作为Python数据分析的核心包,提供了大量的数据分析函数,包括数据处理数据抽取数据集成、数据计算等基本的数据分析手段。

Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)的简称。

千万记得Pandas不是咱们的国宝大熊猫的复数形式!!!(尽管这一强调极有可能适得其反,但还是忍不住贴一张panda的图)

为什么Pandas必学?

  • SQL语句还要简洁,查询数据事半功倍!简单

  • 基于Numpy数值计算,数据处理高效运算!高效

  • 支持数值、文本和可视化,快速灵活完成数据需求!强大

如果用一个字来说明,那就是“快”。这个快指的是你从开始构思到写完代码的时间,毫不夸张地说,当你把数据需求用文字梳理清楚的时候,基本上也就相当于用Python实现了这一过程,因为在Python的世界,所见即所得

怎么学Pandas?

把大象放进冰箱里需要三步,打开冰箱门、把大象塞进去、关上冰箱门。同样地,怎么学Pandas,也需要三步

第一步,必须了解Pandas的数据结构。在之前的系列文章里面说过,学习语言学习的三板斧,数据结构,流程控制,自定义函数。这里pandas虽然只是一个库,但同样有其数据结构

第二步,必须学会用Pandas做数据处理。这是你做数据分析的基本功,里面包含如下内容

第三步,掌握一些Pandas高阶与展示技巧。这是你分析或展示的必备技能

下一节:《第2节 2 Pandas数据类型

这里分享一个你一定用得到的小程序——CDA数据分析师考试小程序。 它是专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。 扫码加入CDA小程序,与圈内考生一同学习、交流、进步!

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询