京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | CDA数据分析师
一、Python是什么
首先Python是一门编程语言,具有丰富而强大的库。Python被称为胶水语言,因为它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地连在一起。
Python语言的语法简单、容易上手,它有很多现成的库可以供你直接调用,以满足你在不同领域的需求。Python在数据分析、机器学习以及人工智能等领域,收到越来越多编程人士的喜欢,也正因如此,在2018年7月的编程语言排行榜中,python超过Java成为第一名。
二、Python的安装与下载
这里介绍的没有选择下载官方的Python版本,而是下载了Python的一个开源版本Anaconda。之所以选择Anaconda是因为它对刚开始学习Python的人实在是太友好了。众所周知,Python有很多现成的库可以供你直接调用,但是在调用之前要先进行安装。如果下载Python官方版本,则需要手动安装自己需要使用的库,但是Anaconda自带一些常用的Python库,不需要自己再安装库。现在就来看一下Anaconda的具体安装流程。
1、安装教程
Step1:查看自己电脑的系统类型是32位操作系统还是64位操作系统,如下图所示,选择的是64位操作系统。
Step2:进入官网(Anaconda),单击右上角的Download按钮,如下图所示:
Step3:根据电脑系统类型(Windows/masOS/Linux)选择对应的软件类型,如下图所示:
Step4:选择Python版本。因为在2020年之后官网就不再支持Python 2了,所以建议大家选择Python 3,下面展示的代码也是基于Python 3的,然后根据电脑操作系统位数(32Bit/64Bit)选择对应的版本,如下图所示:
Step5:下载后保存到电脑里,如下图所示:
Step6:双击安装包打开后进行安装,如下图所示一次单击相应的按钮:、
Step7:安装路径选择默认路径即可,不需要添加环境变量,然后单击Next按钮,并在弹出的对话框中勾选相应的选项即可。
Step8:等待下载完成后,继续单击Next按钮,如下图所示:
Step9:单击并勾选如下图所示按钮:
Step10:完成上述操作后再电脑开始界面就会见到如下图左侧所示的几个新添加的程序,这就表示Python已经安装好了,单击Jupyter Notebook打开,会弹出一个黑框(如下图右侧所示),按Enter键后会让你选择用哪个浏览器打开,建议选择Chrome浏览器。
Step11:当你看到如下图所示的界面时,表示环境已经配置好了。
2、IDE与IDLE
程序编写的步骤如下图所示:
在程序运行过程中,首先需要一个编辑器来编写代码。编写完代码以后需要一个编译器把我们的代码编译给计算机,让计算机执行。代码在运行过程中难免会出现一些错误,这个时候就需要用调试器去调试代码。
IDE是英文单词Integrated Development Environment的缩写,表示集成开发环境。集成开发环境是用于提供程序开发环境的应用程序,该程序一般包括代码编辑器、编译器、调试器和图形用户界面等工具。IDE包含了程序编写过程中要用到的所有工具,所以我们一般在编写程序的时候都会选择用IDE。
IDLE是IDE中的一种,也是最简单、最基础的一种IDE。当然了,IDE中有很多种IDLE,例如Visual Studio(VS)、PyCharm、Xcode、Spyder、Jupyter Notebook等。
现在的数据分析领域,大家用的比较多的还是
打开Jupyter Notebook后单击右上角的New按钮,在下拉列表中选择Python 3选项来创建一个Python文件,也可以选择Text File选项来创建一个.txt格式的文件,如下图所示:
当你看到下面这个界面的时候就表示你新建了一个Jupyter Notebook文件
2、运行你的第一段代码
如下图所示,在代码框中输入一段代码print(”hello world”),然后单击Run按钮,或者按Ctrl+Enter组合键,就会输出hello world,这就表示你的第一段代码运行成功了。当你想换一个代码框输入代码时,你可以通过单击右上角的“+”按钮来新增代码框
3、重命名Jupyter Notebook文件
当新建一个Jupyter Notebook文件时,该文件名默认为Untitled(类似于Excel中的工作簿),你可以单击File>Rename对文件进行重命名,如下图所示:
4、保存Jupyter Notebook文件
代码写好了,文件名也确定了,这个时候就可以对该文件进行保存了。保存的方法有两种。
方法一,单击File>Save and Checkpoint保存文件,但是这种方法会将文件保存到默认路径下,且问价格式默认为ipynb,ipynb是Jupyter Notebook的专属文件格式。
方法二,选择Download as选项对文件进行保存,它相当于Excel中的“另存为”,你可以自己选择保存路径及保存格式,如下图所示:
5、导入本地Jupyter Notebook文件
当收到ipynb文件时,如何在电脑上打开该文件呢?你可以按Upload按钮,找到文件所在的位置,从而将文件加载到电脑的Jupyter Notebook文件中,如下图所示:
这个功能和Excel中的“打开”是类似的,如下图所示。
6、Jupyter Notebook与 Markdown
Jupyter Notebook的代码框默认是code模式的,即用于编程的,如下图所示。
你可以把Jupyter Notebook代码框的模式切换为Markdown模式,这个时候的代码框就会变成一个文本框,这个文本框的内容支持Markdown语法。当你做数据分析的时候,可以利用Markdown写下分析结果,如下图所示。
这也是Jupyter Notebook受广大数据从业者欢迎的一个原因。
7、为Jupyter Notebook添加目录
目录的作用是使对应的内容便于查找,一般篇幅比较长的内容都会有目录,比如书籍、毕业论文等。当一个程序中代码过多时,为了方便阅读,也可以为代码增加一个目录,下图左边框中的内容就是目录,你可以通过单击目录跳转到相应的代码部分。
目录不是Jupyter Notebook自带的,需要手动安装,具体安装课程如下。
Step1:在Windows搜索框中输入Anaconda Prompt并单击打开,如下图所示。
Step2:输入 pip install jupyter_contrib_nbextensions 然后按 Enter 键运行,安装jupyter_contrib_nbextensions模块,如下图所示。
Step3:程序运行中途会出现 y/n 的选项,输入 y 并按 Enter 键运行,直到出现Successfully installed的提示,如下图所示:
Step4:在Step3的基础上继续输入jupyter contrib nbextension install --user然后按Enter键进行用户配置,如下图所示。
Step5:等Step4完成后,打开Jupyter Notebook会看到界面上多了Nbextensions选项卡,如下图所示:
单击Nbextensions选项卡打开,勾选Table of Contents(2)复选框,如下图所示:
Step6:这个时候打开一个已经带有目录的ipynb文件,就会看到主界面多了一个方框内的按钮(如下图所示),但是仍然没有目录。
按下图右上角方框内的按钮,目录就会显示出来了,如下图所示:
Step1~Step6位Jupyter Notebook创建了目录环境,下面介绍如何新建带有目录的文件。
Step1:将代码框格式选择为Heading,如下图所示:
Step2:直接在代码框输入不同级别的标题,1个#表示一级标题,2个##代表二级标题,3个#代表三级标题(注意,#与标题文字之间是有空格的),标题级别随着#的数量增加而一次递减。
Step3:运行Step2的代码块,就可以得到如下图所示的结果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09