Python3 大作战之 encode 与 decode 讲解 -CDA数据分析师官网

Python3 大作战之 encode 与 decode 讲解

2018-02-06

Python3 大作战之 encode 与 decode 讲解

大家好，很久没更新了，也是年底了最近比较忙，同时也在研究python的其他内容，毕竟是python小白，自学道路艰难。

好了今天和大家一起探讨下python3编码过程中对的一些转码事宜。
python3中对文本和二进制做了比较清晰的区分。python3默认编码为unicode，由str类型进行表示。二进制数据使用byte类型表示，所以不会将str和byte混在一起。在实际应用中我们经常需要将两者进行互转，有几点需要注意：

1、字符串通过编码转换为字节码，字节码通过解码转换为字符串
str--->(encode)--->bytes，bytes--->(decode)--->str

import sys
print('目前系统的编码为：',sys.getdefaultencoding())
name='小明' print(type(name))#首先我们来打印下转码前的name类型，因为它是str，所以可以通过encode来进行编码 name1=name.encode('utf-8')
print(name1)
输出为：
目前系统的编码为： utf-8
<class 'str'>
b'\xe5\xb0\x8f\xe6\x98\x8e'

这里大家或许会有一个疑问，编码utf-8为什么不是decode转成unicode
因为开头跟大家讲过，python3默认就是unicode，utf-8可以看成是unicode的一个扩展集，所以其实name本身是一个unicode编码的，所以可以通过encode编码成utf-8，这里可以试下，如果认为name应该是utf-8，那我们来试下encode会不会报错
name1=name.decode('utf-8')
print(name1)
这里会报如下错误：
AttributeError: 'str' object has no attribute 'decode'
所以，对于python3默认的就是unicode编码。
既然已经encode成utf-8了，那我们来看下decode会出现什么样的结果
name2=name1.decode('utf-8')
print(type(name2))
print(name2)
这里要跟大家说下，decode()括号中为什么写utf-8，而不写gbk，可以这样理解，因为要解码，你总得告诉它我是什么编码的吧，比如我原先是utf-8格式的编码，现在要解码，但是如果冒充utf-8，说自己是gbk，那就会出现乱码，见下：
<class 'str'>
<class 'str'>
灏忔槑
另外如果大家encode()和decode()括号中不写编码格式,系统会默认为utf-8，大家可以试下。
2：utf-8编码格式和gbk编码格式互转
既然知道utf-8编码与解码的规律，那我们来试试它与gbk之间的火花。
name1=name.encode('utf-8')
name2=name1.decode('utf-8')
name3=name2.encode('gbk')
name4=name3.decode('gbk')
print(type(name3))
print(name3)
下面是name3的结果
<class 'bytes'>
b'\xd0\xa1\xc3\xf7'
下面是name4的结果
<class 'str'>
小明
从上面可以卡出name2本来是解码成utf-8的，后来有队name2进行了gbk编码，接着又再次对name3进行gbk解码
所以不难看出，其实utf-8和gbk之间都是通过unicode来做一个中间转换的操作
在例子中
name2=name1.decode('utf-8')
name3=name2.encode('gbk')
这两步的操作就是通过unicode来转的

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

python

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python使用chardet判断字符串编码的方法

下一篇大数据告诉你旅行青蛙饲养员的秘密

Python3 大作战之 encode 与 decode 讲解

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...