2018-10-17
阅读量:
1386
mac电脑使用python导入数据编码问题解决
问:mac电脑在使用pandas导入数据的时候,有时候会出现中文乱码问题,如图,怎么办?
答:一般在导入数据时,把格式调成python是可以成功导入的。使用参数:engine=‘python’。但是由于编码不同的原因,mac电脑使用不行。
加入参数 encoding=‘utf-8’还是不能成功导入,说明里面存在非‘utf-8‘模式的编码。这时可以选择切换编码模式为 encoding=‘gbk’。
GBK即汉字内码扩展规范,K为扩展的汉语拼音中"扩"字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、
符号883个,并提供1894个造字码位,简、繁体字融于一库。GBK采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,
剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。P-Windows3.2和
苹果OS以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码。
97.1745
7
1
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论