2018-10-17
阅读量:
998
无法将数据导入python
首先,我们在拿到一份数据时,要先看一下数据的文件类型,根据文件类型选择相应的导入方法,除此之外每个文件导入还需要设置编码格式,一般默认为UTF-8,常用的编码格式有:gbk、unicode、ascii等,但是有些文件不一样,这个时候可以用encoding参数对编码格式进行更改,如下:该文件用我们一般的编码无法加载到python,我们可以用Notepad++查看编码格式,发现是Shift_JIS,所以可以用以下方式读取数据。
Shift_JIS是一个日本电脑系统常用的编码表。它能容纳全角及半角拉丁字母、平假名、片假名、符号及日语汉字。
它被命名为Shift_JIS的原因,是它在放置全角字符时,要避开原本在0xA1-0xDF放置的半角假名字符。
在微软及IBM的日语电脑系统中,即使用了这个编码表。这个编码表称为CP932。
6.8791
1
1
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论