pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx

csv文件原本以utf-8编码形式保存,但是中间我用wps打开编辑了,然后再用pandas读取发现报错:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 59: invalid start byte

之后我 设置 read_csv() encoding='gbk',发现又报错了:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 51329: invalid start byte

之后我尝试了设置  encoding='utf-8-sig'   encoding = ‘gb2312’   encoding='gb18030'  encoding="ISO-8859-1" 等等,发现还是报错UnicodeDecodeError

我又在文件顶部声明:

# -*-coding:utf-8-*-

声明文件为utf-8编码格式,还是不行,最后用vscode打开该csv文件从新以utf-8编码保存,Bug解决。这个Bug是由于多个软件(我用了wps)先后编辑导致编码混乱,重新用编辑器(vscode、pycharm等等)以uft8或者gbk编码从新保存就行了。

 

 


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部