pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx
csv文件原本以utf-8编码形式保存,但是中间我用wps打开编辑了,然后再用pandas读取发现报错:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 59: invalid start byte
之后我 设置 read_csv() encoding='gbk',发现又报错了:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 51329: invalid start byte
之后我尝试了设置 encoding='utf-8-sig' encoding = ‘gb2312’ encoding='gb18030' encoding="ISO-8859-1" 等等,发现还是报错UnicodeDecodeError
我又在文件顶部声明:
# -*-coding:utf-8-*-
声明文件为utf-8编码格式,还是不行,最后用vscode打开该csv文件从新以utf-8编码保存,Bug解决。这个Bug是由于多个软件(我用了wps)先后编辑导致编码混乱,重新用编辑器(vscode、pycharm等等)以uft8或者gbk编码从新保存就行了。

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
