解决error:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0
参考:
https://www.cnblogs.com/Alier/p/6794719.html
代码:
stopwords = pd.read_csv("stopwords.txt",index_col=False,quoting=3,sep=" ",names=['stopword'],encoding='UTF-8')
报错:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0
Python 编码中编码解码的问题,我这个错误就是‘utf-8’不能解码位置0的那个字节(0xa1),也就是这个字节超出了utf-8的表示范围了
解决办法:
stopwords = pd.read_csv("stopwords.txt",index_col=False,quoting=3,sep=" ",names=['stopword'],encoding='gb18030')
也就是在读取数据的时候,显式添加编码方式encoding='gb18030',别的编码也可以试试哟
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
