Python——文本中读取到【\ufeff】解决方案

问题描述

['\ufeff诗名', '贼退示官吏并序\n']

问题分析

文本保存时包含了BOM(Byte Order Mark,字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码)

解决方案

方法一:

使用 utf-8-sig 编码打开文件

name = []
with open('唐诗宋词.txt', 'r', encoding='utf-8-sig') as f:for i in f:fen = i.split(':')print(fen)if fen[0].strip() == '诗名':name.append(fen[1].strip())print(name)

['诗名', '贼退示官吏并序\n']
['贼退示官吏并序'] 

方法二:

通过NotePad++等文本编辑器转编码为UTF-8无BOM格式编码 

参考文章

产生 \ufeff 问题的原因及解决办法


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部