Python文本解析之字符统计与词频排序
一、文本字符统计
fr = open('兰亭集序.txt','rt',encoding='utf-8')
fw = open('兰亭集序-字符统计.txt','wt',encoding='utf-8')
txt_str = fr.read().strip().strip('\n')#不统计空格和回车'\n'#遍历文本字符串,把字符、数量写入字典键值对
#把字符、数量分别存入列表
##key_list = []
##value_list = []
txt_dict = {}
parse_ls = []
for item in txt_str:if item not in txt_dict.keys():
## key_list.append(item)#列表为可变数据类型
## value_list.append(txt_str.count(item))txt_dict[item] = txt_str.count(item)else:continue
else:print('统计完成!')#是否有把2个列表的元素赋给字典{key:value}={字符:数量}的方法?
#txt_dict[key_list] = value_list#统计结果写入csv
for key in txt_dict:parse_ls.append("{}:{}".format(key,txt_dict[key]))
fw.write(','.join(parse_ls))
print('写入完成!')
fr.close()
fw.close
二、文本词频排序
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
