Python对文本进行分句
1、根据标点符号对一段话进行分句
# 句子切分规则函数
import redef cut_sentences(content):# 指定切分标点pattern=r'\。|\!'sentences = re.split(pattern, content)return sentences# 输入内容
content = input("输入需要切分的正文:")
# 调用句子切分函数
sents0 = cut_sentences(content)
# 删除最后一个空值(如果存在)
del sents0[-1]
2、根据序号对一段话进行切分
import recountent = "1、一级标题2、二级标题3、三级标题"
# 切分规则,如果是其他序号,在[]中按顺序修改就好
sentence_list = re.split(u"[\d][、]", countent)
new_list = list(filter(None, sentence_list))输出:['一级标题', '二级标题', '三级标题']
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
