《学术小白学习之路12》进阶-基于Python实现中文文本的DTM主题动态模型构建

《学术小白学习之路》基于Python实现中文文本的DTM主题动态模型构建

  • 一、数据选择
  • 二、数据预处理
  • 三、输入数据ID映射词典构建
  • 四、文档加载成构造语料库
  • 五、DTM模型构建与结果分析
  • 六、结果进行保存
  • 七、保存模型

一、数据选择

所选取的数据集是论文摘要,作为实验数据集,共计12条数据信息。每一条代表一条数据信息
主要注意的是本文用的是txt的数据集,而且每一个文档用换行的符号进行划分。
获取的数据主要为中文的数据所以需要进行清洗处理

在这里插入图片描述

二、数据预处理

导入相应的库

#encoding=utf-8
from __future__ import unicode_literals
import sys
sys.p


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部