Bilibili 字幕语料库

文章目录

      • 0 背景
      • 1. 方案汇总
      • 2. 可行性分析
        • 2.1 tessertart-OCR
        • 2.2 音频抽取转换
        • 2.3 自有字幕文件
      • 3. 字幕语料库构建
        • 3.1 获取弹幕信息
        • 3.2 转码处理
        • 3.3 转换处理
      • 4. 语料库建设
        • 4.1 构建模型
        • 4.2 测试模型
      • 5. 预期收益

0 背景

近期在观看 Bilibili 视频的时候,发现一些 UP 主的视频从内容上来看都很精良,但却似乎少了点什么,粉丝量,播放量都上不去。想了想,是文案!按我的理解,大部分同类型同题材的 UP 主的文案都是类似的,撇开文案版权的问题(毕竟,读书人的事嘛[旺柴][旺柴][旺柴],怎么


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部