文章目录
- 摘要
- 1 简介
- 2 相关工作
- 2.1 无监督的基于特征的方法
- 2.2 无监督微调方法
- 2.3 从监督数据中迁移学习
- 3 Bert
-
- 4 实验
- 4.1 GLUE
- 4.2 SQuAD v1.1
- 4.3 SQuAD v2.0
- 4.4 SWAG
- 5 消融研究
- 5.1 预训练任务的效果
- 5.2 模型大小的影响
- 5.3 BERT 基于特征的方法
- 6 结论
- 6 结论
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!