今晚直播 | 微软亚洲研究院徐毅恒:预训练时代下的文档智能



「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 AI Drive,我们邀请到微软亚洲研究院自然语言计算组实习生徐毅恒,为大家带来预训练时代下的文档智能专题直播。对本期主题感兴趣的小伙伴,今晚 7 点,我们准时相约 PaperWeekly B 站直播间。
直播信息
文档智能是一种旨在针对富文本文档进行理解并抽取其中非结构化信息的技术。LayoutLM 的成功证明了针对文本和布局进行预训练的有效性。在此基础上,我们提出了多模态预训练模型 LayoutLMv2 及其多语言扩展 LayoutXLM,通过对文本、布局和图像进行联合预训练,进一步提高了模型的性能,在多项任务中取得了新的突破。
LayoutLMv2:
https://aclanthology.org/2021.acl-long.201/
开源代码:
https://aka.ms/layoutlmv2
LayoutXLM:
https://arxiv.org/abs/2104.08836
开源代码:
https://aka.ms/layoutxlm
文档智能综述:
https://www.microsoft.com/en-us/research/publication/document-ai-benchmarks-models-and-applications-in-chinese/
本次分享的具体内容有:
文档智能背景以及 LayoutLM
LayoutLMv2:新一代多模态文档理解模型
LayoutXLM:针对多语言文档的扩展
文档智能前沿综述
嘉宾介绍

徐毅恒 / 微软亚洲研究院实习生
徐毅恒,微软亚洲研究院自然语言计算组实习生,研究方向为自然语言处理和多模态文档理解。目前在 KDD, ACL, COLING 等国际会议发表论文。
直播地址 & 交流群
本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道。
B 站直播间:
https://live.bilibili.com/14884511

合作伙伴


????
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
·

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
