知识图谱在e成科技人才搜索引擎中的应用

背景介绍

人才搜索引擎是e成科技企业服务中的重要组成部分,为用户提供人才库搜索服务。e成科技早期的搜索引擎主要依赖于term weight、bm25等传统的信息检索相关技术,在语义匹配方面相对薄弱,而随着e成科技人力资源知识图谱的落地,搜索引擎引入知识图谱相关数据在效果上获得较大提升。

知识图谱

e成科技的知识图谱主要组成部分是实体(entity)和实体间关系,实体类型主要有职能、技能和行业等, 实体关系主要为上下位关系,基于整个graph,可以训练出每个entity的embedding。

人才搜索引擎的主要模块

人才搜索引擎主要有以下几个主要模块组成:

Query understanding:

query理解的主要工作包括对query切词,以及基本的短语识别,去除停用词,并通过NER和分类算法进行tagging,以及通过word重要性模型weighting,知识图谱落地后,NER识别后还需要通过实体链接将识别出的term/phrase对应到graph中的相应实体id。

Talent document understanding:

同样对于简历和人才画像等特征,通过识别和实体链接实体id的集合。

Match:

通过匹配模型计算query和document的match score。

Rank:

结合match模块的相关特征以及文档时效性,用户招聘偏好等特征基于pairwise的LTR模型得到document的排序。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部