KDD 2020首届时间检验应用科学奖公布,清华大学研究团队获奖
异质网络建模
学术网络建模对于任何搜索或建议任务都是至关重要的。传统上,信息通常是基于“词袋(BOW)”模型来表示的。
AMiner 提供的核心服务是专家搜索,即根据用户查询的话题找出在相关领域的权威专家。因此,仅仅依靠关键词进行专家匹配,几乎无法返回有效的结果。而如果我们知道自然语言处理领域的权威会议是“ACL”等,根据研究者发表的会议信息,就可以很容易判断出他是否是该领域的权威专家。
因此,作者提出了一个统一的主题模型 ACT,同时对研究者论文、作者和会议的主题进行分布建模,设计了一种可以有效地利用学术网络的异质实体与关联信息,来发现领域内专家方法。
文章提出主题模型 ACT 对研究者异质信息网络统一进行建模,从中估计出不同类型的实体,包括研究者、会议、关键词以及论文在不同隐含话题上的概率分布。
图4 构建话题模型生成研究者异构信息网络
ACT1 模型:每位作者与主题上的多项式分布相关联,并且论文中的每个单词和会议标记都是从抽样的主题中生成的。
ACT2 模型:每个“作者-会议”对都与主题上的多项式分布相关联,然后从采样的主题中生成每个单词。
ACT3 模型:每位作者都与一个主题分布相关联,并且在为论文中的所有单词标记采样主题之后,生成会议标记。
有了这些概率分布,当用户给定一个查询词,就可以推断与之概率分布相近的专家,进而还可以推断出相关的会议和论文等异构网络中存在的各种实体类型。
学术搜索服务
为验证模型的有效性,作者将 ACT 模型分别应用于专业知识搜索与关联搜索中。
表 1 给出六种基线搜索方法的性能比较(%)
表1的数据表明,作者提出的方法在专家检索方面的性能明显优于基线方法。
在研究者关系路径搜索的实验中,论文中提出的方法可以在一个由研究人员组成的网络上,在不到 3 秒的时间,找到链接两个研究者的最短的路径。
另外,作者所提出的模型还可以支持许多其他应用,如作者兴趣发现和学术建议。
图片新闻
最新活动更多
-
5月10日立即下载>> 【是德科技】精选《汽车 SerDes 发射机测试》白皮书
-
5月16日火热报名>>> OFweek锂电/半导体行业数字化转型在线研讨会
-
5月22日立即报名>>> OFweek 2024新周期显示技术趋势研讨会
-
5月28日立即观看>> 【在线研讨会】Ansys镜头点胶可靠性技术及方案
-
5月31日立即报名>> 【线下论坛】新唐科技2024未来创新峰会
-
6月18日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
- 1 拆机实锤!华为Pura70使用新芯片,推测为7nm,性能如何?
- 2 华为P70系列即将强势来袭,能否再次复制华为Mate60系列的辉煌?
- 3 中国芯片基地诞生:一年产量1055亿颗,占全国30%,三省共占67%
- 4 华为麒麟9010、苹果A17、高通8Gen3对比,差距有多大?
- 5 避免内卷?中国大陆4大芯片代工厂,产能、营收、优势介绍
- 6 形势严峻!暴增256%,中国还在疯狂进口ASML光刻机
- 7 过去14个月,山东从荷兰进口了12台光刻机
- 8 华为Pura70又打脸了?美国商务部长:华为芯片没那么先进
- 9 MTK和Intel联手,投资RISC-V芯片新贵谋发展?
- 10 华为Pura70证明:我们7nm已没问题,接下来是5nm、3nm
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论