登陆 免费注册 | 网站地图 设为首页
当前位置:| 主页>知识资讯>业界新闻>正文
百度松果计划再携中科院 提高知识图谱构建效率
如何获得丰富的数据对于百度这种大体量的互联网公司早已不是问题,现在亟待解决的问题变成了如何在庞大的数据中高效提取丰富的实体知识。

近日,百度“松果计划”启动了一个全新的合作项目,该项目将再次与中国科学院计算技术研究所联手,共同研究 “面向全网数据的知识图谱构建方法研究” 的技术课题。2015年百度互联网数据研发部就已与中科院计算所共同合作合作了名为“建立全自动知识数据生产系统模型的雏形”的松果项目,该项目支持精准问答下的人物职位问答、娱乐人物关系问答以及图谱中间页人物关系图谱的生成。此次与中科院的再度合作将在此基础上进行深入研究进一步扩大与提高知识图谱的应用范围与能力。

大数据时代,“如何高效提取知识数据”亟待解决

如何获得丰富的数据对于百度这种大体量的互联网公司早已不是问题,现在亟待解决的问题变成了如何在庞大的数据中高效提取丰富的实体知识。

对知识类数据的需求,大多数互联网产品都有,但目前,大多数互联网产品都有知识类数据的需求,但依据当前的技术,知识数据的提取较多地依赖于人工干预,造成了大量的人力、财力及时间等方面的消耗,同时在数据的挖掘源方面也仅局限于少量的网站。相对于千亿级别的中文网页如此庞大的数据量可以说是相差甚远。不仅如此,每天网页上的信息会持续更新,对这些新知识的提取与收录是知识生产系统面临的挑战。

正是基于对高效提取知识数据的需求,由百度互联网数据研发部(Web Data)主导,与国内数据挖掘领域顶尖的顶尖团队——中国科学院计算技术研究所正式展开“面向全网数据的知识图谱构建方法研究”的“松果计划”专项研究合作。本次研究课题将探索构建一个高效的知识数据全自动生产系统模型来优化处理知识数据,完成大规模数据生产,从而将单领域知识数据生产速度从月级降到周级,同时可以面向全网网页库产出亿级别可用的知识数据。

百度“松果计划”再次牵手中科院

百度与中科院合作已非首次,从百度开放研究计划第一届起,中科院就与百度有了深度合作。2015年,百度“松果计划”正式启动,旨在通过与学术界合作,开展有价值研究,产生更多有影响力的技术成果,推动科技进步与社会发展。百度与中科院的校企合作也顺势迈向了全新的高度,去年两者合作建立了全自动知识数据生产系统模型的雏形,已支持精准问答下的人物职位问答、娱乐人物关系问答以及图谱中间页人物关系图谱的生成。

本次合作研究输出的知识数据未来将可以直接运用于百度的产品中,例如百度搜索、度秘等。对这些产品将有三方面的提升,首先会扩大搜索信息覆盖量,支持精准问答下的直接回答,为用户直接提供搜索结果,使得搜索效率大大提升;其次,支持模糊类搜索query,使搜索过程中的交互体验更加自然顺畅,例如将提升用户和度秘之间的交流体验;最后,使搜索结果的摘要展现形式将更加丰富多样。


更多

声明:本版文章内容纯属作者个人观点,仅供参考!由于部分内容有网友发布,如果侵犯您的权益,请与我们联系,我们将第一时间删除。
最新评论:共有 0 位网友发表了评论
查看所有评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码: 匿名?
注册
相关文章
联系中国知识管理中心
版权所有 Copyright© 2003-2016 知识管理中心(Knowledge Management Center)
京ICP备05002111号