再下一城,微软和阿里巴巴开发的人工智能在阅读理解测试中首次击败人类

它们已经在国际象棋和围棋上打败我们,合写了一张欧洲流行乐(Europop)专辑。现在,电脑又进军一个非常人性的领域:阅读理解测试,世界各地学生的苦难源头。
阿里巴巴(Alibaba)周一宣布,其人工智能在一项全球阅读理解测试中表现优于人类。该项测试提出的艰深问题包括:“尼古拉-特斯拉(Nikola Tesla)是什么种族的人”,以及“亚马逊雨林有多大?”
司罗是阿里巴巴数据科学研究院(iDST)的自然语言处理首席科学家,他把机器取得的这个胜利称为一个里程碑,称该技术有很多用途,从客户服务、博物馆讲解,到医疗查询,其中一些在全球范围已经由聊天机器人处理。
在上周进行的测试中,参赛公司让各自的人工智能系统解答斯坦福问答数据集(Stanford Question Answering Dataset)的提问,该数据集评估阅读理解能力。计算机的答案被与普通人的答复进行比较,然后据此排名。
美国软件巨擘微软(Microsoft)与阿里巴巴并列首位,后者是一家从电子商务起家的中国科技集团,如今与国内外同行一样,加大对人工智能的研究投入,其中大部分是通过其研究机构投入。
尽管微软和阿里巴巴以微小优势胜出,在回答的精确匹配度上仅比人类的82.3%高出几个基点,但它们并列首位为美国和中国正在进行的人工智能军备竞赛提供了合适的象征。
中国力求利用来自其14亿人口(其中有7.3亿上网)的海量数据和雄厚财力,在创建被视为下一场工业革命的1500亿美元产业方面超越美国。人工智能已经广泛应用于各个领域,从无人驾驶汽车到定制新闻推送。
尽管中国的努力是由政府带领的,它也在培育本土科技巨头,包括百度(Baidu)、阿里巴巴和腾讯(Tencent),以求超越美国。
百度更早投入人工智能的研究,目前在自主驾驶方面领先于竞争对手,其中一些成果在上周于拉斯维加斯举行的消费电子展(CES)上亮相。腾讯旗下的社交媒体应用微信(WeChat)号称拥有近10亿月活跃用户,该公司和阿里巴巴都已在定制新闻和广告等业务中采用人工智能,并投资于新领域。
阅读技术依赖于精读文本,比如维基百科(Wikipedia)的文章,以学习和模仿信息。类似的技术已被用于买家提出的常见问题(比如“我的包裹在哪里?”)。在阿里巴巴的光棍日购物节期间,这类问题会大量涌入。

  译者/和风,来源:新浪科技

KMC注:

斯坦福问答数据集:SQuAD

斯坦福问答回答数据集(SQuAD)是一个阅读理解数据集,从维基百科(Wikipedia)中提炼出的问题组成,每个问题的答案都是相应段落的一段文本。在500多篇文章中有超过10万个问答对。

介绍和下载地址:https://rajpurkar.github.io/SQuAD-explorer/ 

百度也有一个类似的数据集:百度的中文问答数据集WebQA

下载地址在这里:http://idl.baidu.com/WebQA.html

@关注中国知识管理中心公众号:KMCenter 

发送“1”可以获取大量高效学习、企业知识管理、个人成长文档、PPT

报告:

《知识库建设与运营宝典(2018版)》报告

《如何选择知识管理系统(2018版)》报告

免费电子书

免费《田志刚企业知识管理实施的正确姿势》

免费下载电子书《这样理解知识管理》

推荐连接

1、《卓越密码:如何成为专家》主页

2、知识管理专家田志刚主页

发表评论

电子邮件地址不会被公开。 必填项已用*标注