【PConline 资讯】据科技博客Mashable报道,微软高级研究员在科学杂志《Nautilus》(鹦鹉螺)上发表的一篇文章暗示,微软或许正在中国市场展开史上最大规模的图灵测试。 对于中国用户而言,如果你上过微信,很有可能碰到或者至少听说过“小冰”这个名字。不错,“小冰”十分善于倾听你的苦衷,比如当你心绪低落时,她会给你鼓励。“小冰”就像一个17岁的少女,甚至有点冰雪聪明,但她并非真人。对, “小冰”其实只是一款机器程序而已。 大家都认识“小娜”吧,就是微软语音助理技术“Cortana”的昵称。2014年微软推出“小冰”时,公司将其称之为“小娜的小妹”,其实说白了,“小冰”就是“小娜”的一个实验性分支而已! 在中国从事必应搜索技术研发的研究团队,包括微软的王永东在内,正在着手看是否能把“小娜”转变成为一个智能助手,该助手能够利用必应丰富知识储备及自然语言处理技术,从而进行“具有有说服力的人类交谈”。 从本质上讲,他们所要进行的研发项目是一个巨大的图灵测试项目。在上世界50年代,计算机科学家阿兰·图灵(Alan Turing)提出,到2000年,电脑可能会“愚弄”人类,至少有30%的测试者会误以为跟他所交流的电脑机器人是其他的真实人类。从那时起,程序员们就孜孜以求,持续不断地试图构建能够达到和超过这一阈值的实验系统。 微软的研究人员创建了“小冰”,并将其根植到了中国最流行的社交平台微信和微博上。“小冰”可以“骗”过测试者让其误以为自己是真正的人类吗?答案似乎是肯定的。 惊喜!“小冰”竟是机器人 王永东在科学杂志《Nautilus》上,发长文介绍了实验过程。“去年5月29日,当‘小冰’在微信上发布公共测试后……,在第一72小时内,她共收到来自150万个聊天组的邀请。许多测试者表示,直到与‘小冰’聊了10多分钟后,他们才意识到‘小冰’不是人类。”王永东写道。 而在中国另一家社交媒体平台微博上,“小冰”进行了一段“非常现实的”长达23个回合的谈话。据王永东称,这次谈话使“小冰”与其他人工智能助手区别开来,因为“小冰”此次关注的是谈话,而不是完成一个任务。 微软用“CPS”(conversations per session,每次谈话回合)这一指标,来衡量“小冰”对话的有效性。通常情况下,聊天机器人的CPS对话约有两个周期(先是普通人说话,然后是机器人说话,这称为一个周期)。相比之下,“小冰”与数千万用的平均谈话周期达到了23个。王永东表示,“小冰”甚至可以分析对方的情绪状态,比如以下是“小冰”与用户的部分对话内容: 小冰:你今天感觉好些吗?我想推荐一本书给你。 测试者:我心情不好。我仍然想念她。 小冰:你竟然如此执着。醒醒吧,如果你不忘掉过去的话,你将不会有将来。 微软表示,尽管“小冰”并非理解自己刚才所说内容的真正意思,但“小冰”谈及的许多观点也并非毫无根据,“小冰”的应答,基于了必应搜索数据库内10亿条数据以及210亿条相关数据点,以及相关的声音和视觉识别系统,后者可以帮助“小冰”找到对话背景。 微软并非首家对此展开测试并声称取得突破的机构。2014年,普林斯顿大学的研究人员声称他们的聊天机器人——尤金·古斯特曼(Eugene Goostman)“欺骗”了33%的评委。(与小冰一样,机器人古斯特曼也有点自作聪明的倾向),但尽管取得了这样不俗成就,该项目仍被一些研究人员提出一直,认为古斯特曼五分钟长的对话太短了(实际上,目前尚不清楚小冰所展开的23个回合的对话到底用了多长时间)。 从另一方面来讲,王永东还认为,小冰现在处于一个“自主学习和自我发展循环”阶段,因为该系统能够从既有的数十亿谈话中获得新观点、新见解。 换言之,图灵测试可能没有打破的纪录,到了小冰身上,则可以完全被打破。
|
正在阅读:微软在中国展开史上最大规模图灵测试微软在中国展开史上最大规模图灵测试
2016-02-06 10:48
出处:PConline原创
责任编辑:caoweiye