社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

文化

#Topic:简化版的图灵测试中,你选哪个单词证明你区别于机器?

刘璐天2018-11-23 15:14:58

一些认知科学家相信,思考这个问题有助于建立我们对于 AI 的基本认知,同时也会让我们对自身有出乎意料的认识。

1950 年,图灵提出了那个关于判断机器是否能够思考的著名试验:让一个人使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。这两个对象包括一个正常思维的人和一个机器。如果经过若干询问以后,这个人仍然无法分辨测试对象的不同,那么测试对象中的机器就通过了图灵测试。

麻省理工大学教授 John McCoy 发表在《实验社会心理学杂志》(Journal of Experimental Social Psychology)上的一篇论文“A Minimal Turning Test”,试图将这个试验简化:在图灵测试中,如果只允许使用一个英语单词来表达你是区别于机器的人,你会选择哪个单词?

尽管这个设问看上去很简单,但一些认知科学家相信,思考这个问题有助于建立我们对于 AI 的基本认知,同时也会让我们对自身有出乎意料的认识。在聊天、写作、翻译机器人越来越常见的今天,这个问题其实也相当实际:如何判断与我们聊天的客服是真实的人,而不只是一个模式化的算法?如何判断一部小说是由人呕心沥血写出来的,而不是某台机器的随意之作?

John McCoy 在他的研究中共设置了两个阶段的实验。在第一阶段,他和同事 Tomer Ullman 邀请 1000 多位实验参与者回答上面那个问题,随后分析回答中是否有什么共性。

结果显示,排名前 10 位的单词包括:Love(134 人)、Compassion(33 人)、Human(30 人)、Please(25 人)、Mercy(18 人)、Empathy(17 人)、Emotion(14 人)、Robot(13 人)、Humanity(11 人)以及 Alive(9 人)。

让 John McCoy 最感到吃惊的是,个体回答在这个问题上的重合率如此之高。回答 Love 一词的人数占比高达 10%,四分之一的参与者都选择了排名前四位的单词之一。此外,从类别来看,人们最倾向于使用表达人类生理机能(如 poop)、信仰和慈悲心(如 mercy 或 hope)、情感(如 empahty)以及食物(如 banana)的词来显示自己与机器的不同。

在实验第二阶段,John McCoy 想要测试这些被人们挑选出来的词汇是否真的能有效实现他们的目标:将自己区别于机器。于是他把最热门的几个单词两个一组拼凑成不同组合,如“human”和“love”,让第二组实验参与者判断哪个来自人,哪个来自机器。

事实证明,“Love”的确是成功率最高的词汇之一。不过,排名第一的并不是它,而是“poop”(拉屎)。尽管在日常交际中“poop”是一个禁忌词,但说出禁忌显然比单纯描述某种感情要更能表现人性那一面。

还有些让第二组实验者感受到人性的词汇也和以上逻辑类似,不局限于其字典释义,而更因其触发了某种情感反应。比如“Moist”(潮湿)、“please”(请)以及“onomatopoeia”(意为“拟声词”,单纯是五个音节的发音令人感到愉悦)。

这些测试结果也同时反映了 AI 目前的现状。尽管机器可以写出基本的描述性语句,甚至具有简单情节的短篇小说,它们仍然很难表达幽默感和讽刺。

John McCoy 认为这个简化版的图灵测试还可以延伸出更多细分版本,帮助人们了解他们对不同人群的看法:如果要证明你是一名女性,你会选什么词?如果要证明你是一名中国人,又会用什么词?无论如何,这些选择会揭示出群体内部的某种共识与外部理解之间的那道间隙。

对了,John McCoy 本人在这次研究中最喜欢的一个词是“err”(呃……)。

题图来自电影《模仿游戏》剧照

喜欢这篇文章?去 App 商店搜 99uu在线娱乐日报 ,每天看点不一样的。