作者档案:特雷弗·考克斯

恐怖谷:声音也会这样吗?狗万2017

Android回答Q2:这是你的恐怖谷吗?狗万2017(照片 马克斯·布劳恩
CC冲锋队2.0)

狗万2017机器人看的时候会发生什么几乎但某些特征不是相当右:也许眼睛太大了,或者看起来没有生气,或者这张脸结合了人类和人工的特征,创造了一个噩梦版的土豆头先生。[1]这一现象甚至被用来解释动画电影中令人毛骨悚然的角色的失败极地特快。人工声音存在恐怖谷吗?狗万2017一个及时的问题引发了合成语音的兴起,如智能助手。

什么是恐怖谷?狗万2017

这个短语是那位日本教授发明的Masahiro Mori在1970年代。森勾勒出了如下图,这表明了人们对机器人的亲近感是如何随着机器人与人体的亲密程度而变化的。想象一下,从一个明显是机械的工业机器人开始,然后逐渐改变它的特征,使它变得越来越像人(在图上右移)。森预测在某一时刻,就在机器人完全变成人类之前,亲和会转变为反感。因此,该图显示了形成恐怖谷的急剧下降。狗万2017请注意,这张图是对可能发生的情况的简化。例如,一个接近人类的机器人完全有可能带来欢乐,而不是不安的[2],但我要把重点放在人们感到不安的时候。

Smurrayinchester,基于图像 森雅博和卡尔·麦克道曼CC BI-SA 3。0

“恐怖谷”现象被归因于两种效应,这两种效应得到了实验证据[3]的支持。狗万2017一个是存在非典型的特性。例如,你可能在机器人上有一个逼真的人头(见下图)。另一个影响是类别模棱两可,很难确定一个东西是人还是机器人(比如页面顶部显示的Android Repliee Q2)。


艾伯特葫博机器人。狗万manbetx官网图片由 英语维基百科的Dayofid,由2.5 CC。

不可思议的合成语音

我们会得到一个合成声音的恐怖谷吗?狗万2017当说话者的形象和声音同时出现时,这似乎是可能的。这样就有可能在视觉和听觉模式之间产生不一致。这种怪异可能是由于面部动作和声音有点不同步,或者是机器人的声音太人性化[4,5]。

但声音本身又如何呢?我还没有找到任何证据。可能是制造合成声音的技术还不够好,不足以让我们跌入谷底。但我不相信这种说法。在很多合成样本中,说话的人几乎都是人,只是偶尔会出现小故障,但这似乎并没有引起反感。也许非典型性更明显,我们用一段清晰的合成语音加上人类发出的奇怪的声音。这将是一个声音相当于阿尔伯特胡波机器人(一个未来的实验?)也许声音中没有反感是因为某种更明显的东西。狗万manbetx官网阿尔伯特·胡波机器人的图片令人不安,因为它看起来像一个真人被斩首并被卡在机器上。狗万manbetx官网很难想象有一种声音能与之媲美(不涉及图像)。

那么恐怖谷的另一种机制是什么呢?狗万2017分类歧义?我的经验是,如果我发现合成语音有问题,这一类别只是从人类转向了人工。另一种反应是假设在声音到达耳朵之前就有东西扭曲了声音,毕竟,我们已经习惯了听到手机和Skype发出的刺耳声音。也许没有感到不安是因为含糊不清不会导致不愉快的联想。上面的机器人回答Q2看起来好像出了什么问题,她生病了,或者可能没有完全活着。不完美的合成语言永远不会听起来像一个病入膏肓的人临终前说的最后一句话!

我想得越多,我越怀疑改进的合成语音会导致恐怖谷。狗万2017有很多技术可以用来修改电影的声音,电视,游戏,收音机,等。我们都听过很多例子,人类的声音被改变和增强,使他们听起来不那么像人类。比如怪物,外星人和机器人几乎都是先由人类演员配音,然后再进行大量的音频处理。我想不出有哪个例子能和上面Android Repliee Q2的照片产生同样令人毛骨悚然的效果,然而,仅仅从声音上。考虑到电影中仁慈力量毁灭人类的比喻,我相信如果有办法利用声音的恐怖谷狗万2017一个声音设计师会在广播剧中找到这样做的方法。

你觉得怎么样?你是否曾遇到过声音不真实的恐怖谷?狗万2017这样的事情可能存在吗?请在下面评论。

参考文献

[1]Katsyri,J。,伪造者,K。Makarainen,M。Takala,T。2015.关于不同恐怖谷假说的经验证据综述:支持知觉不匹配是通往恐怖谷的一条路。狗万2017心理学领域,6,p.390。

[2]Makarainen,M。Katsyri,J。,伪造者,K。Takala,T。2015年,9月。有趣的山谷:对陌生事物的积极情绪反应的研究。狗万2017在第十九届国际心灵旅行学术会议论文集(页。175 - 181)。ACM

[3]海峡,该调查。Floerke,V.A。居,W。马多克斯,K。Remedios法学博士,荣格,年报和>H.L。2017.理解神秘:非典型的特征和模糊的类别都会引起对类人机器人的反感。心理学领域,8,p.1366。

[4]Tinwell,一个,格里M。和伊斯兰教的先知,D。一个,2015.“视听语言的不同步和虚拟人物的恐怖谷效应”。狗万2017国际机械和机器人系统杂志,2 (2),页。97 - 110。

[5]米切尔,W。J。,Szerszen Sr,K。一个,陆,一个。年代,Schermerhorn,P。W。Scheutz,M。MacDorman和,K。F。2011.“人脸和声音的现实主义的不匹配产生了一个恐怖谷”。狗万2017i-Perception,2(1),页。10 - 12。

广告