首页 >要闻 > 内容

观点:机器人用男声更合�

要闻 2021-12-19 16:26:11
导读 《纽约时报》近日撰文称,在人工智能技术火热的当下,无论是亚马逊的Alexa、微软的Cortana还是谷歌助手,这些人工智能语音助手都有着年轻的...

《纽约时报》近日撰文称,在人工智能技术火热的当下,无论是亚马逊的Alexa、微软的Cortana还是谷歌助手,这些人工智能语音助手都有着年轻的女性声音。由于传统的固有观念和偏见,用户倾向于让女性担任助理或秘书。因此,与男性声音相比,用户更喜欢个人智能助手服务有女性声音,但事实上,男性声音可以让用户意识到他们在和机器说话。

以下是原文内容:

非裔美国计算机科学教授杰森马尔斯也拥有一家科技初创公司。对于自己公司开发的人工智能手机应用在说话时的声音,他说:“听起来像一个热情的年轻白人女性。”

Mars说,每当你想推出一款成功的消费产品时,“你会感到一种与各种社会偏见妥协的压力”。“想想如果是黑人男性的声音,应该会很有意思。然而,我们不想引起不必要的摩擦。因为我们首先要做的是销售产品。”

初创公司Mars正在关注的领域是目前处于快速发展阶段的会话计算技术。目前很多热门产品都采用了这项技术,比如苹果的Siri个人语音助手和亚马逊家用人工智能设备Echo内置的Alexa语音助手。

社交镜子

会话式计算技术就像一面镜子,折射出当今社会许多关于种族和性别的主流偏见。现在,听和对话已经成为计算机最新的输入输出设备,它们所拥有的社会和情感维度在键盘和屏幕上是前所未有的。

比如说到英国管家的声音,我们会不会马上“听到”一个热情睿智的声音,比如《钢铁侠》中的智慧管家贾维斯?为什么那么多用户希望人工智能有一个标准的没有口音的年轻女性声音?

人工智能声线的选择不仅与设计有关,还会影响品牌和机器交互。声音可以改变或强化我们对彼此的看法,而在商业中,这就提出了一个问题,那就是我们是应该跟随刻板声音的主流选择,还是与失败的风险背道而驰,选择相反的声音?

对于很多人来说,答案是显而易见的。微软的人工智能语音助手Cortana就是一个例子,它在视频游戏《光晕》 (Halo)中使用了一个女性角色的声音。

微软搜索部高级副总裁德里克?德里克康奈尔说,“在对Cortana的调查中,我们发现用户更喜欢年轻的女性个人助理,无论性别如何。”换句话说,传统上,秘书的职位应该由女性担任。

10月4日,谷歌推出了一系列基于语音技术的产品,包括智能家居设备Google Home。这些新品都支持Google Assistant的语音助手服务,这个助手也是一个年轻有文化的女性。

负责Google Assistant个性塑造的Google Doodle设计团队负责人Ryan Germick表示,Google Assistant“是一个00后图书管理员,不仅知道文化线索,还知道如何对一些事情装聋作哑。”他说:“一个产品的成功不在于理性的设计决策,而在于人们的心理和感受。”

康奈尔说,微软内部就“用户是否应该对自杀相关问题给出不同的回答”进行了辩论。他说,“我们倾向于提供预防自杀的信息”,而不是选择完全忽视它。

有时候,如果你想让人们很快意识到自己在和机器说话,那么男声是更好的选择。比如IBM的沃森人工智能系统。在与摇滚音乐家鲍勃迪伦拍摄的一则广告中,沃森用男性的声音与他交谈。当美国佐治亚理工学院计算机科学学院的教授Ashok Goel把女性版的Watson介绍给学生当助教,让他们回答问题时,没有一个学生发现自己在和电脑说话。

其实性别只是开始。

你的人工智能技术能听懂口音吗?回应用户

时声音能够不再机械化吗?或者能更带点人情味吗?对此,曾参与Amazon Echo产品研发的亚马逊前员工邵鹏(Peng Shao,音译)表示,“你需要一个人物。这是一个非常情绪化的东西,当人工智能无法理解用户时,人们会发怒甚至会有暴力行为。一旦人工智能开始理解用户,这就像变魔术,甚至睡觉的时候,用户都将离不开人工智能。而这正是医院,疗养院和其他敏感场所的发展趋势。”

美国第一资本金融公司(Capital One Financial Corp)就针对亚马逊Alexa语音助手开发了一款银行业务应用,并发现,要想让用户放心地和一台计算机设备谈论自己的财务信息,就必须降低计算机在对话时的正式程度。

第一资本金融公司内容战略,文化及人工智能设计部门负责人斯蒂芬妮·海伊(Stephanie Hay)表示,“钱和情绪有着千丝万缕的联系,能够为生活带来很多东西,也会成为阻碍。”她表示,起初,Capital One设计的这款应用会向用户说“您好”,但这似乎太过正式,而修改过后的“嗨,你好”效果却更好。海伊表示,“她(Alexa)就像我的朋友,和我在厨房聊天的朋友。我希望她亲切可靠,而不是咄咄逼人。”

卡内基梅隆大学人机交互研究所(Human-Computer Interaction Institute at Carnegie Mellon University)教授贾斯汀·卡塞尔(Justine Cassell)表示,我们需要的不仅是让那个机械化的声音满足我们的期望,我们还需要让计算机和我们相联系,在执行一项任务时不让我们操心。

卡塞尔教授曾为五岁的孩子们设计了一个无种族及性别的语音助手形象,她表示,“女孩子们都觉得这是个女生,男孩子们则觉得是男生。白人小孩觉得是白人,有色人种孩子认为这是有色人种。”她还针对非裔美籍的孩子,设计了另一个语音助手系统,用她的话来说,这是一个说“地方话”的语音助手,而结果也证明在教授科学概念这方面,其教学效果优于使用标准英语的计算机。

当然,在机械合成语音构建过程中,还需要注意地区问题。比如,微软的Cortana语音助手就要在不同的国家,使用不同的口音,讲不一样的语言和笑话。如果一位法国司机驾车去德国,沿途使用纽昂斯通信公司(Nuance Communications)的语音导航,那么计算机就会将德国小镇的名字以法语口音念出来。这么做是为了让司机能够以此错误地认为计算机在说法语,从而保持司机在驾驶途中的自信。

苹果Siri语音助手拥有各种不同版本的本地化口音。比如,说美式英语的Samantha,说澳式英语的Karen,爱尔兰的Moira,南非的Tessa以及英国的Daniel等。

马尔斯教授的科技初创企业Clinc,主要研发个人财务智能手机软件。他希望自己能够取得不错的成绩,这样就能够对人工智能语音服务进行反类型声线测试。他表示,“你要想解决这些问题,你自己需要先做出成绩。我认为,消费者最终将愿意接受不同的声线和声音类型,而大企业可能将依旧采取保守态度。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。