人工智能语音过滤器引发担忧
来源: 时间:2022-09-29
美国《大众科学》网站9月13日发表题为《人工智能语音过滤器可以让你听起来像任何人——也可以让任何人听起来像你》的文章,作者是安德鲁·保罗。全文摘编如下:

近年来,人们对人工智能(AI)深伪技术越来越多的关注主要集中在视觉欺骗上。想想看,视频能够不可思议地将一个人的脸叠加到另一个人的身上,基于用户建议的超现实艺术世代,以及围绕着这些能力的伦理问题受到争议。但另一种令人信服的数字模拟关键方法最近才得到适当的审视和讨论。

看看本田、吉普和雪佛兰新推出的语音过滤器,在人工智能的帮助下,最近才开始得到更多重视。不幸的是,它带来了一系列严重的社会影响,就像视频深伪行业一样,监管机构似乎对此无能为力。

新兴的人工智能工具——比如Koe Recast——正在迅速提升它们可以将音频输入转换成几乎任何人声音的能力,只要提供足够的资料进行分析的话。在某些情况下,这些程序只需要15秒至30秒的片段就能产生令人信服的模拟。尽管Koe Recast仅处于Alpha测试(α测试)阶段,但已经有例子显示,元宇宙平台公司董事长马克·扎克伯格的一段简短音频听起来可以像一个重低音叙述者,一个女人,甚至是一个高音调动漫角色。

Koe Recast的创建者阿萨拉·尼尔在接受“技术之道”网站的记者采访时说:“我的目标是帮助人们用任何能让他们更快乐的方式来表达自己。”尼尔还说,他打算最终发布一款桌面应用程序,能够在Discord和Zoom等平台上实时转换用户的声音。当被问及坏人利用Koe Recast进行人身攻击以及发布虚假信息的可能性时,尼尔认为,“就像任何技术一样,它可能同时具有积极和消极的一面,但我认为绝大多数人类都是由优秀的人组成的,他们将从中受益匪浅”。

然而,批评人士仍对让公众放心使用这种潜在混乱的工具持怀疑态度。最近,一些外包呼叫中心的代表也已经开始使用人工智能软件来消除自己国家的口音,以听起来更“本土”,减轻西方消费者的偏见。尽管这个工具的创建者认为他们的发明防止了偏见,但很多人反驳说,它只是提供了一种避免处理手头更大问题的方法——即排外主义和种族主义。

同样,一些大型企业的员工已经成为骗子的猎物,他们利用类似的音频模拟来模仿老板,要求转账和密码。普罗托科尔网站的网络安全记者凯尔·阿尔斯波最近在全国公共广播电台的《市场》栏目中解释说:“在规模较大的企业中,我认为,越来越多的企业开始看到这一点,因为他们真的是这种事情的现成目标。”

阿尔斯波也指出,这类骗局仍处于初级阶段,但可能用不了多久,这些策略就会变得越来越常见,很难区分事实和虚构。不幸的是,人工智能支持的视觉和音频模拟的快速升级是无法阻挡的。