中國AI同傳遭質疑之時谷歌實時翻譯也被吐
物联中国
日期: 16:07: 9来源:物联中国 点击:505次 核心提示:中国AI同传遭质疑之时,谷歌实时翻译也被吐槽了
图:实时翻译最初仅限于支持Pixel Buds,但现在可用于任何支持Google Assistant的耳机
易科技讯 10月25日消息,据连线杂志报导,知名语音辨认公司科大讯飞卷入的“AI同传造假”风波仍然还在发酵,引发了人们关于AI实时翻译技术的更多关注
不久前,谷歌悄悄改变了Pixel Buds耳机的支持页面,并写道:“所有经过Google Assistant优化的耳机和安卓,现在都可以使用谷歌翻译”此前,这1功能仅限于Pixel Buds耳机和Pixel用户尽管谷歌并未大张旗鼓地宣布这个消息,但这个小小的调整却值得注意
要知道其中原因,首先我们来了解下谷歌耳机的历史谷歌去年推出了无线耳机Pixel Buds,此前该公司曾大肆宣传过这款产品,称其是一款革命性的工具,支持实时翻译功能只要轻敲Pixel Buds,说“帮我说”,它就会打开你上的谷歌翻译运用现在,Pixel也一样支持这个功能
接着,你可以说出句子,谷歌翻译会在上将其翻译成目标语言,并进行转录,然后读出来理论上,谷歌的新技术乃至会让口译翻译们担心丢掉工作这款产品在舞台上的实时翻译演示取得了巨大成功,但当其开始发货时,人们对其仿佛产生了怀疑:翻译的质量没有达到公众的预期
科技站Tech Insider用十种不同的语言对实时翻译功能进行了测试它成功地翻译了些基本问题,比如“最近的医院在哪里”,但当句子变得更复杂,或说话人有口音时,翻译就会出现毛病评论员们得出的结论是,实时翻译似乎有点儿“欺骗嫌疑”,Google Assistant需要努力理解对它说出的话
消费技术资深分析师丹尼尔·格里森(Daniel Gleeson)说:“掌握自然语言是非常困难的对于谷歌来说,这将是个巨大的成绩,而他们实现这个目标的那一天,可以自豪地大声说出来”也许有些人可能会说,这可能也是Pixel Buds支持页面更新的信息被隐藏起来的缘由
谷歌的问题不在于翻译进程本身,事实上,该公司在过去几年始终在提升其翻译运用水平2016年,谷歌将其谷歌翻译转换为基于深度学习的人工智能(AI)驱动系统在此之前,该工具将每一个单独的单词分别翻译,并应用语言学规则使句子在语法上保持正确,从而致使了我们非常熟悉的、支离破碎的翻译效果另一方面,神经络则将句子作为一个整体来斟酌,并根据之前训练过的大量文本数据来猜测正确的输出结果通过机器学习,这些系统能够斟酌句子的上下文,从而提供更准确的翻译
整合机器学习是Google Brain团队的任务,该团队是谷歌专门致力于深度学习研发的部门Google Brain还将神经络应用到另一个工具上,这是实时翻译的关键,但这似乎也导致其容易在语音辨认上犯错实际上,Google Assistant经过了数小时的语音培训,它会使用机器学习工具来辨认模式,并终究正确地识别出被要求翻译的内容
那末,如果谷歌在某种程度上成功地将神经络应用到文本-文本的翻译中,为什么Google Assistant仍然不能使用相同的技术精准地进行语音识别呢剑桥大学自然语言处理研究人员马西基·霍瓦特(Matic Horvat)说,这一切都归结于用来训练神经络的数据集
霍瓦特说:“系统能够适应它们所得到的训练数据集当你把它介绍给它从未听过的东西时,语音识别的质量就会下落例如,如果你的训练数据集是会话语音,那么在繁忙的环境中识别语音效果就不会太好”
干扰是任何致力于提高语音辨认技术的计算机科学家的克星去年,谷歌通过其数字创新基金会向伦敦初创企业Trint投资1.5亿欧元,该公司在自动语音转录方面处于领先地位,尽管其算法与谷歌不同然而,Trint的算法在处理基本的干扰问题上并没有表现得更好
事实上,Trint的公司站专门用了长长的篇幅来介绍如何在安静环境中记录演讲内容该公司声称,其操作存在5%至10%的误差,但它明确表示,这适用于安静环境的录音Trint首席执行官杰夫·科夫曼(Jeff Kofman)说:“最大的挑战是向我们的用户解释,我们的表现只能和他们给我们的音频一样好在有回声、噪音甚至重音的情况下,算法就会出错”
现场演讲所带来的挑战意味着,在创建神经络的进程中,训练进程是成本最高、耗时最长的部份而像谷歌对Pixel Buds所做的那样,只在有限数量的设备上支持实时翻译,固然无助于系统学习实际上,它处理的语音越多,它可以向算法中添加的数据就越多,机器就越能学会辨认不熟悉的语音模式
对消费技术资深分析师格里森来说,这是谷歌将该功能扩展到更多硬件的原因之一他表示:“语音识别中最辣手的问题之一,就是收集足够的特定口音、俗语、习语数据,所有这些都是高度区域化的将这个功能仅用于Pixel上,永远不会让谷歌接触到那些区域化数据,进而也没法处理足够多的数据”
但是,积累数据也有不利的一面表现最好的神经络是那些具有最多数据的络,但由于数据需要在CPU上处理,CPU的压力也会随着信息量的增多而增加这类CPU还远未到达与移动设备完美集成的程度,使得实时语音处理在今天依然无法成为现实实际上,每次使用Google Assistant时,语音信息都会被发送到数据中心进行外部处理,然后再发送回用户的上这些计算工作都不是在本地完成的,因为现有的无法存储神经络处理语音所需的庞大数据
霍瓦特说,虽然Google Assistant能够相当快地完成这1过程,但距离实时语音辨认还有很长的路要走该公司目前面临的挑战之一是,如何在中整合神经络处理,以提高实时翻译等功能的无缝性事实上,开发人员已在致力于开发适合于高效处理神经络的小型外部芯片,这种芯片可以集成到中例如,本月早些时候,华为宣布了一种AI芯片,该公司宣称其可以在几分钟内训练好神经络算法
虽然谷歌有自己的芯片Edge TPU,但它是为企业用户而不是智能设计的对霍瓦特来讲,这是它的致命弱点:作为一家软件公司,谷歌对制造商没有多少控制权,没法确保开发出一种产品,使所有安卓装备都能使用本地神经络处理,与苹果截然不同
在不久的将来,谷歌可能被迫采取更小的步骤来改进其语音识别技术虽然实时翻译引来了许多批评,但对行业分析师、Counterpoint物联、移动和生态系统研究主管尼尔·沙赫(Neil Shah)来说,扩大它有益于谷歌参与竞争:“谷歌已取得20亿安卓用户随着愈来愈多的用户开始在安卓上使用最新的语音交互,它能够比竞争对手更快地扩大范围,并接受大量输入数据流的训练”
格里森所也赞同这种看法不管对实时翻译的评论是不是坚持温和嘲讽的基调,谷歌的举动最终都会带来显著的改进就像所有的AI产品一样,这个工具一样需要学习,它进入市场的过程还没有完成格里森表示:“人们可能会说,谷歌的实时翻译运作方式与许诺的不一样,但这是其实现目标的唯一途径”口译翻译现在没必要担心他们会立马丢掉工作(小小)
出处:物联中国 慎重声明:本文仅代表作者个人观点,与物联中国()无关其原创性和文中陈述文字和内容未经本站证实,对本文以及其中全部或部分内容、文字的真实性、完整性、及时性本站不作任何保证或许诺,请读者仅作参考,并请自行核实相关内容
丁桂薏芽健脾凝胶能治腹泻吗小儿便秘如何治疗
小孩发烧咳嗽反复发热
-
管理20个城市宣布购房可以拿到补贴你能轻松买
5G | 2020-09-18
-
阿森纳英超第1巨富3董事入最新福布斯富豪
5G | 2020-07-08
-
武磊爆发给中国足球带来1最大利好留
5G | 2020-06-30