财神彩票 > 技术支持 > 高通:语音交互将从云端向终端侧演进

原标题:高通:语音交互将从云端向终端侧演进

浏览次数:99 时间:2020-03-16

腾讯科技讯 据外媒报道,在美国波士顿举行的Re-Work深度学习峰会上,高通的人工智能研究人员克里斯-洛特展示了其团队在语音识别计划方面的新进展。

财神彩票 1

财神彩票 2

人工智能技术要真正服务于生活,语音交互的使用就很有必要。不过当前语音交互处理需在云端进行对于一些用户来说,将他们的语音数据交给云端会引发隐私问题。

这种语音识别系统在智能手机或其他便携式设备上运行,包含两个神经网络:循环神经网络。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式。洛特称,这种语音识别系统识别单词和短语的准确率达到了95%。

以智能手机和最近异常火爆的智能音箱为例,有报道称,手机中的麦克风和芯片,谷歌家庭和亚马逊Echo扬声器等智能家庭设备都可以听到一连串的声音命令,但是它们不会分析这些命令,而是将繁琐的工作转移到运行复杂机器学习算法的强大远程服务器上。

“它可以学习你使用设备的习惯。”他说,“它能够根据你的习惯来进行个性化设置。”

亚马逊的Alexa助手和Google智能助理都会在将它们发送给他们进行分析之前记录片段,并且他们保留这些语音片段,直到用户选择删除它们。虽然两家公司都表示他们使用录音来改善他们的服务并提供更多个性化的回应。但在某些情况下,录音并不保密。

洛特称,现在大多数语音识别系统在云端进行运算过程。手机中的麦克风和芯片,智能音箱如谷歌Home和亚马逊Echo,以及配置微软Cortana 语音助手的Windows电脑,可以让语音识别系统接倾听一些热门词汇,例如“OK Google”或Hey Cortana,从而接受一系列语音指令。但是,它们不会分析这些指令,而只是将这些指令传输到运行复杂机器学习算法的强大远程服务器上。

而解决这一隐私问题的方法是在终端侧来处理语音交互。在前不久的高通人工智能创新论坛上,高通人工智能研究项目负责人兼工程技术高级总监侯纪磊曾指出,一个非常重要的趋势是,语音交互功能正从云端向终端侧快速迁移。“今天,从商用而非研发层面看,语音交互还更多是一个以云端为中心的架构。即使在这种情况下,出于对低功耗、实时的考虑,语音交互所需的一些功能如语音降噪和语音激活都已经在终端侧进行处理。从云端到终端侧的迁移是一个渐进的过程,很快包括语音识别、自然语言理解以及文字转语音(TTS)在内的更多功能会逐步演进到以终端侧为中心。由机器学习驱动的端到端解决方案正在推动语音交互向终端侧迁移的趋势。”

财神彩票,对于某些用户来说,将其语音数据上传到云端,这样会让他们担心隐私方面的问题。亚马逊Alexa和谷歌Assistant均会录制语音片段,然后将它们发送出去进行分析。它们会一直保留这些语音片段,直到用户选择删除它们。这两家公司均表示,它们录制语音是为了改善其服务,提供更加个性化的语音回答。

为什么语音交互会从云端向终端侧演进?在终端侧处理语音交互有什么优势?语音交互是个人助理非常重要的关键部件。语音是我们一直期待的变革性用户交互界面,尤其是在hands-free的应用场景中。语音界面对于打造真正的虚拟助理非常重要。语音交互界面可以支持四个非常重要的特性。第一,始终开启,需要始终在线、始终准备好提供服务。第二,对话式,个人助理不是死记硬背一些命令,而是能够进行非常自然和流畅的、多轮次的正常交流。第三,个性化,个人助理如何识别词句,并清晰理解意图,这也是语音交互界面非常重要的一个方面。第四,私密性,不用把数据传到云端,而是在终端进行很多处理,也是语音交互界面将来发展的一个重要的方向。

本文由财神彩票发布于技术支持,转载请注明出处:高通:语音交互将从云端向终端侧演进

关键词:

上一篇:高通第二财季财报:净利润3.63亿美元 同比下滑

下一篇:高通:5G将把中国科技公司推向行业领先地位财神