从智能语音识别到实时翻译人工智能开启新纪元


  • 语言翻译是人工智能的一只圣杯,因为它依赖于理解句子的能力。
    在语音实时翻译这件事上,搜狗率先实现了历史性突破,质量几乎达到专业同声传译水平。11月17日,在乌镇举办的第三届世界互联网大会上,搜狗CEO发表题为《人工智能的未来之路》的演讲时,其中文讲话内容在实时语音识别的基础上,同步翻译为英文并上屏显示,引起了全场嘉宾的轰动。谷歌最近推出了基于深度学习的最新版谷歌翻译(Google Translate),代表了自然语言翻译质量的重大飞跃。几乎一夜之间,语言翻译就从零散杂乱的拼凑短语,升级到了语意完整的句子。之前的计算机方法搜索的是可以被一并翻译的词汇组合,但深度学习会在整个句子中寻找词汇之间的依赖关系。
    语音识别在过去一直是科幻小说的常见场景,尽管在大多数领域,科幻作家的想象力远远超过现实。语音识别则是少有的例外,其独特性不仅仅是因为其迅速取得斐然成果,更因为其背后有更多值得挖据的领域,其中就包含令人生畏的实时翻译。但是,也许有一天,机器能够通过整合莎士比亚的所有诗歌来翻译他的作品。人工智能的另一只圣杯是语音识别。这一突破性成果将在之后的几年逐渐影响我们的社会,计算机键盘会被自然语言接口取代。
    随着数字助手,如亚马逊的Alexa、苹果的Siri以及微软的Cortana先后进入千家万户,这种取代已经在发生了。就如随着个人电脑的普及,打字机退出了历史舞台,有一天电脑键盘也将成为博物馆的展品。
    语音识别和语言翻译结合到一起时,实时的跨文化交流将有可能实现。《星际迷航》中那种万能翻译机将触手可及。6b50ffdd-81af-435e-b671-0fb34aa8a8af-image.png