此次发布会由日本情报通信研究机构(NICT)主办,来自26个研究机构的代表出席发布会,会上进行了多人同时运用不同语言的在线翻译展示。
U-Star此次发布的系统名叫“Voice Tra4U-M”,涵盖了世界应用较为广泛的23个语种,并能同时支持5人以移动终端在不同地点用不同语种进行实时对话。基于该系统,会话用户在手机上以各自语种通话,系统会将各方的语音信息通过网络传送到后台云计算中心,计算中心首先对口语语音进行识别,并将语音信息转换为文本信息,随后将文本信息翻译为会话各方所需语种的文本信息,最后通过文本转语音模块,将翻译后的目标语音发送到相应会话用户的手机上,从而实现跨语种对话。
实现无障碍的跨语言沟通一直是机器翻译追求的目标。从1945年信息论先驱Warren Weaver提出机器翻译的可计算性,计算机自动翻译之路已走了60多年。而由于语音识别因口音问题带来的大量模糊,以及周围环境中的噪音影响,正确可靠的口语翻译并不是一件容易的事,科学界一度将此技术突破的难度比作“人类登陆火星”。
近年来,互联网海量数据的爆炸性增长、大规模云计算技术应用为口语翻译技术的突破提供了有力的技术支撑,而基于3G移动通信技术的智能终端普及为该项技术从实验室走向应用提供了理想的平台,降低了此技术的应用门槛,使其快速发展起来。
“我们要让普通民众都可以应用此项技术,仅仅通过手机终端就可进行无语言障碍的流畅对话。”NICT发言人堀智织教授介绍。但目前,翻译速度受到网络环境的影响,在网络条件良好的条件下,整个翻译交互过程在数秒钟之内即能完成,为用户带来了便捷和高效的使用体验。
该项目中,中科院自动化所承担了其中中英互译项目,其中包括汉语普通话识别、中文-英文双向翻译以及汉语普通话合成等四大任务。据中科院自动化所副所长徐波介绍:“我所研究成果的最大突破,便是无专业领域的限定。例如以往总是考虑在旅游中会用到的词汇,而在真实情况下很难判断语句实际应用的可能性,使得系统的可靠性很难保证。云计算技术和3G技术的推进,让我们能获取海量数据信息,运用有效的算法进行翻译转换,因此该系统并没有限定翻译领域。”
目前,该所自主研发的基于Android和iPhone手机的中文-英文双向口语翻译系统“紫冬口译Beta版”(又名“由你说”)已开发完成,并将于伦敦奥运会前在Android和iphone平台上免费提供下载。该系统加入了奥运场馆、竞赛项目等奥运相关词汇。在奥运期间,用户可以在3G或者无线局域网环境中通过该软件获得在线中英口语翻译服务。