类似于苹果的北京速记Siri语音助手

日期:2016-09-03 / 人气: / 来源:网络整理

  自从有了盘算机以来,人机交互的形态就在不断进化。而现阶段智能语音被很多人认为是下一代人机交互形态,相比于传统的人机交互如键盘鼠标、触摸等,语音交互更自然;相比于新兴的手势交互和眼球追踪等,智能语音更符合人的交际习惯。

  作为这一风潮的引领者,微软、IBM和日本的一些技巧厂商曾经垄断了包含中文在内所有主流语言的语音合成和语音辨认技巧。而科大讯飞(002230)在早期通过对数字信号处理、声学研究、实验语音学等领域的产业整合,打破了这一技巧壁垒,并在国际上牵头制定了中文语音技巧标准。在不久前互联网女皇的报告中,智能语音被认为是下一代人机交互的新范式,语音助手将盘踞家居、汽车、手机的麦克风,还能智能购物。材料显示,目前科大讯飞开放平台上的开发团队已经达到了16万,接入科大讯飞语音模块的利用数将近14万。在这些技巧开发之后,科大讯飞在某些特定领域开端谋求市场化和产业化的道路。

  移动互联网利用:主打语音输入和语音助理

  据科大讯飞工作人员在人工智能实验室中的介绍,公司目前拥有讯飞输入法、讯飞翻译、灵犀语音助手,另外还有录音宝、云电话手表、酷音铃声六款重要的移动利用。其中讯飞输入法最受欢迎,其最重要的功效在于语音输入。工作人员向介绍到,讯飞输入法目前不仅支撑19种方言的精准语音转文字输入,还支撑中英互译输入,即输入中文语音直接专为英文文字,输入英文语音直接转为中文文字。

  还有一个比较受欢迎的利用是灵犀语音助手,它支撑语音拨号、短信、提示、翻译、订票等功效,类似于苹果的Siri语音助手。据悉,目前包含联想、金立、HTC等许多手机厂商的自带输入法和语音助手都是由科大讯飞定制。

  第三款利用是讯飞翻译,除了支撑中英互译主动朗读,还支撑中文-维吾尔语、中文-藏语互译等。

  智能家居:AIUI将门槛大大降低

  接着,科大讯飞工作人员进行了AIUI的演示。AIUI是科大讯飞发布的一整套的语音交互解决方案,集成了科大讯飞在双全工技巧、麦克风阵列技巧、声纹辨认技巧、方言辨认、语义懂得技巧和内容服务等技巧和服务。通过装置AIUI方案的开发板或电视盒子,可以用语音在电视屏幕上进行交互。

  在交互演示中,记者感受到了两个最重要的技巧进步。一是支撑多轮对话和高低文懂得。比如说“给我订一张北京到上海的票”,讯飞电视助手会问“坐飞机”还是“做火车”,并在得到答复后找到所有在售的票,接着再问具体时间,甚至可以辨认用户说出的具体请求,比如“我要最贵的”、“我要时间最短的”、“我要12点出发的”等等。电视盒子方面,只要对着讯飞遥控器说,“我要看XX卫视”、“我要看XX导演的电影”,均可一句话直达节目,并且还支撑语声调播放时间,例如“帮我调到1小时5分30秒的处所”等等,辨认精准性很高,实用性很浅。

  第二个比较大的进步是支撑远场辨认。由于AIUI开发板采用了科大讯飞的麦克风阵列技巧,所以支撑声源定位和锁定,在3到5米的领域内,AIUI均可辨认出特定方向的语音,即使在嘈杂的环境中也可以定位声源并辨认操作。另外,科大讯飞与京东合作的DingDong音箱也支撑声源定位。

  声纹辨认和实时辨认:抢了模仿与速记的饭碗

  在人脸和声纹辨认的演示中,速录公司,科大讯飞利用声纹辨认可以将任何人说的话实时转译成郭德纲、林志玲等明星的声音。据科大讯飞工作人员介绍,目前很多地图软件上的名人导航包都是根据科大讯飞的声纹辨认合成的,并不需要这位名人录制所有涉及到的语音。但是,在展现的实时的声纹转译中,需要注意一个很重要的点,就是在语速上尽量要与目标声音一致。

  而讯飞听见是一款实时语音辨认转文字的软件,类似于实时速记员。它可以将演讲、采访等实时记载成文字。目前,讯飞听见已经推出了线上的实时速记服务,收费版还可以供给专业词汇的校订等。

  从这两项技巧来看,未来声音模仿员和速记员恐怕要面临失业的问题了。

  车载领域:将语音助手完整融入汽车

  同时,讯飞在车载上也开端发力,目前已经与奇瑞联合推出了智能车机交互的整车前装解决方案,并且已经在奇瑞的最新款汽车上利用。据讯飞车载领域负责人刘俊峰介绍,讯飞开发的实用于奇瑞汽车上的车载主机可以通过语音唤醒,还可以通过车机下部的按钮或方向盘上的按钮唤醒。这款车机除了具备语音拨号、语音导航把持、查周边和预订服务等,还在音乐和电台上进行了深度优化。音乐方面,支撑语音按歌曲名、歌手名等查找曲目。

作者:北京速记公司


现在致电 010-63797486 OR 查看更多联系方式 →

Go To Top 回顶部