目前语音识别北京速记公司准确率超过97%

日期:2016-09-15 / 人气: / 来源:网络整理

——“我要去机场。”

——“T1还是T2?”“出发还是接人?”

这是手机用户在应用语音交互的一个场景。除了给前途线方案,“聪慧”的利用还能主动问出用户去哪个航站楼,接人还是出发。

事实上,语音交互被认为是人工智能的利用方向之一。 互联网女皇玛丽•米克2016年的《互联网趋势报告》中指出,目前语音已经是最有效的输入盘算方法,美国应用过语音助手的用户2015年已经达到了65%,而其中43%是在家中应用的,凸显了语音交互在智能家居中的重要意义。

搜狗CTO杨洪涛在吸收第一财经采访时流露,此前,不少语音辨认停留在“能听会说”的阶段,借助人工智能,现在搜狗的语音辨认还具有“能懂得会思考”的能力。

而在杨洪涛身侧的PPT大屏幕上,同步了搜狗语音辨认对他演讲内容的文字,第一财经记者看到,同步速记虽然偶有毛病,但大意基础正确。

语音交互背后的重要技巧是什么?

搜狗语音交互技巧中心负责人王砚峰介绍,如何让语音交互做的更好,首先要训练语音辨认这一“更敏锐的耳朵”,需要大规模的优质语音训练数据和深度学习的技巧能力积累,而搜狗的语音语料来自于搜狗输入法每天语音输入频次达到1.4亿次,产生11.7万小时的语料规模。另一方面,深度学习的技巧不断推动语音辨认毛病率的降落。从2013年开端,借助深度神经网络和海量用户数据,搜狗输入法的线上毛病率在过去几年中累积降落了超60%。

借助语料数据的“燃料”和深度学习的“发动机”,目前语音辨认正确率超过97%。

对于以当前技巧程度无法实现的剩下的3%,王砚峰指出,“这叫语音辨认最后一公里问题”。

在实际运用中,目前的语音交互的技巧可以解决用户在说话过程中因语速过快而导致的吞音问题,语音辨认毛病率相对降落30%以上,会议速记,语音辨认速度提升3倍。

此外,北京速记,它还能够在语音交互的过程中支撑用户修正毛病的辨认成果,用户可以应用自然语言即可修正之前的输入文字。例如,说出“把(男)他改成女字旁的她”、“弓长张换成立早章”等,输入法便可以马上懂得并正确履行指令。

在支撑多轮对话上,“知音”能够处理更复杂的用户交互逻辑,用更自然并且用户更容易吸收和懂得的方法进行交互,更好地感知用户语音恳求背后的真正需求,从而供给更为便捷的人性化服务。例如,当用户说我要去首都机场,它会问T1还是T2,录音整理,当用户断定航站楼后,它会问是出发还是接人。

杨洪涛流露,自然交互和知识盘算是搜狗在人工智能领域的两大战略方向,目前搜狗在AI领域的研发已经全面展开,并在智能语音领域取得了重大突破,“知音”引擎就是搜狗在自然交互方面的重要成果。而未来随着搜狗在自然交互与知识盘算方面的不断完善,“知音”将会在更多场景为用户供给服务。

事实上,不只是搜狗,此前百度发布免费开放“语音唤醒”和“自定义语义”两项技巧,推动语音互动进一步普及,吸引更多力量加速技巧创新走向线下。

例如度秘机器人亮相肯德基概念店,打造餐饮行业首个人工智能服务场景,凭借智能调度系统升级,将平均配送时长降至32分钟内。。

作者:北京速记公司


现在致电 010-63797486 OR 查看更多联系方式 →

Go To Top 回顶部