就是把语音北京速记公司转换成文本

日期:2016-08-31 / 人气: / 来源:网络整理

继AlphaGo寻衅李世石4:1获胜之后,阿里云也在人工智能领域向人类发起寻衅。

近日,阿里云在2016年会上公开展现实时语音辨认技巧,并现场寻衅世界速记大赛亚军得主。据现场最终评测,机器人在正确率上以0.67%的微弱优势克服第50届国际速联速记大赛全球速记亚军姜毅。

阿里云 人工智能

阿里云年会现场,图中左边屏幕显示的是语音辨认,右边屏幕显示的是人工速记

从现场效果看,会议速记,人工智能的稳固性和并发盘算能力是其优势。人类的体力是有极限的,尤其是在高强度压力下,工作时间越长出错概率越大,而机器则能自始至终保持同一程度。这一点在AlphaGo和李世石的围棋比赛终中也重复得到验证,在比赛中、后局机器的稳固盘算能力远超人类。

此外,人工智能的并发能力也非人工所能及。在创造错别字后,机器可以瞬间修正所有毛病,人工速记则需要在演讲人短暂间歇的时刻返回修正,北京速记公司,明显表现得忙乱。

阿里云iDST 语音组总监鄢志杰表现,虽然已经在接近世界一流的“速记师”的路上,但人工智能还有很长一段路要走。“在噪声、口音以及对未见到过的数据的适应性上,人类显然更胜一筹。”

速记师姜毅则评价,虽然和人工智能比赛压力很大,但“机器还是缺了一点点智慧”,并表现非常愿意收下这个“机器徒弟”,教会它更多的速记诀窍。

“看起来是机器寻衅人类,其实是人类在寻衅自己。”姜毅强调,“人工智能背后凝结的科学家智慧是人类的自满。”

第50届国际速联速记大赛于2015年在匈牙利布达佩斯举办,姜毅作为中国代表队的九名选手之一,在文本看打速记比赛项目中以大约300字/分钟的速度获世界亚军。

阿里云 人工智能

姜毅在会议现场和看不见的机器人PK

 核心算法+GPU盘算

所谓语音辨认技巧,就是把语音转换成文本,也称为主动语音辨认。语音辨认是人工智能领域极为重要的前沿技巧。在美国政府关于限制发放签证的“Technology Alert list”中,语音辨认赫然在列,与核兵器、火箭技巧等同在“黑名单”之中。

随着自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争取的下一个入口,会议速记,苹果Siri等是个人智能助理类范例利用。而语音辨认则是人机交互的第一步。

据介绍,此次“人机大战”的语音辨认算法重要基于BLSTM(双向长短时记忆神经网络),这种算法对单位时间内的盘算量请求很高,因此阿里云采用了带GPU加速的新一代高性能盘算平台,单节点盘算能力达16 Tflops,并且对BLSTM算法做了针对性优化,实时解码更为顺畅。

走出实验室赋能利用

阿里云iDST智能语音团队拥有世界一流的专家团队,此次年会展现的研发成果只是冰山一角。实际上语音技巧已经走出实验室,在阿里内部广泛利用,比如赋能阿里团体客服和蚂蚁金服客服团队的呼叫中心智能化。

去年双11,蚂蚁金服95%的远程客户服务已经由大数据智能机器人完成,同时实现了100%的主动语音辨认。蚂蚁金服客户中心整体服务量超过500万人次,客服人员的精力可以更好地集中到处理复杂类客户问题和工作。

同时,语音团队还把智能语音交互技巧赋能给YunOS以及手机淘宝、支付宝、钉钉等移动端利用。

作者:北京速记公司


现在致电 010-63797486 OR 查看更多联系方式 →

Go To Top 回顶部