语音辨认能否颠覆人北京速记公司工转录甚至翻译行业?

日期:2016-08-12 / 人气: / 来源:网络整理

语音辨认能否颠覆人北京速记公司工转录甚至翻译行业?

  我们都知道有这样一种职业叫速记速录师!会议现场,嘉宾访谈网上直播,庭审现场,询问笔录现场,消息采访现场,影视字幕文字制作,电话同声实时记载,远程在线同步记载等等,都离不开他们的身影!

  

  他们的工作就是实时采集语音信息,同步生成电子文本供给给大家。一个人正常讲话的语速为每分钟160至180个汉字左右,而一个速记速录员的速度可以达到每分钟220-300字,而且其正确率不低于98%。一个高级速记速录师的功力就更深厚,每分钟可达684字。供给如此优质服务,势必也拥有不菲的价格,声音材料收拾每小时的收费价格400至600元,现场会议大屏幕投影的实时转录,大概是每小时800元的价格。

  其实,对于这种自然的利用处景,通过语音辨认技巧来解决是再好不过的选择了,我们人类完整可以从这种复杂的简略脑力劳动中解放出来。那么语音辨认技巧现在能否做到这一点呢?

  微软高级科学家,从事语音辨认技巧已有30余年的黄学东专家说“10年前,语音辨认的毛病率高达80%!如今,我们将毛病率从80%之高降到了仅有8%!如果我们在未来两三年内一直保持这种态势,奇迹必定会产生”。这也就表明,在原有的声学模型的基础上,加上大数据的助力,以及近年来人工智能的发展,语音辨认方面已经取得了质变的成果。

  今天,对于中文的语音辨认,市面上从事语音辨认业务的公司基础上都可以做到正确率在90%以上。也就是说,我们拿着麦克风来讲话,普通话标准的情况下,语音辨认的基础上完整可以辨认我们在讲什么,而且辨认毛病的概率已经很低了。

  目前,许多音视频字幕的制作,小型发布会的现场记载等,语音辨认技巧完整可以利用,并真正的产生价值。然而,所有的这些利用,速录公司,都是有必定的毛病冗余度的,而我们愿意吸收应用这种程度的语音辨认技巧的前提是,北京速记,我们可以容忍必定毛病的存在。

  一个小型发布会的现场上,主持人字正腔圆,语音辨认率可以达到98%以上;当嘉宾开端讲话时,由于方言、口音、平翘舌有误、语音重叠、含混不清、新词汇的涌现,语音辨认就会涌现问题;当嘉宾开端应用复杂的逻辑思辨能力,科学深奥的复杂长句、跳脱的方法进行论证时,没有对语义的推测,语音辨认的正确率也立刻降落。

  所以,发布会上,还是需要配备工作人员实时的进行检查、纠错和校订。也就是说语音辨认技巧还达不到人类的标准,还是需要人工转录员的校订。当然,这里 我们还仅仅指的的是固定的普通话人群和近场环境,其他情况成果更堪忧。

  很多人都有疑问,从去年开端,现场速记,人工智能得到了前所未有的关注,从马斯克、霍金等大佬对人工智能的勇敢预测,到《超能陆战队》、《钢铁侠》、《机械姬》、《美国队长》等电影中涌现的能人工智能角色,再到举世注视标人机围棋大战,以及微软、谷歌、Facebook等科技巨头在人工智能领域发布其傲人的研究成果, 可以说人工智能承载了我们许多期望和想象。

  然而,当人工智能真正回归产业、产品和用户需求时,我们除了那些科幻式的畅想和预测,还需要懂得,基于现有的研究进展,人工智能到底可以给我们带来什么真正有价值的东西,如何赞助我们解决哪些切实需求?当然,当深度神经网络的大的训练平台出来,已经为我们的语音辨认带来了质的飞跃,然而想从90%飞跃到99%,却还是需要很长的路要走。那我们该向哪个方向走?

作者:北京速记公司


现在致电 010-63797486 OR 查看更多联系方式 →

Go To Top 回顶部