百度语音达会议速记到专业水平
日期:2016-08-28 / 人气: / 来源:网络整理
国民网
柏可林 摄
谷歌、微软、科大讯飞等科技公司在智能语音方面的带动作用,使得我们在日常生活中已经不乏看到语音技巧的利用。虽然触摸屏和键盘仍然是今天人机交互重要媒介,但未来语音交互或可与之平分天下。智能语音的发展将推动人工智能的发展,使我们的生活变得更轻松更美好。
英语口语测验,你的考官不是人,而是一台盘算机,它直接给你打分;一边开车一边对你的车说话下命令,“帮我打电话给妈妈”、“帮我买明天去北京的机票”、“带我去最近的面馆”;躺在病床上,不用出发体,直接开口对空调说“把温度调到26度”。
语音直接说话下命令,代替按键、触摸屏,是人更自然的体验。语音技巧正让机器像人一样用语音交换。
4月13日,科大讯飞发布公告,预计4月18日复牌交易,目前正在收购北京乐知行教导的股份。科大讯飞正努力从基础技巧供给商,转型为利用服务供给商,因为后者利润率远高于前者,而此次收购教导软件公司就是其拓展“语音+教导”的重要一步。
谷歌美国公司语音技巧人员向《国际金融报》记者流露,谷歌正在各项服务中全面融入语音技巧。微软的开发者大会提出“对话即平台”(Conversation as Platform)打算,简略说就是“想让你对机器说句话就把事给办了”。微软CEO纳德拉表现,语音指令正成为键盘、触摸屏之后的新一代人机对话方法。
当下正是转型要害期,各大企业的竞争也从单纯技巧程度转变到利用处景的用户,“语音+各个利用处景”成为这百亿市场的制胜要害。
科大讯飞:从幕后到台前
科大讯飞自称占中文语音市场70%份额,以其为案例,或允许对这个行业略窥一二。
科大讯飞董秘江涛流露,目前科大讯飞在企业端和终端消费者端的业务占比分辨是80%和20%,公司的目标是今后使这两块比重倒置,此次收购教导软件公司也是其“语音+教导”的重要一步。
科大讯飞要让终端消费者成为自己重要的用户?而科大讯飞目前的客户还是以政府、国企为主,这家具有国企背景的公司,如何能抓住互联网时代终端消费者的心?
面对记者的这一提问,科大讯飞并没有给出明确的答复,或许科大讯飞看到了市场未来的大势,但具体怎么落地实行,仍需时日来摸索。
于是记者试图从其目前技巧中,梳理出科大讯飞可能的方向。要具体利用于终端消费者,首先需要断定在什么场景下、谁来用这项服务、用户有哪些需要,因此,服务的场景、用户特点需要首先锁定。换句话说,需要锁定垂直细分领域,再根据这一领域的具体场景配置技巧。
比如,机器主动翻译利用在手机端。科大讯飞称,“随声译”功效达到了大学英语六级程度,一秒钟内能实现中英语音互译。
据科大讯飞公司介绍,在广东、江苏、上海、重庆、山东等10余省市的中高考英语听说测验中,开端试点用机器当考官,全年累计测试考生数近1000万。此外,用机器来改作文,也已经在安庆、合肥、湖南等地试点利用。
目前打客服电话需要通过一层层语音提示、按键,能否一次性直接得到想要的答案?“智能客服未来会调换掉50%以上的人工。”科大讯飞公司向《国际金融报》记者表现。安徽(科大讯飞起家的处所)省移动公司目前用科大讯飞的技巧,可以基础实现语音直接搜索答案。科大讯飞为中国联通建设的智能语音客服——语音导航系统的试点建设,为其节俭了20%以上的人工成本。另外,政府背景的金融机构、国家电网、航空公司、政府机关、医疗机构、广电行业,以及速运行业等重要呼叫中心,正在应用科大讯飞的机器语音应答。
目前已有31款车在出厂前搭载了科大讯飞的智能语音系统。同时,在政府基础设施建设上,科大讯飞也与江西、广西、吉林等省展开合作。
《国际金融报》记者还创造,科大讯飞开放云平台、投资创业公司支撑创业者,这些都是科大讯飞寻找终端消费者市场的方法。科大讯飞告诉记者:“我们现在每天都在分析云平台上的创业者,有哪些值得我们去投;在看我们产业链的高低游,哪些能跟我们最优势互补。比如在教导中做内容的、做教导利用的等。”
科大讯飞打算从幕后跳到台前,但这直接把自己变成了客户的竞争对手。一位业内人士向记者坦言,“科大讯飞的八麦技巧只自己用,对外只卖五麦,这让客户担心,科大讯飞并没有为客户供给最好的服务。”
而互联网终端消费者的利用处景,大部分被BAT(百度、阿里、腾讯)等互联网公司盘踞。于是,语音技巧公司直接从基础技巧供给商,成为了抢占终端消费者的互联网公司对手,这家从语音技巧起家的公司,需要另外开辟BAT并不擅长的终端用户。
之前,科大讯飞的模式是:提前在技巧上布局、积累,等候“风口”到来后爆发。创新工场董事长兼CEO李开复表现:“大部分价值数十亿美元的中国软件公司全都是借助互联网的爆发完成了积累,科大讯飞走的却是一条艰苦的发展之路——他们很早就研发了语音辨认的尖端技巧,寻找早期的应用者,发掘出一个当时并不存在的市场。”
在互联网时代,基础技巧供给商的危机在于,无法直接接触终端消费者,而被其他公司层层“剥削”利润,往往容易受到巨头价格战和免费模式的绞杀,这是许多基础技巧供给商压力剧增的重要原因,也是科大讯飞不得不转型的要害。
科大讯飞目前的策略就是,为大部分领域供给底层的技巧服务,但是在人机交互(如电视、手机、汽车的利用)、儿童教导领域、国家信息安全流传三大分支领域,跳脱单一的技巧供给商角色,供给深化的利用服务。
全球许多科技公司都有这个特点:靠科技驱动,而对消费者的实际需求缺乏切实的充分考量。他们的口号是:在火车涌现前,人们只会说,“我想要一匹更快的马”。开创前沿科技的人认为,消费者是被动的,消费者需要被技巧领导,而不是“技巧大佬”来服务消费者。
然而,语音技巧有点为难。它既不被认为是“科技巅峰”技巧,也不被认为是消费者广泛的基础需求。高低两头都不占优势。
不得不正视的问题是,用语音来实现人机对话,是消费者的刚性需求、不得不用吗?在哪些情况下是刚性需求,哪些情况下是锦上添花或玩具?针对记者的这一提问,业内各家公司都没有给出明确答复。“用户最基础的需求还没满足,何况语音这种非刚性需求。”科大讯飞上市前,关注并投资过该公司的一位股权基金董事总经理告诉《国际金融报》记者。
阿里云的技巧人员说:“要害是,你要找到用户真正刚性的需求,而且是用户真正需要,不是你想象的认为别人需要。用户愿意付费或者离不开的利用处景是什么?”
“出门问问”首席技巧官(CTO)雷欣向《国际金融报》记者表现,某些场景下语音确实是刚需,比如开车时不方便接电话、不方便输入文字等。然而,“出门问问”也没有再举出更多语音作为刚需的场景。
因此,各公司基础都开放了自己的语音云平台,免费供给多项服务,一方面吸引用户供给数据,一方面从中找到语音技巧的“用武之地”。
行业格式:基础都to B
以后开会时,现场速记就可以由机器主动完成。机器语音辨认率可以达到95%左右,远超过人类速记员的速度和正确率。
不会外语听不懂外国视频?用YouTube的人都知道,不论哪部视频,YouTube可以主动显示其字幕,也可以主动翻译成用户需要的语言。
不会外语怎么跟外国人打电话?机器可以直接帮你把声音相互翻译成彼此的语言。
语言是人类差别于动物的重要标记,是人类智力最基础也最高级的体现情势之一,企业正让机器也可以像真人一样机灵地履行命令。
4月13日,百度发布公司部门重构。百度董事长兼CEO李彦宏发布,今后他将把人工智能作为自己工作的三大重点之一。人工智能将成为互联网后人类科技新高地,这几乎已成全球共鸣,但如何切入?智能语音是一些公司选择的切入口。
语音技巧目前重要包含:说话下命令、通过语音断定身份(如银行密码、保险锁、公安刑侦)、需要语音的场合(电话客服、口语测验)的主动服务、语音与文字的互相转化等。而语音辨认只是其中最基础的功效。
起步阶段的语音市场,总量并不大,但《国际金融报》记者创造,该产业在国内只有五六家公司,相比于万亿规模却百舸争流的“红海市场”,该领域每家公司分到的市场空间并不小。
目前哪些公司在做语音技巧?它们有什么差别?
总体而言,多数公司是全部互联网、物联网的基础技巧供给商,基础都是to B(即机构用户)而不是to C(终端消费者)。科大讯飞公司体量最大,多数项目来自政府合作;思必驰、云知声目标市场最接近,都是车载后市场(即出厂后配置的)、家居物品、机器人,其基础技巧散在各个垂直细分领域,随客户公司的领域而随时变更;谷歌在中国投资的“出门问问”(约占一成股份),目前产品重要是语音输入的手表。
值得注意的是,《国际金融报》记者创造,智能语音领域并不是BAT、谷歌、苹果等所谓的巨头最领先,它们针对消费者供给终端利用产品,而不代表其技巧最强。“苹果公司的Siri做了这么多年,北京速记,不还是个玩具吗?”阿里巴巴一位技巧人员对《国际金融报》记者说。针对终端消费者的这些互联网公司,基础不对外输出技巧,BAT也通过投资创业公司来获取语音技巧。
其中,百度语音达到专业程度,“所有技巧全都是百度自己开发。”其技巧人员向《国际金融报》记者表现。记者试用了百度医生,只需对手机说“我肚子痛”,百度医生就显示了十几位相干医生的信息供选择。阿里巴巴、腾讯相对较弱,BAT基础把语音作为自己现有产品的附加功效,如阿里基于产品搜索服务电商平台,微软聊天机器人为了得到聊天数据,并没有实际功效。
如果说过去几十年,全球语音行业的要害瓶颈是辨认的正确率等技巧问题,那么今天,机器听打比人工速记的正确率更高,下一步语音公司的核心竞争力又在哪?
阿里云一位技巧人员对《国际金融报》记者说,“如果只是语音辨认,对错都一目了然,所以你可以给机器数据,重复地训练它。而语音履行命令,就涉及各个场景,需要大批知识库,只要是无法明确量化、对错标准含混的场景,就很难训练机器,因为它不知道你想让它怎么做。”
需要特别注意的是,《国际金融报》记者创造,尽管各家公司都号称自己是以语音为切入口的人工智能公司,但语音技巧本身严重同质化,若目标细分市场再持续同质化,而缺乏各家自己的特点,市场发展可能不会如人们想象的乐观。
为什么不做to C?第一,不敢直接把客户变成竞争对手;第二,公司体量较小、数据不足、对终端消费者懂得不深。用业内的话说,“把终端消费者交给专门做产品的公司,我们专心做to B的软件”。
科技公司正推动机器不仅能听懂语音的指令,录音整理,更重要的是能懂得、会思考,并帮你解决问题。比如,“帮我买明天去北京的机票”,语音辨认非常简略,录音整理,但要断定起降机场、航空公司、价格、选时间段,而被选择的信息可能是不标准的。机器人相当于人几岁的年纪才干独立完成买机票这项任务呢?以此为例,不少公司正在积极摸索类似的利用处景。
[1] [2] 下一页
作者:北京速记公司
推荐内容 Recommended
- 以及六个分论坛:普惠金融与创新09-28
- 用法式文化中最求极致精神录音整09-27
- 有66个大二速录公司学生在学09-23
- 在经济环境、政策环境、政治法律09-23
- 所以结构优化是我们要录音整理提09-23
- 地里的迎庆桃眼现场速记看着就要09-21
相关内容 Related
- 其实围绕智能家居北京速记跟机器09-29
- 吴江警方官方微现场速记信粉丝上09-29
- 郑州日产郭振甫北京速记公司2015两09-29
- 学生量忽略不计;北京速记速读速09-29
- 2015中国国际厨卫展现场速记 博世家09-29
- 潼关县、澄城县创现场速记建省级09-29