语音识别技术已经发展有五年多了,虽然一些早期语音识别技术 :如语音拨号或桌面听写已经得到了广泛的应用,
但这些技术与今天蓬勃发展的虚拟代理或智能家居设备相比还是有些逊色的。如果你一直在关注语音识别技术市场的发展,你大概就会了解到早在六年前就有一大批公司开始关注这一领域,比如谷歌,苹果,亚马逊和微软(在一份简短的搜索报告中,共有26个美国公司开发了的语音识别技术)。
自那时以来,世界上最大的技术趋势制定者就已将开始加快发展速度,并在越来越多的领域设定了新的基准,例如谷歌最近向外界提供了公司新的开放式企业语音识别API。在机器学习系统方面的大规模的投资之后,谷歌目前看起来处在整个行业的领头羊地位。但这家拥有全球大量市场的科技巨头还存在着潜在的致命弱点——无法进入中国。
谷歌在中国的六年禁令是一个众所周知的事件,并且这条禁令缩短的可能性几乎为零。迄今为止,中国拥有着全世界最多的人口,世界上最多的移动用户,并且大多数中国人使用“语音到文本”的功能来启动查询搜索,并通过数字信息系统来导航。
谷歌可能会失去大量的普通话音频数据,但是百度并没有错过这个机会。作为中国最大的搜索引擎,百度已经收集了数以千计的普通话语音数据,并将这些数据存放在深度语音识别系统(Deep Speech2)中。这个系统可以依赖其自身的深度学习算法,完全独立得将普通话转换成英语(反之亦然)。
百度的深度语音识别系统的研究主要基于其在旧金山桑尼维尔的人工智能实验室。但奇怪的是,实验室里涉及到该项研究的科学家们并不能讲出一口流利的普通话、甚至对中文也了解甚少。阿里巴巴和腾讯是另外两家在中国市场中开发语音识别技术的关键公司。虽然两者都使用了深层学习平台,但这两家公司在宣传和覆盖面方面都没有达到百度的深度语音识别系统的水平。
尽管深度语音识别系统对普通话很精通,但是科学家在一开始并没有打算让它在普通话方面发展。 “我们用英语开发这个系统,但由于它的深度学习本领主要基于语音数据,而我们又拥有大量的普通话数据,所以这个机器具有强大的普通话搜索功能。”亚当·科茨博士,百度美国的人工智能实验室主任说道。
当深度语音识别系统在 2015年12月首次发布时,百度的首席科学家安德鲁&mid
自那时以来,世界上最大的技术趋势制定者就已将开始加快发展速度,并在越来越多的领域设定了新的基准,例如谷歌最近向外界提供了公司新的开放式企业语音识别API。在机器学习系统方面的大规模的投资之后,谷歌目前看起来处在整个行业的领头羊地位。但这家拥有全球大量市场的科技巨头还存在着潜在的致命弱点——无法进入中国。
谷歌在中国的六年禁令是一个众所周知的事件,并且这条禁令缩短的可能性几乎为零。迄今为止,中国拥有着全世界最多的人口,世界上最多的移动用户,并且大多数中国人使用“语音到文本”的功能来启动查询搜索,并通过数字信息系统来导航。
谷歌可能会失去大量的普通话音频数据,但是百度并没有错过这个机会。作为中国最大的搜索引擎,百度已经收集了数以千计的普通话语音数据,并将这些数据存放在深度语音识别系统(Deep Speech2)中。这个系统可以依赖其自身的深度学习算法,完全独立得将普通话转换成英语(反之亦然)。
百度的深度语音识别系统的研究主要基于其在旧金山桑尼维尔的人工智能实验室。但奇怪的是,实验室里涉及到该项研究的科学家们并不能讲出一口流利的普通话、甚至对中文也了解甚少。阿里巴巴和腾讯是另外两家在中国市场中开发语音识别技术的关键公司。虽然两者都使用了深层学习平台,但这两家公司在宣传和覆盖面方面都没有达到百度的深度语音识别系统的水平。
尽管深度语音识别系统对普通话很精通,但是科学家在一开始并没有打算让它在普通话方面发展。 “我们用英语开发这个系统,但由于它的深度学习本领主要基于语音数据,而我们又拥有大量的普通话数据,所以这个机器具有强大的普通话搜索功能。”亚当·科茨博士,百度美国的人工智能实验室主任说道。
当深度语音识别系统在 2015年12月首次发布时,百度的首席科学家安德鲁&mid
