人才战略奏凯,百度语音技术获突破


发布时间:2021-05-04 09:49 作者:弘文

近日,百度仅有十人的语音识别研究小组,在康奈尔大学图书馆网站上发表了一篇论文。文中显示,百度已在语音识别领域取得重大突破,在语音的正确识别率上已超越谷歌、苹果及必应。

人才战略奏凯,百度语音技术获突破

此事迅速在美国科技界引起关注,媒体随之跟进展开报道,百度深度学习研究院院长吴恩达也在随后对外确认了这一消息,他认为,从语音识别系统的标准测试来看,百度语音识别技术的准确率已超过谷歌及苹果10%,处于领先水平。众所周知,吴恩达是今年上半年才刚刚加入百度的新成员,而在如此短的时间内就能取得这样的成绩,想必除了研发团队的倾力之外与Robin对技术和人才的高度重视以及稳健策略是分不开的。

人才战略奏凯,百度语音技术获突破

噪音语音识别技术是百度深度学习研究院成立至今,除百度大脑外的第二次重大技术突破,意义深远。百度的语音识别系统DeepSpeech,能够在嘈杂环境下实现比谷歌和苹果语音技术更高的识别率,证明语音技术正跨越使用门槛,向着大众需求的方向疾步行进,而非像以前一样躺在实验室里,或只提供给企业用户使用。

人才战略奏凯,百度语音技术获突破

过去的语音识别系统,仅能解决宽松环境下的语音识别问题,在良好的语音环境下,各家都能做到相当不错的识别率。但用户的使用环境是具有多样性的,以嘈杂环境为主,交互性始终做不好,因此语音识别系统更多应用在企业而非大众市场。

之所以说百度这次在语音识别上出现重大技术突破,是由于百度深度学习突破了限制语音技术发展的一个瓶颈,提升了用户使用语音进行人机交互过程中的主要问题,使得这项技术向着大众应用的方向迈出一大步,这相当于提升了技术研发的层次,跳出过去的旧模式,打开了一扇新的大门。

这一突破所带来的效应是不难预见的,随着语音识别技术走向大众,其商业价值和社会价值会更大程度上发挥出来,而这必将促使企业更多在这个方向投入研发力量,最终引领在该领域的大规模创新,真正让语音技术对人类的生活产生重大影响与改变。

在人类越来越倾向于抛弃文字指令,偏好语音指令的今天,语音识别技术已变得越来越重要。而百度深度学习研究院所出的成果,恰恰是将语音技术的重要性更上层楼。除了各种智能终端设备外,物联网和各种以网络为基础的自动控制装置,将会越来越多使用语音作为控制指令,说这项技术能够改变人类生活,是不为过的。

更为令人兴奋的是,吴恩达还排除了该技术要用很长时间投入应用的可能,外界普遍预期明年即可投入应用,首先为百度的用户提供语音音乐搜索服务,然后再逐步将应用扩展到其他领域。不仅如此,吴恩达率领的30人研究团队还将大规模扩编,为世界各主要语言开发语音识别及翻译等服务。

在语音识别领域的重大突破,只能说进一步巩固了百度作为国内领先的技术创新导向型企业的形象,这使得中国互联网的技术创新面目为世界所知。李彦宏本人对技术创新的重视,形成了百度与生俱来的技术基因,并促使百度近年来在技术研发方面发展迅速,成果卓著。

2013年初李彦宏决定在美国硅谷设立深度学习研究院时,面临着诸多挑战。企业主导的科技研发,已被历史经验证明叫好不叫座,大多数科研成果无法有效转化,惠普研究院就是个很好的例子。在技术研发上的大量投入,也势必会对商业活动造成影响,从中找到一个完美平衡,并不是件容易的事。

李彦宏在之后主导了百度人才战略的制定和实施,引进了包括吴恩达、徐伟、吴韧在内的一批各个领域的世界顶级专家,组建了了强大的科技研发团队。百度最近几个季度的研发投入一直在猛增,每季度十几亿的费用,使得百度成为国内研发投入比例最高的企业。

从李彦宏为数不多的几次公开发言中可以看出,百度已将深度学习提升到百度技术创新的核心地位,愿意为深度学习的理论发展和应用价值开发投入大量资源。百度未来的商业模式中,很可能会极度依赖这些科技成果,而现有的技术力量已不足以满足移动互联网的发展速度。

李彦宏在技术创新上的思路,基本能被视为百度这家公司的未来发展方向,即百度的科研战略不是为研发而研发,而是要尽量把新技术应用到大众领域,让技术发展帮助传统企业应对移动互联网带来的变革,也要让普通人能从科技发展进程中受益,用技术改变大多数人的生活。

百度在语音技术上的创新与突破,并不是百度这些年来取得的第一个重大科研成果,当然也不会是最后一个。从百度目前的科技创新战略来看,这家公司拥有在多个领域取得重大成果,并将之投入应用的巨大潜力。李彦宏所描画的那个属于百度的未来技术蓝图,正在按部就班地一一实现,并很有可能会给人们带来更多惊喜。

语音 百度 技术

上一篇: 喜迎重磅人才!国务院特殊津贴专家、东北师大教授成特聘教授

下一篇: 法国足球人才辈出,为何德国足球,近几年没有出色的年轻球员