语音识别带来的行业变革
随着人工智能技术的发展,人工智能技术的商业化成了市场关注的一个焦点。一项技术能否继续发展,商业化是关键。在前面我们谈到人工智能发展过程中经历了几个低谷。在人工智能发展过程中的第一个低谷,就是因为人工智能的研究无法创造出市场价值,导致人工智能的发展停滞不前。
在现阶段,随着社会经济的发展,人工智能技术的应用拥有了良好的市场环境。不断涌现的人工智能产品,在为我们的生活创造便利的同时,也创造了巨大的市场价值。在这里,我将介绍一些现阶段人工智能技术的商业化应用。通过这些技术的应用,我们能够看到一个日臻完善的人工智能时代的全貌。
在众多的人工智能技术中,语音识别技术可以说是人工智能领域的一项重要成就。不仅在人工智能领域,在信息技术领域,语音识别也是一项重要的科学技术。作为一门交叉学科,语音识别已经开始成为信息技术中人机接口的关键技术,同时语音技术的应用也逐渐发展成一个新型的高新技术产业。
在人类的历史长河中,人类渴望与世间万物进行交流,并创造了无数的神话传说描写这种想象。随着人类历史进入机械化时代,人类希望自己创造的机器能够听懂自己的话,更好地为自己工作。但由于时代和技术的局限,人类的这一想象始终没有实现。
现在随着人工智能技术的发展,语音识别将会让人类多年的想象成为现实。语音识别在机器和人类之间架起一座桥梁,让人类能够更加自如地操控机器。正如电影《钢铁侠》中, Tony与“贾维斯”之间一样。正是依靠语音识别技术,他们才能够顺畅地交流。
很多人一提到语音识别就会想到智能手机中的语音助手,苹果公司的Siri、谷歌公司的Google Now、微软公司的Cortana等。现在我们所使用的大多数智能手机都具备一定程度的智能语音功能,我们在前面也详细介绍过这些智能语音助手。实际上,这只是语音识别技术应用的一个方面,在许多其他领域中,语音识别技术已经得到了广泛的应用。在了解这些之前,我们首先了解一下与语音识别技术相关的一些重要内容。
就语音识别技术而言,最早的声码器可以被看作其雏形。早在1920年,一只叫作“Ra dio Rex”的玩具狗被认为是最早的语音识别器。它听到别人叫它的名字时,它就会从底座上弹出来。虽然相对简单,但它是人类已知最早的一种语音识别产品。
语音识别技术中最主要的就是数据统计模型和算法。简单来说,数据统计模型就像一个巨大的存储中心,里面有许多不同的数据,而算法则是这个存储中心中的“工作人员”。
当收到指示时,“工作人员”会在存储中心找到相应的物件。
这里其实存在一个显见的问题,也就是语音识别的准确率问题。从上面的介绍中,我们知道,算法保持不变时,数据统计模型中的数据越多,整个语音识别系统的识别能力就越强。那么是不是说只要不断增加数据库中的数据,就能进一步增加语音识别的准确率了呢?
这一推论原则上是正确的,但实际操作上,这种方法却很难行得通。就像是没有一个仓库能够存储世界上的所有货物一样,我们也没有办法搭建一个数据统计模型将所有的数据囊括其中。人类在交流过程中,涉及的数据量是非常大的,所以单纯地用这种方法提升语音识别的准确率是比较困难的。
如果采用上面的组合构建语音识别系统,人类必须按照特定的语言和设备进行交流,这样设备才能够听得懂。但随着语音识别技术的发展,现在的一些语音识别系统可以通过一定的规则和算法,把那些数据统计模型中不存在的数据也计算出来,这样便不需要将所有的数据都增添到数据统计模型中。
当然,这一类语音识别系统仍然需要一个数据库作为语音识别的数据基础,从而保障语音识别的正确性。在数据库基础上,当一段语音被输入之后,模型便会依照自己的算法,在数据库中寻找最为合适的一句。
在这里,深度神经网络的应用促进了语音识别技术的发展。深度神经网络能够采用高位特征训练进行模拟,从而最终形成一个较为理想的适合模式分类的特征。而深度神经网络的建模技术能够和传统的语音识别技术无缝对接,将大大提高语音识别系统的识别率。语音识别技术的主要功能,具体表现4个方面(见5-1)。
首先,是声纹识别,这是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的一种技术。一方面,这种技术可以用于对说话人的辨认,即从众多的发音者之中选出某一语音是哪一人说的;另一方面,可以用于说话人的确认,就是确认某一语音材料是由指定的某个人说的。声纹与指纹一样,都是一个人的生物特性。
其次,内容辨识,有别于声纹识别,这是对语音材料所承载的实际意义的识别。但相对来说,识别话语的内容,要比识别声纹困难得多。因为不同的人可能在发音方法、发音器官和发音状态上有所不同。这便要求使用结构分析和语境理解等程序保证话语内容的正确识别。
再次,语种识别,这是话语内容识别的一个重要基础,计算机只有首先识别出话语的语种,才能将整段话语分到相应的识别器中进行话语识别。
最后,语音标准识别,这一功能主要应用于语言教学的规范和语音标准的测试方面,主要是对人语音标准状况的一个判断,并指出其中的不足之处。
在具体的行业应用方面,语音识别技术已经深入众多垂直行业领域中。在医疗领域,语音识别技术不仅搭载在一些可供穿戴的设备中,还在其他方面具有重要的作用。通过在医院建立完整的数据库,可以将许多疾病、药品名称进行精确的识别,同时还可以将医院的病历资料存储在安全的云空间中,而利用语音识别技术可以轻松地搜索想要寻找的资料,大大节省寻找资料的时间与存储资料的空间。
在智能车载和智能穿戴方面,语音识别技术可以解放人们的双手,同时也增加驾驶中的安全性。简单的语音控制就可以实现一系列复杂操作,让我们的生活变得更加便利。智能家居也是语音识别技术的一个重要应用场景,当所有的家居设备都通过物联网连接在一起时,我们只需要简单地说几句话,就能够将家中的智能设备调整到自己想要的状态。
在商业应用上,语音识别技术的商业化正在逐渐发展。在不久的将来,如果你看到一个人在街道上与一辆汽车进行对话,请不要惊讶,可能你很快也会这样做。
本书评论