3.2 人工智能
公众对于人工智能的认识,很多来自2016年3月举行的那场围棋界的“人机大战”。在是役中,韩国围棋国手李世石以1︰4不敌Alphabet开发的人工智能系统“AlphaGo”,败下阵来。9个月后,“AlphaGo”的升级版“Master”并未给人类棋手翻盘的机会,以60胜1和的骄人战绩再次获胜。2017年5月,“AlphaGo”又以3︰0的比分战胜人类顶尖围棋高手柯洁。人工智能要超越人类了吗?其实,目前的人工智能技术并没有脱离将现实世界现象进行量化,然后从数字中寻找规律,再进行判断得到结论这样一个过程。因此“AlphaGo”和“Master”的胜利仅仅是算力与算法上的技高一筹,还远未达到与人类智慧相提并论的高度。即使如此,人工智能技术也不容小觑。
1.什么是人工智能
人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门学科。它的目的是了解智能的本质,并生产出具有类人智能的智能机器。实际上,人工智能并不是一个新名词。1956年夏,麦卡锡、明斯基、罗切斯特、香农等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”时,就提出了“人工智能”这一概念。
人工智能涉及计算机科学、脑科学、神经生理学、心理学、语言学、逻辑学、认知科学、行为科学、生命科学、数学以及信息论、控制论和系统论等领域,是一门典型的前沿交叉学科。从人工智能学科诞生的第一天起,科学家们就希望它能跟我们人类相像,并能帮我们解决很多实际问题。
人工智能要会“看”,这就需要研究图像识别技术。
人工智能要会“听”,这就需要攻关语音识别技术。
人工智能要会“说”,这就需要开发语音合成、人机对话技术。
人工智能要会“行动”,这就需要研发机器人、自动驾驶汽车、无人机等技术。
人工智能要会“学习”,这就需要攻克机器学习技术。
人工智能要会“思考”,这就需要研究脑科学、大数据等技术。
有了上述技术之后,人工智能还需要一个载体。人工智能的载体可以是软硬件结合的实体系统,如机器人、自动驾驶汽车、智能手机等,也可以是纯软件系统,如专家系统、决策支持系统等。
2.曲折的发展历程
人工智能的发展可谓一波三折,但这既是人类认知规律的客观反映,又是事物发展规律的客观反映。人工智能60多年来的发展历程大致可以分为以下五个阶段。
第一个阶段是“起步发展期”。自1956年人工智能概念首次提出后,其发展迎来一个小高潮,相继出现了一批显著的成果,如机器定理证明、跳棋程序、LISP表处理语言等。
第二个阶段是“反思发展期”。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,开始尝试更具挑战的人工智能项目。但是接二连三的失败和预期目标的落空,如无法机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等,使人工智能的发展走入了低谷。20世纪60年代至70年代初可谓人工智能发展史上的第一个“寒冬”。这一阶段的特点是重视问题求解的方法,而忽视了知识的重要性。
第三个阶段是“应用发展期”。20世纪70年代出现的各类专家系统,如医疗专家系统MYCIN、化学质谱分析专家系统DENDRAL、地质勘探专家系统PROSPECTOR等,实现了人工智能从理论研究到实际应用的重大转变。人们对人工智能的研究从探讨一般思维规律走向运用专门知识,开创了人工智能工业化应用的新局面。
第四个阶段是“低迷发展期”。随着人工智能应用规模扩大,专家系统本身所存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、没有分布式功能、不能访问现存数据库等问题逐渐暴露出来。受限于进展缓慢的理论研究、数据的缺乏和有限的计算能力,神经网络的训练过程异常艰难,导致神经网络在应用阶段十分乏力,从而进入了一个瓶颈期。与此同时,一些人工智能领域的重大计划进展不顺。这些挫折使人工智能的发展在20世纪80年代中期至90年代中期进入了第二个“寒冬”。
第五个阶段是“快速发展期”。随着互联网技术的发展,信息与数据的汇聚不断加速。尤其是最近几年,海量图像、语音、文本等多模态数据使深度机器学习和大规模知识库建设成为可能,超级计算为复杂人工智能算法模型提供了计算平台,这些都为人工智能技术大范围的应用推广提供了技术支撑和保障。人工智能技术应用呈现爆发式增长之势,其发展迎来了新的春天。
有数据统计,2016年全球人工智能领域融资额突破了50亿美元,比2015年增长了60%还多。2016年9月,Alphabet、IBM、Facebook、亚马逊和微软五家科技巨头宣布组成人工智能联盟,以求在科研领域建立良性的竞争与合作关系。截至目前,几乎所有的国际科技巨头都推出了人工智能产品和服务,一场针对人工智能的研发热潮已经来临。
3.计算机视觉
作为人工智能领域的一项重要分支,计算机视觉是指计算机从图像中识别出物体、场景和活动的能力。运用由图像处理操作及其他技术所组成的序列,计算机视觉技术可将图像分析任务分解为便于管理的小块任务。比如,一些技术能够从图像中检测到物体的边缘及纹理。分类技术可被用作确定识别到的特征是否能够代表系统已知的一类物体。
计算机视觉的应用领域非常广泛。例如,医疗成像分析被用来提高疾病的预测、诊断和治疗;人脸识别技术在安防及监控领域被用来指认嫌疑人;在购物方面,消费者现在可以用智能手机拍摄下产品以获得更多购买选择。持续扩大的应用领域已使计算机视觉领域吸引了数亿美元的风投资本。
机器视觉作为计算机视觉的相关学科,泛指在工业自动化领域的视觉应用。在这些应用里,计算机在高度受限的工厂环境里识别诸如生产零件一类的物体,因此相对于寻求在非受限环境里操作的计算机视觉来说目标更为简单。计算机视觉是一个正在进行中的研究,而机器视觉则是“已经解决的问题”,是系统工程方面的课题而非研究层面的课题。
4.机器学习
机器学习指的是计算机系统无须遵照程序指令而只是依靠分析数据来提升自身性能的能力。其核心在于,机器学习是从数据中自动发现模式,并进行预测。比如,给机器学习系统一个信用卡交易信息数据库,系统就会学习到可用来预测信用卡欺诈的模式。
处理的交易数据越多,预测就会越准。
目前,至少有15种机器学习方法,每种方法都使用不同的算法结构,依据得到的数据实现预测最优化。作为机器学习的一种方法,深度学习的突破点在于模拟大脑,而不是模拟世界。将以软件为基础的计算器(神经元)连接在一起,组成一个“神经网络”,接收输入并进行分析、做出判断。如果判断正确,就做出通知,如果输出是错误的,算法就会对神经元之间的联系做出调整,改变未来的预测。最初网络会出现很多次错误,但随着输入数以百万计的例子,神经元之间的联系就会得到调整,最终几乎在所有情形下,神经网络都会做出正确的判断,这也就是熟能生巧。
机器学习的应用范围非常广泛,针对那些产生庞大数据的活动,它几乎拥有改进一切性能的潜力。除了欺诈甄别之外,这些活动还包括销售预测、库存管理、石油和天然气勘探、公共卫生等。机器学习技术在其他认知技术领域也扮演着重要角色,比如计算机视觉,它能在海量图像中通过不断训练和改进视觉模型来提高其识别对象的能力。现如今,机器学习已经成为认知技术中最炙手可热的研究领域之一,已吸引了大量的风险投资。谷歌也在2014年斥资4亿美元收购Deepmind这家研究机器学习技术的公司。
5.自然语言处理
自然语言处理是指计算机拥有的像人类那样的文本处理能力。比如,从文本中提取意义,甚至从那些可读的、风格自然、语法正确的文本中自主解读出含义。一个自然语言处理系统并不了解人类处理文本的方式,但是它却可以用非常复杂与成熟的手段巧妙处理文本,例如自动识别一份文档中所有被提及的人与地点;识别文档的核心议题;或者在一堆合同中,将各种条款与条件提取出来并制作成表。以上这些任务通过传统的文本处理软件是根本不可能完成的。
通过一个简单的例子可以说明自然语言处理面临的挑战。“光阴似箭(Time flies like a narrow)”中每一个单词的意义看起来都很清晰,直到系统遇到“果蝇喜欢香蕉(Fruit flies like a banana)”,用“水果(fruit)”替代了“时间(time)”,并用“香蕉(banana)”替代“箭(arrow)”,就改变了“飞逝/飞着的(like)”与“像/喜欢(like)”这两个单词的意思。
自然语言处理,与计算机视觉技术一样,是多种实用技术的融合。建立语言模型来预测语言表达的概率分布,举例来说,就是某一串给定字符或单词表达某一特定语义的最大可能性。选定的特征可以和文中的某些元素结合来识别一段文字,通过识别这些元素可以把某类文字同其他文字区别开,比如垃圾邮件同正常邮件。以机器学习为驱动的分类方法将成为筛选的标准,用来决定一封邮件是否属于垃圾邮件。
因为语境对于理解“time flies(时光飞逝)”和“fruit flies(果蝇)”的区别非常重要,所以自然语言处理技术的实际应用领域相对较窄。这些领域包括分析顾客对某项特定产品和服务的反馈、自动发现民事诉讼或政府调查中的某些含义以及自动书写诸如企业营收和体育运动的公式化范文等。
6.语音识别
语音识别技术,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。该技术须面对一些与自然语言处理类似的问题,在不同口音的处理、背景噪声、区分同音异形异义词(“权力”和“权利”听起来是一样的)等方面存在一些困难,同时还需要具有跟上正常语速的工作速度。语音识别系统使用一些与自然语言处理系统相同的技术,再辅以其他技术,比如描述声音和其出现在特定序列和语言中概率的声学模型等。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。
本书评论