作者:老范
2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;
2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。从此围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。阿尔法围棋只是机器人家族中的一员,还有IBM的沃森机器人、百度的阿波罗以及工业领域的智能机器人等,这些新物种都属于一个学科叫做人工智能。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能涉及到计算机科学、心理学、神经科学、哲学和语言学等几乎是自然科学和社会科学的所有学科,是一个多学科融合的集合学科。
人工智能是人的智力和机器的机械力的完美融合。人工智能是如何让机器具备智能的呢?如何控制机器人按照人的意志去达成目标呢?在这个学科的背后,有一个底层学科叫控制论,控制论的理念和方法,帮助我们更好的对工具和机器进行控制,以实现人类的目的。
一、控制论基础
1、什么是控制论
控制论是研究动物、机器、自然和社会等系统中控制、反馈和通信的共同规律的科学。是研究如何利用控制器,通过信息的变换和反馈作用,使系统能自动按照人们预定的程序运行,最终达到最优目标的学问。它是自动控制、通讯技术、计算机科学、数理逻辑、神经生理学、统计力学、行为科学等多种科学技术相互渗透形成的一门横断性学科。
在1948年,美国数学家、物理学家、生物学家、哲学家诺伯特·维纳在《控制论——关于在动物和机器中控制和通讯的科学》一书中,提出了著名的控制论,标志着控制论的诞生。
诺伯特·维纳,从小就智力超常,三岁时就能读会写,十四岁时就大学毕业,18岁就获得了美国哈佛大学的博士。
控制论的思想和方法一经提出,便快速的渗透到了几乎所有的自然科学和社会科学领域。
2、可能性空间
一切科学研究都必须有一个出发点。控制论的研究则开始于可能性空间。什么是可能性空间呢?可能性空间就是一个事物发展的过程中多种可能性组成的空间。世界上许多事物并不是从一开始就注定要发展成现在这个样子的,在事物发展的初期,它们往往有多种发展的可能性,由于条件或者偶然的因素,最终才沿着某一个特定的方向发展下去。
例如:大学生毕业后,我们可以选择各种各样的工作,也可以选择在不同的城市生活,这就是选择空间,选择是自由的,你的选择有几十种甚至上百种。
选择是需要智慧的,选择也需要运气,能不能做出正确的选择将会决定你的命运,人生就是无数个选择的集合,因为只要选择之后,你就会被锁定在这个路径上,很难重新选择,即使可以重新选择,也会付出高昂的时间成本和转换成本。所以选择是有成本的,在经济学上叫做机会成本。
任何事物,都有它一定的可能性空间,但这仅仅是可能性而已,至于事物具体发展成为可能性空间中哪一个状态,要看条件和运气而定。当事物变到某一状态后,它又面临着新的可能性空间。所以一个事物发展过程中的可能性空间就像树枝一样向无数个方向延伸出去。
在生物学上,科学家认为物种就是按照一个树的形状展开的,专业术语叫做“进化树”。每一个物种进化方向都没有目的性,进化过程充满着随机性和偶然性,物种能不能生存,取决于能不能适应环境,大自然一直在挥舞着它那把无情的剪刀,对那些不能适应新环境的物种,进行着无情的修理。
控制就是人们根据自己的目的,改变条件,使事物沿着可能性空间内某种确定的方向发展,就形成控制。一切控制过程,实际都是由三个基本环节构成的:
(1)了解事物面临的可能性空间是什么。如一个人得了传染病,他可能好转、恶化、死亡。
(2)在可能性空间中选择某一些状态为目标。如治病的目标是使病情好转。
(3)控制条件,使事物向既定的目标转化。如采用隔离、戴口罩、吃药来治疗疾病。
可能性空间是控制的基础,一切的控制方法都是为了缩小可能性空间,最终达成自己期望的目标。
3、控制算法
随机控制:随机控制一般用在对对象一无所知或所知甚少的情况下。因此随机控制有个特点,就是在随机控制过程中,系统的可能性空间只有在达到目标值时才缩小,不达到目标值时,可能性空间不会缩小。通俗讲就是碰运气。
例如:如果你想打开一把锁,你手上有10把钥匙,那么你可以随机的进行试验,如果运气好,可能试用1一2次就可以打开锁,如果运气不好,可能需要10次以上才能打开。
当人类对一个事物没有任何经验或者知识的时候,一般会采用随机控制方法。
例如:中国的中医就是经验的累积,在远古时代,人类没有办法对抗疾病,在选择药物的过程中,只能随机试验,这就是最早的“神农尝百草”。
随机控制的缺点是如果碰得不巧,要花费很长时间才能碰上目标。
记忆控制:在随机控制的基础上加一个记忆装置,使随机控制成为有记忆的选择。也就是我们通常讲的“不要在同一个地方摔倒”。对容易摔倒的地方进行标注。与无记忆的控制比较,有记忆控制的可能性空间在到达目标值之前是随着选择次数逐一缩小的。这样就提高了控制的效率,可以较迅速地找到目标。
例如,你手上有10把钥匙,你可以每试验一个,就在这把钥匙上做个标记,这样,你就可以很快找到开锁的钥匙,以避免一把错误的钥匙试验好几次。
共轭控制:共轭的本意是两头牛背上的架子称为轭,轭使两头牛同步行走。共轭即为按一定的规律相配的一对。以古代曹冲称象为例,想直接称大象质量做不到,那就首先将大象转化成同质量的石头,之后称量许多小石头的质量,最后将石头质量转换为大象质量,这就是共轭控制过程。现代社会采用的计算机模拟,计算机建模等,很多都是采用共轭控制法。