基础 | |||||||||||
首先感谢那些在我研究程序算法时给我帮助的人,如Zebra的作者Gunnar Andersson,微软亚洲研究院的李聪,台湾大学的许舜钦教授等。正是由于站在了无数前辈们多年研究成果的肩膀上,电脑人工智能才得以一步步的成长。我编辑这篇文章的目的在于,希望使更多的人了解人工智能的基本原理,激起大家的爱好,能有更多有志者研究它,并推动人工智能的发展。这篇文章中部分引用了Gunnar Andersson/李聪/许舜钦教授的文章,在此表示感谢。 | |||||||||||
黑白棋程序设计是用编程的方法教会电脑下黑白棋,使之可以与对手对抗,一较棋力高下。由于黑白棋的算法设计在各种棋类游戏中是比较简单的,所以编程相对要轻易,而棋力则可以达到非常的强,一般都可以击败它的设计者。黑白棋程序Logistello已于1997年大比分击败世界冠军Takeshi Murakami。现在,人类玩者几乎不可能击败强力的黑白棋程序,如Hannibal、Logistello、Wzebra、Keyano等。看来,要想击败他们,只有依靠自己的程序了。:) | |||||||||||
那么,怎样设计黑白棋程序呢?以下将以Pascal语言为例加以说明。 现在有如图示的这样一个棋局,轮到电脑下棋。现在它发现有这样三个地方可以下:e3,c3,c5。这三种下法分别会形成三种局面:A、B、C。假如是人在下棋,就会思考:那一种下法更好呢?比如A被别人占角,B没什么变化,C占了别人的角。当然棋手会选择下C。电脑也是如此,它会对每一种棋局评一个分,比如它判定,假如被别人占角,就减80分,相反占别人的角就加80分。那么A=-80分,B=0分,C=80分。电脑会选择下C。电脑程序对棋局评分的部分,称为“估值函数”(Evaluation Function)。真正的估值函数当然不会这么简单。它会用到技巧篇提到的如行动力、潜在行动力、余裕手、边角判定、稳定子等综合因素来判定。具体的估值函数,我会在“估值函数”一节中具体讲述。
初始棋局(-1) ------------------+------------------ | | | e3 c3 c5 (A) (B) (C)
接下来,假如人就这么判定。那么它顶多也就是个初学者。为什么呢?因为它不会推理,碰到对手弃角之类的战术,如“边角判定”中示例的一些情况,就输得一塌糊涂了。当然,可以告诉电脑,碰到“边角判定”中的几种情况,就如何如何下。但是,真实的棋局是非常复杂的,电脑(也包括人脑)几乎不可能对动态的棋局给出静态的评估。因为实际对局总会出现这样那样的情况,是无法预先估计的。碰到这些情况,人就会向后推几步,看一看会是怎样的一个局面。一些棋类大师往往可以推十几步甚至更深。电脑也是如此。 还是刚才那一幅图的演化。
电脑在自己下棋以后,把对手的下棋情况也推理出来。然后加以评分。(最下一排是电脑评估的得分)这一次电脑又如何下呢?这时电脑假设对手是高手。假如电脑下e3,对手就会下对电脑最不利的情况f6。同样,电脑下c3,对手就会下d3,电脑下c5,对手就会下d6。这三种情况,c5是最不好的(因为c5的下一步d6的得分最低),c3与e3一样。因此电脑会下c3或者e3。用程序化的语言这样描述: 电脑从棋盘初始状态出发,以后双方轮流下子,形成一种倒树状结构。树的层数就是电脑搜索的深度。在树状结构的叶子节点,对棋盘状态进行估值,即估计形式的好坏。得出一个分值。将此分值赋给叶子节点,之后,假如父节点该电脑下棋,则将子节点的最大节点值赋给其父,假如父节点该对手下棋,则将子节点的最小节点值赋给其父。(就是说,四级节点把最大值赋给三级节点,三级节点把最小值赋给二级节点,二级节点把最大值赋给根节点...)以此类推,得到根节点的值。具有和根节点一样值的二级节点即为电脑该下的位置。 这里读者会有个疑问:电脑为什么要假设对手是高手?这是因为,假如你认为对手不是高手,但是不能说对手每一步都会下错。比如你送对手一个角吃。对手假如吃掉了,岂非损失惨重?当然,假如你确定对手不会吃你的角,你也可以下,但是前提就是“你确定对手不会吃你的角”。也就是你完全明白对手的战术。所以说假如一个程序完全了解另一个程序(或人)的下法,它也可以用针对性的下法,这将会更具成效。
| 如上图所示棋局,设电脑为白棋,推理深度为2,可以形成如下的树:(数字为节点值)
| 具体实现的伪算法类似于经典的八皇后问题。 最大最小搜索: var function MiniMax(Depth: Integer; Board: TBoard): Double; 对于每一个合法的可下棋的位置(i,j) do if (depth = DepthMax) and (Value > max) then //假如值大于根节点值则赋值 恢复棋局; 进一步,假设从对手角度考虑形式判定函数为g,则有g = -f。这样,在深度优先搜索中,电脑下棋的结点时考虑取子结点中f最大的,而对手下棋的结点中取f最小的,也就是g最大的,这样两者就完全统一成取最大值。而在返回值时,只需要把符号改变一下,就可以把f和g值相互转换了。这被称为负最大搜索,它比最小最大搜索来得简单。这样,函数就简化成如下形式:
| 负最大搜索:
| function NegaMax(Depth: Integer; Board: TBoard): Double; | var I, J: Integer; Value, t: Double; begin if Depth = 0 then //根节点depth=DepthMax;叶子节点depth=0; begin Result := 估值; //叶子结点估值返回 Exit; end; Value := -MaxInt; //节点赋初值,初始化为一个不可能达到的最小值 对于每一个合法的可下棋的位置(i,j) do if t > Value then if (depth = DepthMax) and (Value > max) then //假如值大于根节点值则赋值 恢复棋局; |
Word教程网 | Excel教程网 | Dreamweaver教程网 | Fireworks教程网 | PPT教程网 | FLASH教程网 | PS教程网 |
HTML教程网 | DIV CSS教程网 | FLASH AS教程网 | ACCESS教程网 | SQL SERVER教程网 | C语言教程网 | JAVASCRIPT教程网 |
ASP教程网 | ASP.NET教程网 | CorelDraw教程网 |