开局及终局 |
开局
所有的强力程序都采用了开局定式,许多顶级程序的定式大多来自IOS游戏。对于强力的程序而言,他会在每一次对局结束以后升级定式,因此,对于有自学习功能的电脑来说,用上一次击败电脑的战术对付电脑是不会管用的。另一方面,具有自学习功能的电脑的中局棋力也会越来越强,原因是电脑会通过不断升级估值函数的权重来提高棋力。TD(Temporal Difference)就是一个实用的强化学习技术。一个应用了该技术的国际象棋程序在国际互联网上进行了300多局对局后,其等级分从1650分(一般水平)上涨到了2110分(美国大师水平)。 |
终局 终局是电脑的强项,它的搜索比中局快得多,主要有这样几个理由: 1.终局的估值函数很简单,他只用看双方谁胜了,估值就等于电脑的棋子减去对手的棋子。而不用判定行动力、潜在行动力、余裕手、边角判定和稳定子。 2.终局的搜索由于空格越来越少,使得搜索节点很少。如深度为5的搜索,中盘时叶子节点平均为10*10*10*10*10=100000,而终局时最大为5*4*3*2*1=120。 3.哈希表在终局时效率更高。 因为随着游戏向终局接近,玩者可下的位置逐渐减少,在终局阶段程序可以搜索得更深。这使得他们在终局比人类下得更好。看计算机在终局下棋经常感到不可思议,因为双方都在游戏结束20步以前知道了游戏的结果。对计算机而言,终局早在人类玩家中局结尾时就开始了,离游戏结束还有20-30步。 |
Word教程网 | Excel教程网 | Dreamweaver教程网 | Fireworks教程网 | PPT教程网 | FLASH教程网 | PS教程网 |
HTML教程网 | DIV CSS教程网 | FLASH AS教程网 | ACCESS教程网 | SQL SERVER教程网 | C语言教程网 | JAVASCRIPT教程网 |
ASP教程网 | ASP.NET教程网 | CorelDraw教程网 |