“天道”这个词百科里有定义,表示终极真理、大自然的运动变化规律、万物的规则,和宗教人士讨论AI有时会用到这类词汇。
我们知道AlphaGg/Zero的核心算法是蒙特卡洛树搜索。
这个算法很容易理解,标准的蒙特卡洛模拟是无偏抽取(rollout策略),就是服从均匀分布的随机抽取。
从表面上看,无偏抽取对应“天地不仁万物刍狗”这样的说法,一切平均对待。
但如果硬要说蒙特卡洛算法就是“天道”法则,不如直接说随机法则或概率法则才是真正的天道法则了。
围棋有一定的特殊性,围棋盘是行列整齐的,和图像的像素一样,所以AlphaGo Zero不执行标准蒙特卡洛模拟,而使用19层的CNN卷积神经网络来直接评估当前节点。这种方法是不能通用的,不是万法殊途同归的法则。