評價函數

編輯

評價函數，也稱為啟發式評價函數或靜態評價函數，是由游戲計算機程序用來估計游戲樹中某個位置（通常在葉子或終端節點）的價值或好壞的一個函數。大多數時候，這個值是一個實數或一個量化的整數，通常是一個棋子（如圍棋中的石子或國際象棋中的卒）價值的千分之幾，其中n可以是十分之一、百分之一或其他方便的分數，但有時，這個值是單位區間內三個值的數組，代表該位置的、平率和敗率。對于未解棋局的評價函數并不存在分析或理論模型，這種函數也不完全是臨時性的。評價函數的構成是通過將候選函數插入自動機并評價其隨后的表現來憑經驗確定的。對于一些游戲，如國際象棋、象棋和圍棋的評價函數的一般構成，現在有大量的證據。游戲計算機程序采用評價函數的游戲包括國際象棋、圍棋、將棋（日本象棋）、黑白棋、六角棋、雙陸棋和跳棋。此外，隨著MuZero等程序的出現，計算機程序也使用評估功能來玩視頻游戲，如Atari2600的游戲。有些游戲如井字棋是強解的，不需要搜索或評估，因為有一個離散的解樹。

與搜索的關系

編輯

這種評價樹通常是搜索算法的一部分，如蒙特卡洛樹搜索或像α-β搜索這樣的最小化算法。該值被推定為代表如果博弈樹從該節點擴展到博弈結束時的相對獲勝概率。這個函數只看當前的位置（即棋子所處的空間以及它們之間的關系），而不考慮位置的歷史，也不探索節點的可能走法（因此是靜態的）。這意味著，對于存在戰術威脅的動態局面，評估功能將不會是對局面的準確評估。這些位置被稱為非靜止狀態；它們至少需要一種有限的搜索擴展，稱為靜止搜索，以在評估前解決威脅。如果在節點上發生贏、輸或平局，評估函數返回的一些數值是xxx的，而不是啟發式的。在評價函數中，搜索和知識之間存在著錯綜復雜的關系。在評價中，更深入的搜索有利于較少的近期戰術因素和更微妙的遠期位置動機。在編碼知識的有效性和計算的復雜性之間也有一個權衡：計算詳細的知識可能需要很多時間，以至于性能下降，所以對精確知識的近似通常是更好的。由于評價函數取決于搜索的名義深度以及搜索中采用的擴展和減少，因此沒有通用的或獨立的評價函數的表述。一個在一個應用中運行良好的評價函數通常需要進行大幅度的重新調整或重新訓練，以便在另一個應用中有效地工作。

在國際象棋中

編輯

在國際象棋中，評價函數的輸出通常是一個整數，而評價函數的單位通常被稱為卒子。術語"卒"指的是當棋手在某個位置比對手多一個卒時的數值，這在國際象棋棋子相對值中有解釋。整數1通常代表一個卒的某個分數，在電腦象棋中常用的是蜈蚣，是一個卒的百分之一。較大的評價表示材料的不平衡或位置優勢，或通常即將獲得材料的勝利。非常大的評估值可能表明將死即將到來。評價函數還隱含地編碼了下棋權的價值，它可以從一個小卒的零頭到贏或輸不等。

手工制作的評價函數

編輯

在計算機國際象棋中，評價函數的條件是由引擎開發者構建的（即手工制作的），而不是通過訓練神經網絡發現的。構建手工評價函數的一般方法是由各種加權項的線性組合，以影響一個位置的價值。然而，在手工制作的評價函數中，并非所有條款都是線性的，有些條款，如國王安全和卒子結構，是非線性的。每個項可以被認為是由一階因素（那些只取決于空間和空間上的任何棋子的因素）、二階因素（空間與其他空間的關系）和九階因素（對局面歷史的依賴性）組成。

內容由匿名用戶提供，本內容不代表www.gelinmeiz.com立場，內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載，請注明出處：http://www.gelinmeiz.com/174768/

評價函數

目錄

評價函數

與搜索的關系

在國際象棋中

手工制作的評價函數