圖形編輯距離
編輯在數學和計算機科學中,圖形編輯距離(GED)是衡量兩個圖形之間的相似性(或不相似性)。圖形編輯距離的概念最早是由AlbertoSanfeliu和King-SunFu在1983年以數學形式正式提出的。圖形編輯距離的一個主要應用是在不精確的圖形匹配中,如機器學習中的容錯模式識別。兩個圖之間的圖編輯距離與字符串之間的編輯距離有關。由于字符串被解釋為xxx度數為1的連接的有向無環圖,經典的編輯距離定義如Levenshtein距離、Hamming距離和Jaro-Winkler距離可以被解釋為適當約束的圖之間的圖編輯距離。同樣地,圖編輯距離也是有根樹之間的樹編輯距離的泛化。
正式定義和屬性
編輯圖編輯距離的數學定義取決于它所定義的圖的定義,即圖的頂點和邊是否被標記以及如何標記,邊是否是有方向的。一般來說,給定一組圖編輯操作(也被稱為基本圖操作),兩個圖之間的圖編輯距離基本圖編輯操作的集合通常包括。頂點插入,在圖中引入一個新的有標簽的頂點。頂點刪除,從圖中刪除一個單一的(通常是斷開的)頂點。頂點替換,改變給定頂點的標簽(或顏色)。邊插入,在一對頂點之間引入一條新的彩色邊。邊刪除,在一對頂點之間刪除一條邊。邊替換,改變一個給定邊的標簽(或顏色)。其他的,但不太常見的操作,包括諸如邊的分割,在一條邊上引入一個新的頂點(也創造了一條新的邊),以及邊的收縮,在邊(相同顏色的)之間消除二度的頂點。
盡管這種復雜的編輯操作可以用更基本的變換來定義,但使用它們可以使成本函數的參數化更加精細c{displaystylec}。當運算符比它的組成成分的總和更便宜時。對基本的圖編輯算子的深入分析見于《圖編輯》。并提出了一些方法來自動推導這些基本的圖編輯算子。還有一些算法在線學習這些成本。應用圖形編輯距離在手寫識別、指紋識別和化學信息學中得到了應用。
算法和復雜性
編輯計算一對圖之間的圖編輯距離的精確算法通常將問題轉化為尋找兩個圖之間的最小成本編輯路徑的問題。最佳編輯路徑的計算被視為尋路搜索或最短路徑問題,通常以A*搜索算法實現。除了精確的算法外,還有一些有效的近似算法也是已知的。它們中的大多數具有立方計算時間此外,有一種算法可以在線性時間內推導出GED的近似值盡管上述算法有時在實踐中效果很好,但一般來說,計算圖編輯距離的問題是NP-hard(網上有證明,見Zeng等人的第2節),甚至很難近似(形式上是APX-hard)。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/164505/