線性判斷分析
編輯線性判別分析 (LDA)、正態判別分析 (NDA) 或判別函數分析是 Fisher 線性判別法的推廣,一種用于統計學和其他領域的方法,用于尋找特征的線性組合來表征或區分兩個特征 或更多類的對象或事件。 得到的組合可以用作線性分類器,或者更常見的是,用于在以后分類之前進行降維。
LDA 與方差分析 (ANOVA) 和回歸分析密切相關,后者也試圖將一個因變量表示為其他特征或測量值的線性組合。 但是,ANOVA 使用分類自變量和連續因變量,而判別分析具有連續自變量和分類因變量(即類標簽)。 與方差分析相比,邏輯回歸和概率回歸更類似于 LDA,因為它們還通過連續自變量的值來解釋分類變量。 這些其他方法在不合理假設自變量服從正態分布(LDA 方法的基本假設)的應用中更可取。
LDA 還與主成分分析 (PCA) 和因子分析密切相關,因為它們都尋找最能解釋數據的變量的線性組合。 LDA 明確嘗試對數據類別之間的差異進行建模。 相反,PCA 不考慮類中的任何差異,因素分析基于差異而非相似性構建特征組合。 判別分析也不同于因子分析,因為它不是一種相互依賴的技術:必須區分自變量和因變量(也稱為標準變量)。
當對每個觀察的自變量進行的測量是連續量時,LDA 起作用。 在處理分類自變量時,等效技術是判別對應分析。
當組是先驗已知的(與聚類分析不同)時,使用判別分析。 每個個案必須有一個或多個定量預測指標的分數,以及一個組指標的分數。 簡單來說,判別函數分析就是分類——將事物分配到相同類型的組、類或類別中的行為。
歷史
編輯最初的二分判別分析是由 Ronald Fisher 爵士于 1936 年開發的。它不同于 ANOVA 或 MANOVA,它用于通過一個或多個獨立的分類變量來預測一個(ANOVA)或多個(MANOVA)連續因變量。 判別函數分析可用于確定一組變量是否有效預測類別成員資格。
兩個類的LDA
編輯考慮一組觀測值 x → {\displaystyle {\vec {x}}}(也稱為特征、屬性、變量或測量),用于已知類 y {\displaystyle y} 的對象或事件的每個樣本。 這組樣本稱為訓練集。 然后,分類問題是在僅給定觀察值 x → {\displaystyle {\vec { X}}} 。
在沒有任何進一步假設的情況下,生成的分類器稱為二次判別分析 (QDA)。
LDA 改為進行額外的簡化同方差假設(即類協方差相同,因此 Σ 0 = Σ 1 = Σ {\displaystyle \Sigma _{0}=\Sigma _{1}=\Sigma } ) 并且協方差具有滿秩。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/204091/