潛在類別模型
編輯在統計學中,潛在類模型 (LCM) 將一組觀察到的(通常是離散的)多變量變量與一組潛在變量相關聯。 它是一種潛在變量模型。 它被稱為潛在類模型,因為潛在變量是離散的。 一個類別的特征是條件概率模式,該模式表明變量取特定值的可能性。
潛在類分析 (LCA) 是結構方程模型的一個子集,用于在多變量分類數據中查找案例的組或子類型。 這些子類型稱為潛在類。
面對如下情況,研究人員可能會選擇使用 LCA 來理解數據:假設已經在患有 X、Y 和 Z 疾病的一系列患者中測量了癥狀 a-d,并且疾病 X 與存在相關 癥狀 a、b 和 c,疾病 Y 具有癥狀 b、c、d,疾病 Z 具有癥狀 a、c 和 d。
LCA 將嘗試檢測潛在類別(疾病實體)的存在,從而在癥狀中創建關聯模式。 與在因素分析中一樣,LCA 也可用于根據xxx似然類別成員對案例進行分類。
因為解決 LCA 的標準是實現潛在類別,其中一個癥狀與另一個癥狀不再有任何關聯(因為類別是導致它們關聯的疾病),以及患者患有的疾病集(或類別 a case is a member of) 導致癥狀關聯,癥狀將是有條件獨立的,即,以類成員身份為條件,它們不再相關。
型號
編輯在每個潛在類別中,觀察到的變量在統計上是獨立的。 這是一個重要的方面。 通常觀察到的變量在統計上是相關的。 通過引入潛在變量,在類內變量是獨立的(局部獨立性)的意義上恢復了獨立性。 然后我們說觀察到的變量之間的關聯由潛在變量的類別來解釋 (McCutcheon, 1987)。
其中 T {displaystyle T} 是潛在類別的數量,而 p t {displaystyle p_{t}} 是所謂的招募者無條件概率,應該總和為一。 p i n , t n {displaystyle p_{i_{n},t}{n}} 是邊際或條件概率。
這種雙向模型與概率潛在語義分析和非負矩陣分解有關。
相關方法
編輯有許多具有不同名稱和用途的方法具有共同的關系。 與 LCA 一樣,聚類分析用于在數據中發現類群類案例組。 多元混合估計 (MME) 適用于連續數據,并假設此類數據來自混合分布:想象一組身高來自男性和女性的混合。 如果多元混合估計受到約束,使得每個分布中的度量必須不相關,則稱為潛在剖面分析。 經過修改以處理離散數據,這種受約束的分析被稱為 LCA。 離散的潛在特征模型進一步限制類別從單一維度的片段形成:本質上是將成員分配給該維度的類別:一個例子是根據能力或優點的維度將案例分配給社會類別。
作為一個實際例子,變量可以是政治問卷的多項選擇項目。 本例中的數據由一個 N 向列聯表組成,其中包含許多受訪者對項目的答案。 給定組成員資格,條件概率指定選擇某些答案的機會。
申請
編輯LCA 可用于許多領域,例如:協同過濾、行為遺傳學和診斷測試評估。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/204089/