特征學習
編輯在機器學習中,特征學習或表征學習是一套技術,允許系統自動發現原始數據中特征檢測或分類所需的表征。這取代了人工特征工程,并允許機器既學習特征,又使用它們來執行特定任務。特征學習的動機是,機器學習任務(如分類)通常需要在數學上和計算上方便處理的輸入。然而,現實世界的數據,如圖像、視頻和傳感器數據,并沒有讓人嘗試用算法來定義特定的特征。另一種方法是通過檢查發現這些特征或表征,而不依賴明確的算法。特征學習可以是有監督的、無監督的或自監督的。在有監督的特征學習中,特征是使用標記的輸入數據學習的。標簽數據包括輸入-標簽對,其中輸入是給模型的,它必須產生地面真相標簽作為正確答案。這可以利用模型生成特征表示,從而獲得高的標簽預測精度。例如,有監督的神經網絡、多層感知器和(有監督的)字典學習。在無監督的特征學習中,通過分析數據集中各點之間的關系,用未標記的輸入數據學習特征。例子包括字典學習、獨立成分分析、矩陣分解和各種形式的聚類。在自我監督的特征學習中,特征的學習與無監督的學習一樣,使用無標簽的數據,但是輸入-標簽對是從每個數據點構建的,這使得通過監督的方法(如梯度下降)學習數據的結構。經典的例子包括詞嵌入和自動編碼器。此后,SSL通過使用深度神經網絡架構(如CNN和Transformers)被應用于許多模式。有監督的有監督的特征學習是從標記的數據中學習特征。數據標簽允許系統計算一個錯誤項,即系統未能產生標簽的程度,然后可以作為反饋來糾正學習過程(減少/盡量減少錯誤)。方法包括。
監督下的字典學習
編輯字典學習從輸入數據中開發出一組有代表性的元素(字典),這樣每個數據點都可以被表示為有代表性元素的加權和。詞典元素和權重可以通過最小化平均表示誤差(在輸入數據上)來找到,同時對權重進行L1正則化以實現稀疏性(即每個數據點的表示只有幾個非零權重)。監督下的字典學習同時利用了輸入數據的基礎結構和優化字典元素的標簽。例如,這種監督字典學習技術通過共同優化字典元素、代表數據點的權重以及基于輸入數據的分類器參數,將字典學習應用于分類問題。特別是,制定了一個最小化問題,其中目標函數由分類誤差、表示誤差、每個數據點的表示權重的L1正則化(以實現數據的稀疏表示)和分類器的參數的L2正則化組成。
神經網絡
編輯神經網絡是一個學習算法系列,使用由多層相互連接的節點組成的網絡。它的靈感來自于動物的神經系統,其中節點被視為神經元,邊緣被視為突觸。每條邊都有一個相關的權重,網絡定義了將輸入數據從網絡的輸入層傳遞到輸出層的計算規則。與神經網絡相關的網絡函數表征了輸入層和輸出層之間的關系,該關系由權重進行參數化。有了適當定義的網絡函數,各種學習任務可以通過最小化網絡函數(權重)的成本函數來完成。多層神經網絡可以用來進行特征學習,因為它們在隱藏層學習其輸入的表示,隨后在輸出層用于分類或回歸。這種類型的最流行的網絡結構是連體網絡。
無監督
編輯無監督的特征學習是指從未標記的數據中學習特征。無監督特征學習的目標通常是發現低維特征,以捕捉高維輸入數據中的一些結構。當特征學習以無監督的方式進行時,它可以實現一種半監督學習,即從無標簽數據中學習的特征。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/175637/