• 領域適應

    編輯
    本詞條由“匿名用戶” 建檔。

    領域適應

    編輯

    領域適應是一個與機器學習和遷移學習相關的領域。當我們旨在從源數據分布中學習一個在不同(但相關)目標數據分布上表現良好的模型時,就會出現這種情況。例如,常見的垃圾郵件過濾問題的任務之一是將一個模型從一個用戶(源分布)適應到一個收到明顯不同的電子郵件的新用戶(目標分布)。領域適應也被證明有利于學習不相關的來源。注意,當有一個以上的來源分布時,這個問題被稱為多來源領域適應。

    領域適應的概述

    編輯

    領域適應是將在一個或多個源域中訓練的算法應用于不同(但相關)的目標域的能力。領域適應是遷移學習的一個子類別。在領域適應中,源域和目標域都有相同的特征空間(但分布不同);相反,遷移學習包括目標域的特征空間與源特征空間不同的情況。

    領域轉移

    編輯

    領域轉移,或稱分布性轉移,是指算法的訓練數據集與它在部署時遇到的數據集之間的數據分布變化。這些領域轉移在人工智能的實際應用中很常見。傳統的機器學習算法往往不能很好地適應領域的轉變。現代機器學習界有許多不同的策略,試圖獲得更好的領域適應性。

    領域適應的例子

    編輯

    一個在新聞郵件上訓練的算法可能必須適應新的生物醫學文件數據集。一個垃圾郵件過濾器,在訓練期間針對某組電子郵件用戶進行訓練,在部署時必須適應新的目標用戶。將在與以前疾病相關的標記數據上訓練的人工智能診斷算法應用于與COVID-19大流行相關的新的無標記數據。突如其來的社會變化,如大流行病的爆發,會構成領域轉移,導致在現在已經過時的消費者數據上訓練的機器學習算法失敗,需要干預。其他應用包括wifi定位檢測計算機視覺的許多方面。

    形式化

    編輯

    讓{displaystyleX}是輸入空間(或描述空間)。是輸入空間(或描述空間),讓{displaystyleY}是輸入空間(或描述空間),讓Y是輸出空間(或標簽空間)。機器學習算法的目標是學習一個數學模型(一個假說){displaystyleXtimesY}(未知且固定)。(未知和固定)。然后,我們的目標是學習{displaystyleS}中),使其對來自分布的新例子的標記誤差最小。),從而使它在給來自分布的新例子貼標簽時犯的錯誤最小。

    領域自適應

    監督學習和領域適應之間的主要區別在于,在后者的情況下,我們研究兩個不同(但相關)的分布{displaystyleh}(從來自兩個領域的有標簽或無標簽樣本中學習(從來自兩個領域的有標簽或無標簽的樣本中),使其在目標領域中的錯誤盡可能小。主要問題如下:如果一個模型是從源域中學習的,那么它對來自目標域的數據進行正確標記的能力是什么?

    領域適應的不同類型

    編輯

    領域適應有幾種情況。它們在考慮目標任務的信息方面有所不同。無監督領域適應:學習樣本包含一組有標簽的源樣本、一組無標簽的源樣本和一組無標簽的目標樣本。半監督領域適應:在這種情況下,我們也考慮一小部分有標簽的目標樣本。監督領域適應:所有考慮的樣本都應該是有標簽的。四種算法原則重權算法目標是重權源標簽樣本,使其看起來像目標樣本(就考慮的誤差尺度而言)。

    迭代算法

    編輯

    適應的方法包括對目標樣本進行迭代式的自動標記。其原理很簡單。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/175584/

    (4)
    詞條目錄
    1. 領域適應
    2. 領域適應的概述
    3. 領域轉移
    4. 領域適應的例子
    5. 形式化
    6. 領域適應的不同類型
    7. 迭代算法

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久