• 多實例學習

    編輯
    本詞條由“匿名用戶” 建檔。

    多實例學習

    編輯

    機器學習中,多實例學習(MIL)是監督學習的一種類型。學習者不是收到一組單獨標記的實例,而是收到一組標記的包,每個包都包含許多實例。在多實例二元分類的簡單案例中,如果一個包中的所有實例都是負面的,那么這個包就可能被標記為負面。另一方面,如果一個包中至少有一個實例是正面的,那么這個包就被標記為正面。從已標記的包的集合中,學習者試圖(i)誘導一個概念,以正確標記單個實例,或者(ii)學習如何在不誘導概念的情況下標記包。Babenko(2008)給出了一個簡單的MIL例子。想象一下,有幾個人,他們每個人都有一個鑰鏈,里面有幾把鑰匙。其中一些人能夠進入某個房間,而一些人則不能。那么任務就是預測某把鑰匙或某條鑰匙鏈是否能讓你進入那個房間。為了解決這個問題,我們需要找到所有"正面"鑰匙鏈所共有的確切鑰匙。如果我們能正確識別這把鑰匙,我們也能正確地對整個鑰匙鏈進行分類--如果它包含所需的鑰匙,則為正,如果不包含,則為負。

    機器學習

    編輯

    根據訓練數據的類型和變化,機器學習可以大致分為三個框架:監督學習、無監督學習和強化學習。多實例學習(MIL)屬于監督學習框架,每個訓練實例都有一個標簽,要么是離散的,要么是實值的。多實例學習處理的是訓練集中標簽的不完全知識問題。更確切地說,在多實例學習中,訓練集由標記的"袋"組成,每個袋都是未標記實例的集合。如果一個袋中至少有一個實例是正面的,那么這個袋就是正面的標簽,如果其中所有的實例都是負面的,那么這個袋就是負面的標簽。MIL的目標是預測新的、未見過的包的標簽。歷史上,Keeler等人在20世紀90年代初的工作中是xxx個探索MIL領域的人。實際的術語多實例學習是在20世紀90年代中期由Dietterich等人提出的,當時他們正在研究藥物活動預測的問題。他們試圖創建一個學習系統,通過分析已知分子的集合,預測新分子是否有資格制造某種藥物。分子可以有許多可供選擇的低能狀態,但只有一個或其中一些有資格制造藥物。問題的出現是因為科學家們只能確定分子是否合格,但他們無法準確地說出其低能量形狀中的哪一種是負責的。解決這個問題的擬議方法之一是使用監督學習,并將合格分子的所有低能量形狀視為積極的訓練實例,而將不合格分子的所有低能量形狀視為消極實例。Dietterich等人的研究表明,這種方法會有很高的假陽性噪聲,因為所有的低能量形狀都被誤標為陽性,因此并不真正有用。

    多任務學習

    他們的方法是把每個分子看作是一個有標簽的包,而該分子的所有替代性低能量形狀是包中的實例,沒有單獨的標簽。因此形成了多實例學習。Dietterich等人提出的多實例學習問題的解決方案是軸-平行矩形(APR)算法。它試圖搜索由特征的結合所構建的適當的軸平行矩形。他們在Musk數據集上測試了該算法,該數據集是藥物活性預測的具體測試數據,也是多實例學習中最常用的基準。APR算法取得了xxx的結果,但APR是在考慮了Musk數據后設計的。多實例學習的問題并不是藥物發現所獨有的。1998年,Maron和Ratan發現了多實例學習在機器視覺中場景分類的另一個應用,并設計了DiverseDensity框架。給定一個圖像,一個實例被認為是一個或多個固定大小的子圖像,而實例包被認為是整個圖像。如果圖像包含目標場景--例如瀑布--則被標記為正面,反之則為負面。多實例學習可以用來學習描述目標場景的子圖像的屬性。

    多實例學習的例子

    編輯

    給定一個圖像,我們想根據它的視覺內容知道它的目標類別。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/175830/

    (1)
    詞條目錄
    1. 多實例學習
    2. 機器學習
    3. 多實例學習的例子

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久