• 量化(機器學習)

    編輯
    本詞條由“匿名用戶” 建檔。

    量化(機器學習)

    機器學習數據挖掘中,量化(又稱學習量化,或監督流行估計,或類先驗估計)是指使用監督學習來訓練模型(量化器),以估計未標記的數據項目樣本中感興趣類的相對頻率(也稱為流行值)。量化也可以被看作是訓練預測器的任務,這些預測器可以估計一個(離散的)概率分布,即產生一個預測分布,該分布接近于項目在相關類別中的未知真實分布。量化與分類不同,因為分類的目標是預測單個數據項的類別標簽,而量化的目標是預測一組數據項的類別流行值。量化也不同于回歸,因為在回歸中,訓練數據項有實值標簽,而在量化中,訓練數據項有類標簽。多項研究工作表明,通過對所有未貼標簽的實例進行分類,然后計算歸屬于每個類別的實例("分類和計數"方法)來進行量化,通常會導致次優的量化精度。這種次優性可以被看作是"瓦普尼克原則"的直接后果,該原則指出。如果你擁有用于解決某些問題的有限信息量,那么請嘗試直接解決該問題,而不要作為中間步驟解決一個更普遍的問題。有可能現有的信息足以直接解決問題,但卻不足以解決一個更一般的中間問題。在我們的案例中,要直接解決的問題是量化,而更一般的中間問題是分類。由于"分類和計數"方法的次優性,量化已經發展成為一個獨立的任務,與分類不同。

    量化任務

    根據所使用的類集的特點,量化的主要變體是。二進制量化,對應于只有n=2的情況{displaystylen=2}類,每個數據項正好屬于類,并且每個數據項正好屬于其中一個。單標簽多類量化,對應于有n>2的情況{displaystylen>2}類,并且每個數據項恰好屬于其中一個。類,并且每個數據項正好屬于其中一個。有序量化,對應于單標簽多類情況,在這種情況下,在類的集合上定義了一個總的順序。大多數已知的量化方法處理二進制情況或單標簽多類情況,只有少數方法處理有序的情況。

    量化的評價措施

    有幾種評價措施可用于評價量化方法的誤差。由于量化包括生成一個估計真實概率分布的預測概率分布,這些評價措施是比較兩個概率分布的。大多數量化的評價措施屬于分歧類。二元量化和單標簽多類量化的評價措施有

    量化交易

    xxx誤差

    平方誤差

    相對xxx誤差的評價措施有歸一化匹配距離根歸一化秩序感知距離應用量化在社會科學、流行病學、市場研究和生態建模等領域具有特殊的意義,因為這些領域本來就與總體數據有關;但是,量化在這些領域之外的應用中也很有用,比如測量分類器的偏差和執行分類器的公平性,進行詞義消歧,分配資源,以及提高分類器的準確性。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/175918/

    (3)
    詞條目錄
    1. 量化(機器學習)
    2. 量化任務
    3. 量化的評價措施
    4. 絕對誤差
    5. 平方誤差

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久