• 特征(機器學習)

    編輯
    本詞條由“匿名用戶” 建檔。

    特征(機器學習)

    編輯

    機器學習模式識別中,特征是一個現象的個別可測量的屬性或特征。在模式識別、分類和回歸中,選擇信息量大的、有區別的和獨立的特征是有效算法的一個關鍵因素。特征通常是數字性的,但結構性的特征如字符串圖形被用于句法模式識別中。特征的概念與統計技術(如線性回歸)中使用的解釋變量的概念有關。

    特征(機器學習)的分類

    編輯

    一個數字特征可以方便地用一個特征向量來描述。實現二元分類的一種方法是使用線性預測函數(與感知器有關),以特征向量作為輸入。該方法包括計算特征向量和權重向量之間的標量乘積,限定那些結果超過閾值的觀測值。從特征向量進行分類的算法包括近鄰分類、神經網絡和統計技術,如貝葉斯方法。

    特征(機器學習)的例子

    編輯

    在字符識別中,特征可能包括沿水平和垂直方向計算黑色像素數量的直方圖、內部孔洞的數量、筆畫檢測和其他許多特征。在語音識別中,識別音素的特征可以包括噪聲比、聲音的長度、相對功率過濾器匹配和其他許多特征。在垃圾郵件檢測算法中,特征可能包括某些電子郵件標題的存在與否、電子郵件的結構、語言、特定術語的頻率、文本的語法正確性。在計算機視覺中,有大量可能的特征,如邊緣和物體。

    特征(機器學習)的擴展

    編輯

    在模式識別和機器學習中,特征向量是一個代表某些對象的n維數字特征向量。機器學習中的許多算法都需要對物體進行數字表示,因為這樣的表示方式有利于處理和統計分析。當表示圖像時,特征值可能對應于圖像的像素,而當表示文本時,特征可能是文本術語的出現頻率。特征向量等同于統計程序中使用的解釋變量向量,如線性回歸。特征向量通常與使用點乘的權重相結合,以構建一個線性預測函數,用于確定進行預測的分數。與這些向量相關的向量空間通常被稱為特征空間。為了降低特征空間的維度,可以采用一些降維技術。

    數據域測量

    更高層次的特征可以從已有的特征中獲得,并添加到特征向量中;例如,對于疾病的研究,"年齡"這個特征很有用,其定義為年齡="死亡年份"減去"出生年份"。這個過程被稱為特征構建。特征構建是將一組構造性操作符應用于一組現有的特征,從而構建出新的特征。這種構造運算符的例子包括檢查平等條件{=,≠},算術運算符{+,-,×,/},數組運算符{max(S),min(S),average(S)}以及其他更復雜的運算符,例如count(S,C),計算特征向量S中滿足某些條件C的特征數量,或者,例如通過某些接受設備概括的與其他識別類別的距離。長期以來,特征構造被認為是提高準確性和理解結構的有力工具,特別是在高維問題上。其應用包括對疾病的研究和語音的情感識別。

    選擇和提取

    編輯

    最初的原始特征集可能是多余的,而且太大,難以管理。因此,在機器學習和模式識別的許多應用中,一個初步的步驟是選擇一個特征子集,或構建一個新的、減少的特征集以促進學習,并提高概括性和可解釋性。提取或選擇特征是藝術和科學的結合;開發這樣的系統被稱為特征工程。它需要對多種可能性進行試驗,并將自動化技術與領域專家的直覺和知識相結合。將這一過程自動化就是特征學習,機器不僅使用特征進行學習,而且自己學習特征。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/175629/

    (4)
    詞條目錄
    1. 特征(機器學習)
    2. 特征(機器學習)的分類
    3. 特征(機器學習)的例子
    4. 特征(機器學習)的擴展
    5. 選擇和提取

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久