卷積神經網絡
編輯在深度學習中,卷積神經網絡(CNN,或ConvNet)是一類人工神經網絡(ANN),最常用于分析視覺圖像。CNN也被稱為移位不變或空間不變的人工神經網絡(SIANN),基于卷積核或過濾器的共享權重架構,沿著輸入特征滑動并提供稱為特征圖的平移不變的響應。與直覺相反的是,大多數卷積神經網絡對翻譯不具不變性,因為它們對輸入進行了降采樣操作。它們在圖像和視頻識別、推薦系統、圖像分類、圖像分割、醫學圖像分析、自然語言處理、腦機接口和金融時間序列中都有應用。CNN是多層感知器的規范化版本。多層感知器通常意味著完全連接的網絡,也就是說,一層的每個神經元都與下一層的所有神經元相連。這些網絡的全連接性使它們很容易過度擬合數據。典型的正則化或防止過擬合的方法包括:在訓練過程中懲罰參數(如權重衰減)或修剪連接性(跳過的連接、輟學等)。CNN對正則化采取了不同的方法:它們利用數據中的層次模式,并利用壓印在其過濾器中的較小和較簡單的模式組裝出越來越復雜的模式。因此,在連接性和復雜性的尺度上,CNN處于較低的極端。卷積網絡受到生物過程的啟發,因為神經元之間的連接模式類似于動物視覺皮層的組織。單個皮層神經元只對視野中被稱為感受野的有限區域的刺激做出反應。不同神經元的感受野部分重疊,使其覆蓋整個視野。與其他圖像分類算法相比,CNN使用的預處理方法相對較少。這意味著網絡通過自動學習來優化過濾器(或內核),而在傳統算法中,這些過濾器是手工設計的。這種獨立于先驗知識和人工干預的特征提取是一個主要優勢。
卷積神經網絡的定義
編輯卷積神經網絡是一種專門的人工神經網絡,它使用一種叫做卷積的數xxx算來代替其至少一個層中的一般矩陣乘法。它們被專門設計用來處理像素數據,并被用于圖像識別和處理。
卷積神經網絡的架構
編輯卷積神經網絡由一個輸入層、隱藏層和輸出層組成。在任何前饋神經網絡中,任何中間層都被稱為隱藏層,因為它們的輸入和輸出被激活函數和最終卷積所掩蓋。在卷積神經網絡中,隱藏層包括執行卷積的層。通常,這包括一個執行卷積核與該層輸入矩陣的點積的層。這個積通常是Frobenius內積,其激活函數通常是ReLU。當卷積核沿著該層的輸入矩陣滑動時,卷積操作產生了一個特征圖,這反過來又有助于下一層的輸入。隨后是其他層,如池化層、全連接層和歸一化層。
卷積層
編輯在CNN中,輸入是一個張量,其形狀為:(輸入數量)×(輸入高度)×(輸入寬度)×(輸入通道)。通過卷積層后,圖像被抽象為一個特征圖,也叫激活圖,其形狀為:(輸入數)×(特征圖高度)×(特征圖寬度)×(特征圖通道)。
卷積層對輸入進行卷積,并將其結果傳遞給下一層。這類似于視覺皮層中的神經元對特定刺激的反應。每個卷積神經元只處理其接受區域的數據。雖然全連接的前饋神經網絡可以用來學習特征和分類數據,但這種架構對于較大的輸入,如高分辨率圖像,通常是不切實際的。它需要非常多的神經元,即使是淺層架構,由于圖像的輸入尺寸很大,每個像素都是一個相關的輸入特征。例如,一個尺寸為100×100的(小)圖像的全連接層在第二層的每個神經元有10,000個權重。相反,卷積減少了自由參數的數量,使網絡更加深入。例如,無論圖像大小如何,使用5×5的平鋪區域,每個共享權重相同,只需要25個可學習的參數。在較少的參數上使用正則化權重,可以避免梯度消失和擴大
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/174473/