計算聽覺場景分析
編輯計算聽覺場景分析(CASA)是通過計算手段對聽覺場景分析的研究。從本質上講,CASA系統是機器聽覺系統,旨在以人類聽眾的方式分離聲源的混合物。CASA與盲目的信號分離領域不同,因為它(至少在某種程度上)是基于人類聽覺系統的機制,因此使用的是不超過兩個麥克風的聲學環境錄音。它與雞尾酒會問題有關。
計算聽覺場景分析的原理
編輯由于CASA的作用是模擬聽覺系統的功能部分,因此有必要用已知的物理模型來看待生物聽覺系統的部分。由外耳、中耳和內耳三個區域組成,聽覺xxx作為一個復雜的換能器,將聲音振動轉換為聽覺神經的動作電位。外耳由外耳、耳道和耳鼓組成。外耳像一個聲學漏斗,幫助定位聲源。耳道作為一個諧振管(像一個風琴管),可以放大2-5.5千赫茲的頻率,xxx放大率約為11分貝,發生在4千赫茲左右。作為聽覺器官,耳蝸由兩層膜組成,即賴斯納膜和基底膜。基底膜通過特定的刺激頻率與基底膜特定區域的諧振頻率相匹配,對音頻刺激進行移動。基底膜的運動使內毛細胞向一個方向移動,這在螺旋神經節細胞中編碼了一個半波整流的動作電位信號。這些細胞的軸突構成了聽覺神經,對整流刺激進行編碼。聽覺神經的反應選擇某些頻率,與基底膜相似。對于較低的頻率,纖維表現出相位鎖定。高等聽覺通路中心的神經元對特定的刺激特征進行調諧,如周期性、聲音強度、振幅和頻率調制。通過后部皮層區域,包括后部顳上葉和后部扣帶,ASA也有神經解剖學上的關聯。研究發現,在阿爾茨海默病患者中,ASA以及隔離和分組操作的障礙會受到影響。
系統結構
編輯蝸牛圖
作為CASA處理的xxx階段,蝸牛圖創造了輸入信號的時間-頻率表示。通過模仿外耳和中耳的組成部分,信號被分解成不同的頻率,由耳蝸和毛細胞自然選擇。由于基底膜的頻率選擇性,一個濾波器組被用來模擬該膜,每個濾波器都與基底膜上的一個特定點相關。由于毛細胞產生尖峰模式,模型的每個濾波器也應在脈沖響應中產生類似的尖峰。使用gammatone濾波器提供的脈沖響應是伽馬函數和音調的乘積。伽馬音濾波器的輸出可以被視為基底膜位移的測量。大多數CASA系統表示聽覺神經中的發射率,而不是基于尖峰的。
為了得到這一點,濾波器組的輸出要經過半波整流,然后再加上一個平方根。(其他模型,如自動增益控制器也已實現)。半整流波類似于毛細胞的位移模型。毛細胞的其他模型包括Meddis毛細胞模型,它與gammatone濾波器組配對,通過模擬毛細胞的轉導。基于這樣的假設:每個毛細胞內有三個發射物質庫,發射物質的釋放與基底膜的位移程度成正比,釋放與神經纖維中產生尖峰的概率相等。這個模型復制了CASA系統中的許多神經反應,如整流、壓縮、自發發火和適應。
關聯圖
編輯通過統一2個音高理論流派,建立了音高感知的重要模型。位置理論(強調已解決的諧波的作用)時間理論(強調未解決的諧波的作用)相關圖通常在時域中通過模擬聽覺神經發射活動與每個濾波器通道的輸出的自相關計算出來。通過匯集跨頻率的自相關,匯總的相關圖中的峰值位置與感知的音高相對應。
交叉相關圖
編輯于耳朵在不同的時間接收音頻信號,所以可以通過使用從兩只耳朵檢索的延遲來確定聲源。通過交叉關聯左、右聲道(的模型)的延遲,重合的峰值可以被歸類為同一局部的聲音,盡管它們的時間位置。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/167891/