• 語音編碼

    編輯
    本詞條由“匿名用戶” 建檔。

    語音編碼

    編輯

    語音編碼是對包含語音的數字音頻信號進行數據壓縮的一種應用。語音編碼使用語音特定的參數估計,使用音頻信號處理技術對語音信號進行建模,并結合通用數據壓縮算法在緊湊的比特流中表示生成的建模參數。

    語音編碼的一些應用是移動電話和IP語音(VoIP)。移動電話中使用最廣泛的語音編碼技術是線性預測編碼(LPC),而VoIP應用中使用最廣泛的是LPC和改進的離散余弦變換(MDCT)技術。

    語音編碼中使用的技術類似于音頻數據壓縮和音頻編碼中使用的技術,其中心理聲學知識僅用于傳輸與人類聽覺系統相關的數據。例如,在語音帶語音編碼中,僅傳輸400Hz到3500Hz頻帶中的信息,但重構的信號仍然足以提供可理解性。

    語音編碼與其他形式的音頻編碼的不同之處在于,語音是比大多數其他音頻信號更簡單的信號,并且可以獲得更多關于語音屬性的統計信息。結果,在語音編碼上下文中可能不需要一些與音頻編碼相關的聽覺信息。在語音編碼中,最重要的標準是在傳輸數據量有限的情況下保持語音的可懂度和“悅耳”。

    此外,大多數語音應用程序需要低編碼延遲,因為長編碼延遲會干擾語音交互。

    語音編碼的類別

    編輯

    語音編碼器有兩種類型:

    1. 波形編碼器
      • 時域:PCM、ADPCM
      • 頻域:子帶編碼,ATRAC
    2. 聲碼器

    樣本壓擴被視為語音編碼的一種形式

    編輯

    從這個角度來看,傳統PCM數字電話中使用的A-law和μ-law算法(G.711)可以看作是語音編碼的早期先驅,每個樣本只需要8位,但實際上提供了12位的分辨率.對數壓擴定律與人類聽覺感知一致,因為低幅度的噪聲沿著低幅度的語音信號被聽到,但被高幅度的信號掩蓋。雖然這會在音樂信號中產生不可接受的失真,但語音波形的尖峰性質與語音的簡單頻率結構結合為具有單一基頻的周期性波形偶爾添加噪聲突發,使這些非常簡單的瞬時壓縮算法可以接受語音。

    當時嘗試了各種各樣的其他算法,主要是在delta調制變體上,但經過仔細考慮,早期數字電話系統的設計者選擇了A-law/μ-law算法。在他們設計的時候,他們以非常低的復雜性減少了33%的帶寬,這是一個很好的工程折衷方案。它們的音頻性能仍然可以接受,并且無需在固定電話網絡中更換它們。

    2008年,具有可擴展結構的G.711.1編解碼器被ITU-T標準化。輸入采樣率為16kHz。

    現代語音壓縮

    編輯

    后期語音壓縮方面的大部分工作都是出于對安全軍用無線電數字通信的軍事研究的推動,其中需要非常低的數據速率才能在惡劣的無線電環境中有效運行。同時,以VLSI電路的形式提供的處理能力遠遠超過早期壓縮技術的處理能力。因此,現代語音壓縮算法可以使用比1960年代更復雜的技術來實現更高的壓縮比。

    語音編碼

    這些技術可通過用于民用應用的開放研究文獻獲得,從而允許創建具有比之前的模擬系統更高的信道容量的數字移動電話網絡。

    最廣泛使用的語音編碼算法是基于線性預測編碼(LPC)。特別是,最常見的語音編碼方案是基于LPC的碼激勵線性預測(CELP)編碼,例如在GSM標準中使用。在CELP中,建模分為兩個階段,一個是對頻譜包絡建模的線性預測階段,另一個是基于代碼本的線性預測模型殘差模型。在CELP中,線性預測系數(LPC)被計算和量化,通常作為線譜對(LSP)。除了信號的實際語音編碼外,通常還需要使用信道編碼進行傳輸,避免傳輸錯誤造成的損失。通常,語音編碼和信道編碼方法必須成對選擇,語音數據流中更重要的比特受到更魯棒的信道編碼的保護,以獲得最佳的整體編碼效果。

    改進的離散余弦變換(MDCT)是一種離散余弦變換(DCT)算法,被改編成一種稱為LD-MDCT的語音編碼算法,用于1999年引入的AAC-LD格式。MDCT已被在IP語音(VoIP)應用中被廣泛采用,例如2006年推出的G.729.1寬帶音頻編解碼器、Apple于2010年推出的Facetime(使用AAC-LD)、和CELT編解碼器2011年推出。

    Opus是一個免費的軟件語音編碼器。它結合了MDCT和LPC音頻壓縮算法。它被廣泛用于WhatsApp中的VoIP呼叫。PlayStation4視頻游戲機還使用CELT/Opus編解碼器進行其PlayStationNetwork系統聚會聊天。

    Codec2是另一個免費軟件語音編碼器,它設法實現了非常好的壓縮,低至700比特/秒。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/132222/

    (2)

    評論列表(1條)

    • 2845942090
      2845942090 2022年11月7日 上午10:42

      可以加上參考文獻嗎?

    詞條目錄
    1. 語音編碼
    2. 語音編碼的類別
    3. 樣本壓擴被視為語音編碼的一種形式
    4. 現代語音壓縮

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久