視頻壓縮
編輯視頻壓縮用于降低數字化視頻信號的數據速率,使其更易于存儲或傳輸。 可實現的壓縮率通常在 1:5 到 1:500 之間。
視頻壓縮起源于靜止圖像壓縮。 MJPEG 等更簡單的方法可以獨立壓縮視頻中的各個圖像。 可實現的壓縮率約為 1:10。進一步開發的方法還使用各個部分圖像之間的相似性進行編碼。 今天可以用它實現的壓縮率超過 1:100,而質量幾乎沒有任何降低。
基礎知識
編輯壓縮算法基于
- 視頻信號的冗余和
- 人類視覺的不足和生理影響。
減少冗余和減少不相關性這兩個術語來自信息論,描述了在傳輸信息時減少數據量的兩種不同方法。 使用一種模型,其中信息從源傳輸到匯。 轉移到視頻編碼的具體案例中,源對應于原始攝像機中出現的視頻圖像序列,接收器對應于觀看者的眼睛。
減少冗余
冗余減少使用源數據的屬性來減少要傳輸的數據量。 在視頻編碼的情況下,使用圖像信號的統計特性以及時間和空間相鄰像素之間的相似性(相關性),以實現盡可能緊湊的表示。 可以實現從 1:2 到 1:5 的壓縮系數。 由于沒有信息丟失,所以稱為無損編碼。
幀間編碼方法從已經傳輸的單個圖像中推斷估計值,因此只有估計誤差仍然需要傳輸,用于利用時間相關性。存在空間相關性的幀內編碼方法,它使用與空間周圍點的估計值的差異對像素進行編碼,或者識別像素跨越圖像模式并更緊湊地描述它們。使用所謂的→熵編碼利用統計冗余。
減少不相關
減少不相關性的目的是在傳輸過程中省略與信宿無關的信息。 它考慮到人類視覺感知的生理特性,并故意丟棄信息,使由此產生的干擾對人類觀察者來說盡可能不顯眼。 這意味著通常可以進一步壓縮 1:2 到 1:50,具體取決于過程和所需的質量。 由于信息被丟棄,因此稱為有損編碼。
具體來說,在視頻編碼的情況下,這意味著只有部分圖像數據通過量化傳輸。
由于由于眼睛的解剖結構,顏色感知的空間分辨率比亮度差異的分辨率差,因此可以降低顏色信息的分辨率,而不會在很大程度上感知到差異。 這稱為顏色欠采樣。 在大多數情況下,在編碼之前轉換為相應的顏色模型,這通常會降低 50% 的數據率。
可以利用的視覺系統的另一個屬性是頻率依賴性。 像聲音一樣,圖像也可以表示為二維振動的疊加。 低圖像頻率導致圖像結構粗糙,高圖像頻率導致精細細節。 不同頻率范圍內的干擾被感知到的程度不同,這可以用一個簡單的測試圖像清楚地說明。
這種頻率依賴性在經過適當的轉換后作為量化中的心理視覺因素被用于 MPEG 家族的所有視頻壓縮方法中。
基本技術
編輯視頻壓縮程序由幾個子程序組成,即所謂的壓縮工具,它們利用不同類型的冗余。 幀內預測(像素外推)的方法基于空間相鄰像素之間的相關性和差分編碼)和變換編碼,在所謂的幀間編碼中使用時間依賴性,例如運動補償和差分編碼(DPCM),最后通過熵編碼減少統計冗余。
變頻
在基于塊的變換編碼(例如使用離散余弦變換 DCT)的情況下,幀被分成正方形塊,并根據它們的復雜性對其進行評估。 此步驟是必要的,以便編解碼器“知道”它需要大量存儲空間的(復雜)圖像塊以及對于哪些(簡單)塊,更少的位就足夠了。 這是減少無關緊要的前提。
差分編碼
差分脈沖編碼調制 (DPCM) 通常用于利用相鄰像素之間或單個圖像之間的相似性:僅存儲與已傳輸的單個圖像或像素的差異。 在幀間編碼的情況下,該過程由運動校正來補充。
運動校正
另一種減少數據量的方法是運動補償。 搜索比最后一幀移動得更遠的匹配圖像部分。 為這些保存了一個運動矢量,非移動的矢量只是從最后一幀接管。
熵編碼
使用具有可變字長的代碼可以去除值序列中的統計冗余。 不是用一個恒定的碼字長度對所有要傳輸的符號進行編碼,而是將出現頻率更高或出現概率更大的符號用比稀有符號更短的碼字編碼,算術編碼方法在這里得到了xxx的傳播。 然而,在某些情況下,較舊的霍夫曼編碼或不太復雜的行程編碼的變體仍在使用。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/341895/