自信息
編輯在信息論中,信息內容、自信息、意外信息或香農信息是從隨機變量發生特定事件的概率導出的基本量。 它可以被認為是表達概率的另一種方式,很像 或對數 ,但它在信息論的設置中具有特殊的數學優勢。
香農信息可以解釋為量化特定結果的意外程度。 由于它是這樣一個基本量,它也出現在其他幾個設置中,例如在給定隨機變量的最佳源編碼的情況下傳輸事件所需的消息長度。
香農信息與熵密切相關,熵是隨機變量自信息的期望值,量化隨機變量平均有多驚奇。 這是觀察者在測量隨機變量時期望獲得的關于隨機變量的平均自我信息量。
信息內容可以用各種信息單位來表示,其中最常見的是位(更準確地稱為香農),如下所述。
定義
編輯選擇克勞德·香農 (Claude Shannon) 的自信息定義來滿足幾個公理:
- 概率為 xxx 的事件完全不足為奇,不會產生任何信息。
- 事件的可能性越小,它就越令人驚訝,它產生的信息就越多。
- 如果單獨測量兩個獨立事件,則總信息量為各個事件自身信息量之和。
詳細推導如下,但可以證明存在xxx滿足這三個公理的概率函數,直到乘法比例因子。
基數 b 對應于上面的比例因子。 b的不同選擇對應不同的信息單位:當b=2時,單位為shannon(符號Sh),常稱為a'bit'; 當b=e時,單位為自然信息單位(符號nat); 當 b = 10 時,單位為哈特利(符號哈特)。
使用符號 I X ( x ) {\displaystyle I_{X}(x)} 表示上面的自我信息并不普遍。 由于符號 I ( X ; Y ) {\displaystyle I(X;Y)} 也經常用于相關的互信息量,許多作者使用小寫的 h X ( x ) {\displaystyle h_{X} (x)} 代替自熵,鏡像使用大寫 H ( X ) {\displaystyle H(X)} 作為熵。
屬性
編輯概率的單調遞減函數
對于給定的概率空間,與更常見的值相比,對罕見事件的測量在直覺上更令人驚訝,并產生更多的信息內容。 因此,自信息是概率的嚴格遞減單調函數,有時也稱為反調函數。
雖然標準概率由區間 [ 0 , 1 ] {\displaystyle [0,1]} 中的實數表示,但自我信息由區間 [ 0 , ∞ ] {\displaystyle [0] 中的擴展實數表示 ,\infty ]} 。 特別是,對于任何對數底的選擇,我們有以下內容:
- 如果一個特定事件有 xxx 的發生概率,那么它的自我信息是 ? log ? ( 1 ) = 0 {\displaystyle -\log(1)=0} :它的發生是完全非 令人驚訝并且沒有提供任何信息。
- 如果一個特定事件發生的概率為 0%,那么它的自我信息是 ? log ? ( 0 ) = ∞ {\displaystyle -\log(0)=\infty } :它的發生是無限的 令人驚訝。
由此,我們可以得到一些一般性質:
- 直覺上,更多信息是通過觀察意外事件獲得的——這是令人驚訝的。
- 例如,如果愛麗絲有百萬分之一的機會贏得xxx,那么她的朋友鮑勃在得知她中獎后獲得的信息要比她在某一天輸掉時獲得的信息多得多。
- 這在隨機變量的自信息與其方差之間建立了隱式關系。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/193680/