什么是大詞
編輯一個大詞或二詞是一串標記中兩個相鄰元素的序列,這些標記通常是字母、音節或單詞。一個大詞是一個n=2的n-gram。在許多應用中,包括在計算語言學、密碼學、語音識別等方面,字符串中每個大段的頻率分布通常被用于文本的簡單統計分析。Gappybigrams或skipingbigrams是允許有間隙的詞對(也許是避免連接詞,或允許某種模擬的依賴關系,如依賴語法)。細節大詞有助于在應用條件概率的關系時,提供一個標記在前面的標記下的條件概率。{displaystyleP(W_{n-1},W_{n})},除以前面標記的概率。應用Bigrams被用于大多數成功的語音識別語言模型中。它們是N-gram的一個特例。大字形頻率攻擊可用于密碼學中,以解決密碼圖。Bigram頻率是統計語言識別的一種方法。邏輯學或娛樂語言學中的一些活動涉及到大詞。這些活動包括試圖找到以每一個可能的大詞開頭的英語單詞,或含有一串重復大詞的單詞,如logogogue。
英語中的大詞頻率
編輯在一個大型英語語料庫中,最常見的字母大詞的頻率,四舍五入到最接近的小數點。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/163789/