目錄
統計機器翻譯
編輯統計機器翻譯(SMT)是一種機器翻譯范例,其中翻譯是根據統計模型生成的,統計模型的參數來自對雙語文本語料庫的分析。統計方法與基于規則的機器翻譯方法以及基于示例的機器翻譯方法形成對比。
沃倫·韋弗(Warren Weaver)于1949年提出了統計機器翻譯的最初思想,包括應用克勞德·香農(Claude Shannon)的信息論的思想。IBM的Thomas J. Watson研究中心的研究人員在1980年代末和1990年代初重新引入了統計機器翻譯,并且近年來,機器翻譯的興趣重新興起。 在引入神經機器翻譯之前,它是迄今為止研究最廣泛的機器翻譯方法。
統計機器翻譯好處
編輯與基于規則的方法相比,統計機器翻譯最常被引用的好處是:
統計機器翻譯缺點
編輯- 創建語料庫的成本可能很高。
- 特定錯誤很難預測和修復。
- 結果可能具有表面的流利性,從而掩蓋了翻譯問題。
- 對于詞序明顯不同的語言對,統計機器翻譯通常效果較差。
- 由于較小的訓練語料庫和較大的語法差異,西歐語言之間的翻譯所獲得的好處不能代表其他語言對的結果。
實現統計機器翻譯的系統
編輯- Google翻譯(從2016年開始過渡到神經機器翻譯)
- 微軟翻譯器(2016年開始過渡到神經機器翻譯)
- Omniscien Technologies
- SYSTRAN(從2016年開始過渡到神經機器翻譯)
- Yandex.Translate(在2017年轉換為結合了神經機器翻譯的混合方法)
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/111986/