• 神經機器翻譯

    編輯
    本詞條由“匿名用戶” 建檔。

    神經機器翻譯

    編輯

    神經機器翻譯(NMT)是一種機器翻譯方法,它使用人工神經網絡來預測單詞序列的可能性,通常在單個集成模型中對整個句子進行建模。

    屬性

    編輯

    它們僅需要傳統統計機器翻譯(SMT)模型所需內存的一小部分。此外,與常規翻譯系統不同,神經翻譯模型的所有部分都經過(端到端)聯合訓練,以最大化翻譯性能

    神經機器翻譯

    工作原理

    編輯

    神經機器翻譯不同于使用單獨設計的子組件的基于短語的統計方法。神經機器翻譯(NMT)并非在統計機器翻譯(SMT)的傳統方法之外的艱巨步驟。它的主要偏離是對單詞和內部狀態使用矢量表示形式(“嵌入”、“連續空間表示形式”)。模型的結構比基于短語的模型更簡單。沒有單獨的語言模型,翻譯模型和重新排序模型,而只有一個序列模型可以一次預測一個單詞。然而,該序列預測以整個源句子和整個已經產生的目標序列為條件。神經機器翻譯模型使用深度學習表征學習。

    首先,通常使用遞歸神經網絡(RNN)進行單詞序列建模。該神經網絡使用稱為編碼器的雙向遞歸神經網絡對第二RNN的源句進行編碼,該第二RNN被稱為解碼器,用于預測目標語言中的單詞。遞歸神經網絡在將長輸入編碼為單個向量時面臨困難。這可以通過注意力機制來補償這使得解碼器可以在生成輸出的每個字的同時專注于輸入的不同部分。還有其他覆蓋模型可以解決此類關注機制中的問題。例如忽略過去的對齊信息,從而導致翻譯過度和翻譯不足。

    對于長連續序列,卷積神經網絡(Convnets)原則上更好一些,但是由于一些弱點,最初并未使用。這些通過使用“注意機制”在2017年得到了成功的補償。

    基于注意力的模型,轉換器架構仍然是幾種語言對的主要架構。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/111013/

    (4)
    詞條目錄
    1. 神經機器翻譯
    2. 屬性
    3. 工作原理

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久