統計機器翻譯(SMT)步驟總結
本文是在Niutrans論壇中的系列教程中總結出來的。 1、語料預處理 預處理的結果是生成雙語分詞之后的文件,該步需要注意的是對規則短語,比如數字、日期、網址等,進行泛化處理。可以用正則方法或者其 ...
本文是在Niutrans論壇中的系列教程中總結出來的。 1、語料預處理 預處理的結果是生成雙語分詞之后的文件,該步需要注意的是對規則短語,比如數字、日期、網址等,進行泛化處理。可以用正則方法或者其 ...