统计机器翻译(SMT)步骤总结
本文是在Niutrans论坛中的系列教程中总结出来的。 1、语料预处理 预处理的结果是生成双语分词之后的文件,该步需要注意的是对规则短语,比如数字、日期、网址等,进行泛化处理。可以用正则方法或者其 ...
本文是在Niutrans论坛中的系列教程中总结出来的。 1、语料预处理 预处理的结果是生成双语分词之后的文件,该步需要注意的是对规则短语,比如数字、日期、网址等,进行泛化处理。可以用正则方法或者其 ...