原文:统计机器翻译(SMT)步骤总结

语料预处理 预处理的结果是生成双语分词之后的文件,该步需要注意的是对规则短语,比如数字 日期 网址等,进行泛化处理。可以用正则方法或者其它方法。注意日期中的点和外文人名中的点和网址中的点和句末标点要区分开来,数字和日期也要区分开来。 其中变化比较大的,比较难处理的,应该是中文的日期,因为它的格式比较多变。从文本中抽取出来中文日期时间 或者更进一步的转化成标准的时间格式 ,有一个办法,就是用tri ...

2019-04-28 16:27 0 900 推荐指数:

查看详情

统计机器翻译(SMT)步骤总结

本文是在Niutrans论坛中的系列教程中总结出来的。 1、语料预处理 预处理的结果是生成双语分词之后的文件,该步需要注意的是对规则短语,比如数字、日期、网址等,进行泛化处理。可以用正则方法或者其它方法。注意日期中的点和外文人名中的点和网址中的点和句末标点要区分开来,数字和日期也要 ...

Tue Nov 04 18:15:00 CST 2014 0 4228
NMT 机器翻译

本文近期学习NMT相关知识,学习大佬资料,汇总便于后期复习用,有问题,欢迎斧正。 目录   RNN   Seq2Seq   Attention   Seq2Seq + Attention ...

Wed Mar 20 02:46:00 CST 2019 0 696
机器翻译机器翻译入门

机器翻译入门,传统的以及微软刘铁岩团队提出的Dual learning,相关内容转载如下。声明:一些内容转载并整合。 第一部分:转载自https://www.cnblogs.com/xing901022/p/7486601.html;作者:xingoo 我们先来看看 ...

Fri Jul 20 06:19:00 CST 2018 0 798
神经机器翻译-NMT

论文:   Neural Machine Translation by Jointly Learning to Align and Translate    提出背景:   机器翻译又称为自动翻译,是利用计算机将一种自然语言(源语言)转换成另外一种自然(目标语言)语言的过程,本质 ...

Tue Jun 18 00:55:00 CST 2019 0 1102
机器翻译技术的现状

广泛的文本,而不需要像统计机器翻译一样使用大量的范例文本训练翻译引擎。基于规则的翻译引擎的缺点是,必须为 ...

Tue Apr 21 17:54:00 CST 2015 0 2809
(转) 多模态机器翻译

本文转自: http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650722318&idx=4&sn=728e8e264 ...

Sun Jan 15 23:16:00 CST 2017 0 1438
机器翻译模型 Transformer

transformer是一种不同于RNN的架构,模型同样包含 encoder 和 decoder ,但是encoder 和 decoder 抛弃 了RNN,而使用各种前馈层堆叠在一起。 Encode ...

Wed Dec 12 11:22:00 CST 2018 0 1116
PyTorch实现机器翻译

https://www.boyuai.com/elites/course/cZu18YmweLv10OeV/jupyter/iyipD6HVEY_JSTscoKRTg 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT ...

Thu Feb 20 05:21:00 CST 2020 0 951
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM