前言 近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整个自然语言领域最核心和关键的部分。而机器翻译评价对于机器翻译的研究和发展具有重要意义:机器翻译系统的开发者可以通过评测得知系统存在的问题而不断改进,用户也可以根据评测报告选择满足自己需求的产品,而对于机器翻译 ...
双语评估替换分数 简称BLEU 是一种对生成语句进行评估的指标。完美匹配的得分为 . ,而完全不匹配则得分为 . 。这种评分标准是为了评估自动机器翻译系统的预测结果而开发的,具备了以下一些优点: 计算速度快,计算成本低。 容易理解。 与具体语言无关。 已被广泛采用。 BLEU评分是由Kishore Papineni等人在他们 年的论文BLEU a Method for Automatic Eval ...
2018-08-03 11:32 0 5608 推荐指数:
前言 近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整个自然语言领域最核心和关键的部分。而机器翻译评价对于机器翻译的研究和发展具有重要意义:机器翻译系统的开发者可以通过评测得知系统存在的问题而不断改进,用户也可以根据评测报告选择满足自己需求的产品,而对于机器翻译 ...
的部分。而机器翻译评价对于机器翻译的研究和发展具有重要意义:机器翻译系统的开发者可以通过评测得知系统存在 ...
1,概述 机器翻译中常用的自动评价指标是 $BLEU$ 算法,除了在机器翻译中的应用,在其他的 $seq2seq$ 任务中也会使用,例如对话系统。 2 $BLEU$算法详解 假定人工给出的译文为$reference$,机器翻译的译文为$candidate$。 1)最早 ...
and Technology)方法是在BLEU方法上的一种改进。最主要的是引入了每个n-gram的信息 ...
原文连接 https://blog.csdn.net/guolindonggld/article/details/56966200 1. 简介 BLEU(Bilingual Evaluation Understudy),相信 ...
评测集,一组由原文和译文组成的文件,译文一般由专业的译员根据原文翻译获得,在计算BLEU的时候只需要把译 ...
翻译质量的方法。其本质是比对MT给出的结果(称为候选翻译,candidate)和事前知道的比较好的若干 ...
bleu全称为Bilingual Evaluation Understudy(双语评估替换),是2002年提出的用于评估机器翻译效果的一种方法,这种方法简单朴素、短平快、易于理解。因为其效果还算说得过去,因此被广泛迁移到自然语言处理的各种评估任务中。这种方法可以说是:山上无老虎,猴子称大王。时无 ...