原文:0-4评价一个语言模型Evaluating Language Models:Perplexity

有了一个语言模型,就要判断这个模型的好坏。 现在假设: 我们有一些测试数据,test data.测试数据中有m个句子 s ,s ,s ,sm 我们可以查看在某个模型下面的概率: 我们也知道,如果计算相乘是非常麻烦的,可以在此基础上,以另一种形式来计算模型的好坏程度。 在相乘的基础上,运用Log,来把乘法转换成加法来计算。 补充一下,在这里的p Si 其实就等于我们前面所介绍的q the , q d ...

2013-07-15 00:11 0 4155 推荐指数:

查看详情

语言模型评价指标Perplexity

在信息论中,perplexity(困惑度)用来度量一个概率分布或概率模型预测样本的好坏程度。它也可以用来比较两个概率分布或概率模型。(应该是比较两者在预测样本上的优劣)低困惑度的概率分布模型或概率模型能更好地预测样本。 困惑度越小,句子概率越大,语言模型越好。 wiki上列 ...

Wed May 08 02:50:00 CST 2019 0 1448
语言模型 Language Model (LM)

定义 什么是语言模型,通俗的讲就是从语法上判断一句话是否通顺。即判断如下的概率成立: \[p(\text{今天是周末})>p(\text{周末是今天}) \] 链式法则(chain rule) \[p(w_1,w_2,...,w_n)=p(w_1)p(w_2|w_1)p ...

Fri Jul 17 06:01:00 CST 2020 0 758
统计语言模型(Statistical Language Model)

自然语言处理的一个基本问题就是为其上下文相关的特性建立数学模型,即统计语言模型(Statistical Language Model),它是自然语言处理的基础。 1 用数学的方法描述语言规律 假定S表示某个有意义的句子,由一连串特定顺序排列的词ω1,ω2,...,ωn组成,这里n是句子的长度 ...

Wed Nov 29 03:18:00 CST 2017 0 3646
(六) 语言模型 Language Madel 与 word2vec

语言模型简介(Language Model) 简单的说,语言模型Language Model) 是用来计算一个句子出现概率的模型,假设句子 ,其中 代表句子中的第 个词语,则语句 W 以该顺序出现的概率可以表示为:    其中 , $p(w_n|w_1^{n-1}) = p ...

Sat Jun 04 16:52:00 CST 2016 1 6409
用CNTK搞深度学习 (二) 训练基于RNN的自然语言模型 ( language model )

前一篇文章 用 CNTK 搞深度学习 (一) 入门 介绍了用CNTK构建简单前向神经网络的例子。现在假设读者已经懂得了使用CNTK的基本方法。现在我们做一个稍微复杂一点,也是自然语言挖掘中很火的一个模型: 用递归神经网络构建一个语言模型。 递归神经网络 (RNN),用图形化的表示则是隐层 ...

Fri Apr 22 08:08:00 CST 2016 0 15214
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM