原文:0-4評價一個語言模型Evaluating Language Models:Perplexity

有了一個語言模型,就要判斷這個模型的好壞。 現在假設: 我們有一些測試數據,test data.測試數據中有m個句子 s ,s ,s ,sm 我們可以查看在某個模型下面的概率: 我們也知道,如果計算相乘是非常麻煩的,可以在此基礎上,以另一種形式來計算模型的好壞程度。 在相乘的基礎上,運用Log,來把乘法轉換成加法來計算。 補充一下,在這里的p Si 其實就等於我們前面所介紹的q the , q d ...

2013-07-15 00:11 0 4155 推薦指數:

查看詳情

語言模型評價指標Perplexity

在信息論中,perplexity(困惑度)用來度量一個概率分布或概率模型預測樣本的好壞程度。它也可以用來比較兩個概率分布或概率模型。(應該是比較兩者在預測樣本上的優劣)低困惑度的概率分布模型或概率模型能更好地預測樣本。 困惑度越小,句子概率越大,語言模型越好。 wiki上列 ...

Wed May 08 02:50:00 CST 2019 0 1448
語言模型 Language Model (LM)

定義 什么是語言模型,通俗的講就是從語法上判斷一句話是否通順。即判斷如下的概率成立: \[p(\text{今天是周末})>p(\text{周末是今天}) \] 鏈式法則(chain rule) \[p(w_1,w_2,...,w_n)=p(w_1)p(w_2|w_1)p ...

Fri Jul 17 06:01:00 CST 2020 0 758
統計語言模型(Statistical Language Model)

自然語言處理的一個基本問題就是為其上下文相關的特性建立數學模型,即統計語言模型(Statistical Language Model),它是自然語言處理的基礎。 1 用數學的方法描述語言規律 假定S表示某個有意義的句子,由一連串特定順序排列的詞ω1,ω2,...,ωn組成,這里n是句子的長度 ...

Wed Nov 29 03:18:00 CST 2017 0 3646
(六) 語言模型 Language Madel 與 word2vec

語言模型簡介(Language Model) 簡單的說,語言模型Language Model) 是用來計算一個句子出現概率的模型,假設句子 ,其中 代表句子中的第 個詞語,則語句 W 以該順序出現的概率可以表示為:    其中 , $p(w_n|w_1^{n-1}) = p ...

Sat Jun 04 16:52:00 CST 2016 1 6409
用CNTK搞深度學習 (二) 訓練基於RNN的自然語言模型 ( language model )

前一篇文章 用 CNTK 搞深度學習 (一) 入門 介紹了用CNTK構建簡單前向神經網絡的例子。現在假設讀者已經懂得了使用CNTK的基本方法。現在我們做一個稍微復雜一點,也是自然語言挖掘中很火的一個模型: 用遞歸神經網絡構建一個語言模型。 遞歸神經網絡 (RNN),用圖形化的表示則是隱層 ...

Fri Apr 22 08:08:00 CST 2016 0 15214
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM