自然語言處理與深度學習:



語言模型:




N-gram模型:

N-Gram模型:在自然語言里有一個模型叫做n-gram,表示文字或語言中的n個連續的單詞組成序列。在進行自然語言分析時,使用n-gram或者尋找常用詞組,可以很容易的把一句話分解成若干個文字片段


詞向量:





神經網絡模型:
注:初始化向量,可以先隨機初始化。
傳統神經神經網絡只需要優化輸入層與隱層,隱層與輸出層之間的參數。



神經網絡模型的優勢:一方面可以得到詞語之間近似的含義,另一方面求解出的空間符合真實邏輯規律
CBOW求解目標:


預備知識:

樹的帶權路徑長度規定為所有葉子結點的帶權路徑長度之和,記為WPL。
分層的softmax設計思想:詞頻中出現詞概率高的盡可能往前放,可以用哈夫曼樹來設計。

自然語言哈夫曼樹詳解,包含構造和編碼:https://blog.csdn.net/shuangde800/article/details/7341289




Hierarchical Softmax是用哈夫曼樹構造出很多個二分類。




負采樣模型:





