原文:DeepLearning.ai學習筆記(五)序列模型 -- week2 自然語言處理與詞嵌入

一 詞匯表征 首先回顧一下之前介紹的單詞表示方法,即one hot表示法。 如下圖示, Man 這個單詞可以用 O 表示,其中O表示One hot。其他單詞同理。 但是這樣的表示方法有一個缺點,看是看下圖中右側給出的例子,比如給出這么一句不完整的話: I want a glass of orange 假設通過LSTM算法學到了空白處應該填 juice .但是如果將orange改成apple,即 I ...

2018-03-26 12:02 0 1361 推薦指數:

查看詳情

DeepLearning.ai學習筆記(五)序列模型 -- week1 循環序列模型

一、為什么選擇序列模型 序列模型可以用於很多領域,如語音識別,撰寫文章等等。總之很多優點。。。 二、數學符號 為了后面方便說明,先將會用到的數學符號進行介紹。 以下圖為例,假如我們需要定位一句話中人名出現的位置。 紅色框中的為輸入、輸出值。可以看到人名輸出用1表示,反之用0表示 ...

Thu Mar 01 04:31:00 CST 2018 0 2925
DeepLearning.ai學習筆記(三)結構化機器學習項目--week2機器學習策略(2)

一、進行誤差分析 很多時候我們發現訓練出來的模型有誤差后,就會一股腦的想着法子去減少誤差。想法固然好,但是有點headlong~ 這節視頻中吳大大介紹了一個比較科學的方法,具體的看下面的例子 還是以貓分類器為例,假設我們的模型表現的還不錯,但是依舊存在誤差,預測后錯誤標記的數據中有 ...

Fri Oct 27 08:03:00 CST 2017 3 1248
自然語言處理——向量詞嵌入

1   傳統方式的缺點   使用索引的方式無法表達之間的相似性,n元模型在很多場合難以取得明顯的進步和表現。one-hot存在維度方面的問題以及無法表示和短語之間的相似性。   WordNet:   WordNet是一個由普林斯頓大學認識科學實驗室在心理學教授喬治·A·米勒的指導下建立 ...

Fri May 24 08:46:00 CST 2019 0 751
吳恩達《深度學習》第五門課(2)自然語言處理嵌入

2.1詞匯表征 (1)使用one-hot方法表示詞匯有兩個主要的缺點,以10000個為例,每個單詞需要用10000維來表示,而且只有一個數是零,其他維度都是1,造成表示非常冗余,存儲量大;第二每個單詞表示的向量相乘都為零(正交),導致沒能夠表示是詞匯之間的聯系,比如oriange和apple ...

Mon Jul 23 03:22:00 CST 2018 2 1340
13.深度學習(嵌入)與自然語言處理--HanLP實現

筆記轉載於GitHub項目:https://github.com/NLP-LOVE/Introduction-NLP 13. 深度學習自然語言處理 13.1 傳統方法的局限 前面已經講過了隱馬爾可夫模型、感知機、條件隨機場、朴素貝葉斯模型、支持向量機等傳統機器學習模型 ...

Thu Feb 20 06:49:00 CST 2020 2 1473
自然語言處理----模型

模型是一種表征文本數據的方法,可以從文本數據中提取出特征並用向量表示.模型主要包括兩件事 構建詞匯表 確定度量單詞出現的方法 模型不考慮單詞在文本中出現的順序,只考慮單詞是否出現. 具體以"雙城記"開頭為例 收集數據 構建詞匯表 對於上面四個 ...

Sat Jun 27 20:42:00 CST 2020 0 573
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM