問題引入 作業所給的數據是某地的觀測記錄,每個月取前20天的數據,觀測數據共有18個指標,每小時記錄這18個指標的值,共記錄12個月。 ...
梯度下降偽代碼 梯度下降可以優化損失函數的值,使其盡量小,即可找到最好 在數據集上擬合效果最好 的模型參數。 現在假設模型 f 中只有一個參數 w ,則損失函數為 L f L w ,梯度下降算法如下 若模型有多個參數,按相同方法更新各參數 初始化參數 隨機選取一個 w w 並不一定是隨機選取 ,令 w w 。 計算梯度 frac dL f dw w w 如果小於 ,此時 w 增大則 L f 會減小 ...
2020-12-27 18:09 0 325 推薦指數:
問題引入 作業所給的數據是某地的觀測記錄,每個月取前20天的數據,觀測數據共有18個指標,每小時記錄這18個指標的值,共記錄12個月。 ...
本文作為自己學習李宏毅老師2021春機器學習課程所做筆記,記錄自己身為入門階段小白的學習理解,如果錯漏、建議,還請各位博友不吝指教,感謝!! 一、Machine Learning概念理解 Machine Learning主要的任務是尋找一個合適的Function來完成我們的工作(非常不嚴 ...
本文作為自己學習李宏毅老師2021春機器學習課程所做筆記,記錄自己身為入門階段小白的學習理解,如果錯漏、建議,還請各位博友不吝指教,感謝!! CNN理解角度一 圖像的表達形式 對於一個Machine來說,一張輸入的圖像其實是一個三維的Tensor。 如上圖所示,三個維度分別 ...
本文作為自己學習李宏毅老師2021春機器學習課程所做筆記,記錄自己身為入門階段小白的學習理解,如果錯漏、建議,還請各位博友不吝指教,感謝!! 概率生成模型 概率生成模型(Probabilistic Generative Model)簡稱生成模型,指一系列用於隨機生成可觀測數據的模型 ...
P1 一、線性回歸中的模型選擇 上圖所示: 五個模型,一個比一個復雜,其中所包含的function就越多,這樣就有更大幾率找到一個合適的參數集來更好的擬合訓練集。所以,隨着模型的復雜度提高,train error呈下降趨勢。 上圖所示: 右上角的表格中分 ...
1.背景知識 one-hot -> word class -> word embedding 不過傳統的word embedding解決不了多義詞的問題。 2. ELMO ...
1.RNN和CNN的局限性 RNN是seq2seq的模型,RNN不易平行化,如果是單向的話,要輸出\(b^3\),需要先看完\(a^1, a^2, a^3\)。如果是雙向的話,可以看完整個句子。 ...
一、introduction How do we utilize the structures and relationship to help our ...