最大熵模型 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第七次課在線筆記。熵,這個概念對於我們來說既熟悉又陌生,熟悉的是我們在許多領域都會碰到熵這個概念,陌生的是如果真的讓你解釋它又說不清道不明。本次課程討論了熵的概念並詳細解釋了最大熵模型。這次 ...
主題模型 作者:櫻花豬 摘要: 本文為七月算法 julyedu.com 月機器學習第十五次課在線筆記。主題模型是對文字隱含主題進行建模的方法。它克服了傳統信息檢索中文檔相似度計算方法的缺點,並且能夠在海量互聯網數據中自動尋找出文字間的語義主題。主題模型在自然語言和基於文本的搜索上都起到非常大的作用。 引言: 兩篇文檔是否相關往往不只決定於字面上的詞語重復,還取決於文字背后的語義關聯。對語義關聯的挖 ...
2016-05-06 16:13 0 4546 推薦指數:
最大熵模型 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第七次課在線筆記。熵,這個概念對於我們來說既熟悉又陌生,熟悉的是我們在許多領域都會碰到熵這個概念,陌生的是如果真的讓你解釋它又說不清道不明。本次課程討論了熵的概念並詳細解釋了最大熵模型。這次 ...
凸優化 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第四次課在線筆記。“凸優化”指的是一種比較特殊的優化,通過“凸優化”我們能夠把目標函數轉化成一個“凸函數”然后利用凸函數的性質求極值來求解問題。“凸優化”不僅僅在機器學習中有所應用,幾乎在 ...
LDA常見的應用方向: 信息提取和搜索(語義分析);文檔分類/聚類、文章摘要、社區挖掘;基於內容的圖像聚類、目標識別(以及其他計算機視覺應用);生物信息數據的應用; 對於朴素貝葉斯模型來說,可以勝任許多文本分類問題,但無法解決語料中一詞多義和多詞一義的問題--它更像是詞法分析,而非語義分析 ...
隱馬爾科夫模型HMM 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第十七次課在線筆記。隱馬爾可夫模型(Hidden Markov Model,HMM)是統計模型,它用來描述一個含有隱含未知參數的馬爾科夫過程。其難點是從可觀察的參數中確定該過程 ...
微積分和概率論 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第一次課在線筆記。本次課以機器學習的觀點來看待曾經學過的數學問題,為未來的做機器學習的公式推導做理論基礎。主要內容包括高等數學和概率論部分內容。課程通過簡單的數學知識串講,喚起封存已久 ...
隨機森林和提升 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第十一次次課在線筆記。隨機森林和提升都是機器學習將弱分類器融合成強分類器的方法。和我們熟悉的另一種機器學習模型SVM相比,這種方法更適合於大數據並且它的計算速度要比SVM快許多 ...
摘要: 兩篇文檔是否相關往往不只決定於字面上的詞語重復,還取決於文字背后的語義關聯。對語義關聯的挖掘,可以讓我們的搜索更加智能化。本文着重介紹了一個語義挖掘的利器:主題模型。主題模型是對文字隱含主題進行建模的方法。它克服了傳統信息檢索中文檔相似度計算方法的缺點,並且能夠在海量 ...
條件隨機場 作者:櫻花豬 摘要: 本文為七月算法(julyedu.com)12月機器學習第十八次課在線筆記。條件隨機場是一種判別式概率模型,是隨機場的一種,常用於標注或分析序列資料,如自然語言文字或是生物序列。 引言: “條件隨機場”被用於中文分詞 ...