改善機器學習可解釋性的技術和方法 盡管透明性和道德問題對於現場的數據科學家來說可能是抽象的,但實際上,可以做一些實際的事情來提高算法的可解釋性 算法概括 首先是提高概括性。這聽起來很簡單,但並非那么簡單。當您認為大多數機器學習工程都以非常特定的方式應用算法來發現所需的特定 ...
從今年四月份到現在已經工作快 個月了,最開始是做推薦系統,然后做機器學習,現在是文本挖掘,每個部分研究的時間都不多,但還是遇到了很多問題,目前就把一定要總結的問題總結一下,以后有時間多看看,提醒自己看有沒有解決。 推薦系統: .冷啟動熱啟動區別和聯系 各個階段需要的算法 .每個算法的數學推導 適用情況 優缺點 改進方法 數據類型 .如何平衡熱啟動時的准確率和召回率,兩者不可能同時高,怎么平衡 從 ...
2015-12-24 10:35 4 6178 推薦指數:
改善機器學習可解釋性的技術和方法 盡管透明性和道德問題對於現場的數據科學家來說可能是抽象的,但實際上,可以做一些實際的事情來提高算法的可解釋性 算法概括 首先是提高概括性。這聽起來很簡單,但並非那么簡單。當您認為大多數機器學習工程都以非常特定的方式應用算法來發現所需的特定 ...
在完成機器學習中的二分類問題的建模階段后,需要對模型的效果做評價,如今業內通常采用的評價指標有精確率(Precision)、准確率(Accuracy)、召回率(Recall)、F值(F-Measure)等多個方面,為了准確理解以避免混淆,本文將對這些指標做簡要介紹。 1 混淆矩陣 其實,上面 ...
機器學習--分類問題 分類問題是監督學習的一個核心問題,它從數據中學習一個分類決策函數或分類模 型(分類器(classifier)),對新的輸入進行輸出預測,輸出變量取有限個離散值。 決策樹 決策樹 ...
回歸,我第一次看到回歸的時候,想的就是回歸是什么意思?后來看了一個答案解釋很有意思,回歸這個詞來自於生物學,在調查父母與子代身高問題的時候,發現父母如果過高的話,子女就會比父母矮一點,如果父母矮的話,子女又會比父母高,這使得身高不會向高矮倆個極端發展,而是趨於回到中心,后來做統計的時候引入統計學 ...
寫這個系列是因為最近公司在搞技術分享,學習Spark,我的任務是講PySpark的應用,因為我主要用Python,結合Spark,就講PySpark了。然而我在學習的過程中發現,PySpark很雞肋(至少現在我覺得我不會拿PySpark做開發)。為什么呢?原因 ...
kmeans聚類相信大家都已經很熟悉了。在Python里我們用kmeans通常調用Sklearn包(當然自己寫也很簡單)。那么在Spark里能不能也直接使用sklean包呢?目前來說直接 ...
一、Python1、NumpyNumPy(Numerical Python) 是 Python 語言的一個擴展程序庫,支持大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。 2、Pa ...
的復雜度。測試誤差和訓練誤差之間差一個規則項,其公式為: 模型越復雜說明模型越不穩定,學習到 ...