原文:【原】機器學習幾個基本的問題

從今年四月份到現在已經工作快 個月了,最開始是做推薦系統,然后做機器學習,現在是文本挖掘,每個部分研究的時間都不多,但還是遇到了很多問題,目前就把一定要總結的問題總結一下,以后有時間多看看,提醒自己看有沒有解決。 推薦系統: .冷啟動熱啟動區別和聯系 各個階段需要的算法 .每個算法的數學推導 適用情況 優缺點 改進方法 數據類型 .如何平衡熱啟動時的准確率和召回率,兩者不可能同時高,怎么平衡 從 ...

2015-12-24 10:35 4 6178 推薦指數:

查看詳情

機器學習改善Interpretability的幾個技術

改善機器學習可解釋性的技術和方法 盡管透明性和道德問題對於現場的數據科學家來說可能是抽象的,但實際上,可以做一些實際的事情來提高算法的可解釋性 算法概括 首先是提高概括性。這聽起來很簡單,但並非那么簡單。當您認為大多數機器學習工程都以非常特定的方式應用算法來發現所需的特定 ...

Wed Oct 23 23:54:00 CST 2019 0 324
關於機器學習二分類問題幾個評估指標辨析

在完成機器學習中的二分類問題的建模階段后,需要對模型的效果做評價,如今業內通常采用的評價指標有精確率(Precision)、准確率(Accuracy)、召回率(Recall)、F值(F-Measure)等多個方面,為了准確理解以避免混淆,本文將對這些指標做簡要介紹。 1 混淆矩陣 其實,上面 ...

Sun Feb 09 20:17:00 CST 2020 0 1168
機器學習--分類問題

機器學習--分類問題 分類問題是監督學習的一個核心問題,它從數據中學習一個分類決策函數或分類模 型(分類器(classifier)),對新的輸入進行輸出預測,輸出變量取有限個離散值。 決策樹 決策樹 ...

Fri Nov 15 05:31:00 CST 2019 0 375
機器學習:回歸問題

回歸,我第一次看到回歸的時候,想的就是回歸是什么意思?后來看了一個答案解釋很有意思,回歸這個詞來自於生物學,在調查父母與子代身高問題的時候,發現父母如果過高的話,子女就會比父母矮一點,如果父母矮的話,子女又會比父母高,這使得身高不會向高矮倆個極端發展,而是趨於回到中心,后來做統計的時候引入統計學 ...

Mon Aug 10 05:35:00 CST 2020 0 1037
】Spark之機器學習(Python版)(二)——分類

  寫這個系列是因為最近公司在搞技術分享,學習Spark,我的任務是講PySpark的應用,因為我主要用Python,結合Spark,就講PySpark了。然而我在學習的過程中發現,PySpark很雞肋(至少現在我覺得我不會拿PySpark做開發)。為什么呢?原因 ...

Tue May 31 23:33:00 CST 2016 4 10393
】Spark之機器學習(Python版)(一)——聚類

   kmeans聚類相信大家都已經很熟悉了。在Python里我們用kmeans通常調用Sklearn包(當然自己寫也很簡單)。那么在Spark里能不能也直接使用sklean包呢?目前來說直接 ...

Fri May 06 22:56:00 CST 2016 8 14537
機器學習中比較重要的幾個概念

一、Python1、NumpyNumPy(Numerical Python) 是 Python 語言的一個擴展程序庫,支持大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。 2、Pa ...

Thu Feb 28 20:55:00 CST 2019 0 711
機器學習幾個知識點記錄(轉)

的復雜度。測試誤差和訓練誤差之間差一個規則項,其公式為:      模型越復雜說明模型越不穩定,學習到 ...

Fri Aug 26 05:29:00 CST 2016 0 1468
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM