原文:算法崗面試題:模型的bias和variance是什么?用隨機森林舉例

校招在即,准備准備一些面試可能會用到的東西吧。希望這次面試不會被掛。 基本概念 說到機器學習模型的誤差,主要就是bias和variance。 Bias:如果一個模型的訓練錯誤大,然后驗證錯誤和訓練錯誤都很大,那么這個模型就是高bias。可能是因為欠擬合,也可能是因為模型是弱分類器。 Variance:模型的訓練錯誤小,但是驗證錯誤遠大於訓練錯誤,那么這個模型就是高Variance,或者說它是過擬合 ...

2020-06-24 18:17 0 673 推薦指數:

查看詳情

深度學習(一)-------算法面試題

● BatchNormalization的作用 參考回答: 神經網絡在訓練的時候隨着網絡層數的加深,激活函數的輸入值的整體分布逐漸往激活函數的取值區間上下限靠近,從而導致在反向傳播時低層的神經 ...

Tue Jun 04 04:49:00 CST 2019 0 1068
深度學習(二)-----算法面試題

● 深度學習了解多少,有看過底層代碼嗎?caffe,tf? ● 除了GMM-HMM,你了解深度學習在語音識別中的應用嗎? 參考回答: 講了我用的過DNN-HMM,以及與GMM-HMM的 ...

Tue Jun 04 04:50:00 CST 2019 0 702
算法面試題積累一

1: LSTM結構推導,為什么比RNN好?答案:推導forget gate,input gate,cell state, hidden information等的變化;因為LSTM有進有出且當前的ce ...

Sat Dec 23 00:38:00 CST 2017 0 1083
深度學習(三)----算法面試題

● 神經網絡為啥用交叉熵。 參考回答: 通過神經網絡解決多分類問題時,最常用的一種方式就是在最后一層設置n個輸出節點,無論在淺層神經網絡還是在CNN中都是如此,比如,在AlexNet中最后的輸 ...

Tue Jun 04 04:51:00 CST 2019 0 1120
處理聚類問題常用算法-----算法面試題

● 什么是DBSCAN 參考回答: DBSCAN是一種基於密度的空間聚類算法,它不需要定義簇的個數,而是將具有足夠高密度的區域划分為簇,並在有噪聲的數據中發現任意形狀的簇,在此算法中將簇定義為密度相連的點的最大集合。 ● k-means算法流程 參考回答: 從數據集中隨機選擇k ...

Tue Jun 04 04:46:00 CST 2019 0 1240
處理分類問題常用算法(二)-----算法面試題

● 分層抽樣的適用范圍 參考回答: 分層抽樣利用事先掌握的信息,充分考慮了保持樣本結構和總體結構的一致性,當總體由差異明顯的幾部分組成的時候,適合用分層抽樣。 ● LR的損失函數 參考回答: M為樣本個數,為模型對樣本i的預測結果,為樣本i的真實標簽。 ● LR和線性 ...

Tue Jun 04 04:39:00 CST 2019 0 717
推薦系統的常用算法----算法面試題

● 請你說一說推薦算法,fm,lr,embedding 參考回答: 推薦算法: 基於人口學的推薦、基於內容的推薦、基於用戶的協同過濾推薦、基於項目的協同過濾推薦、基於模型的協同過濾推薦、基於關聯規則的推薦 FM: LR: 邏輯回歸本質上是線性回歸,只是在特征 ...

Tue Jun 04 04:47:00 CST 2019 0 3289
處理分類問題常用算法(一)-------算法面試題

交叉熵公式 參考回答: 交叉熵:設p(x)、q(x)是X中取值的兩個概率分布,則p對q的相對熵是: 在一定程度上,相對熵可以度量兩個隨機變量的“距離”,且有D(p||q) ≠D(q||p)。另外,值得一提的是,D(p||q)是必然大於等於0的。 互信息:兩個隨機變量X,Y ...

Tue Jun 04 04:37:00 CST 2019 0 684
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM