總結:介紹算法模型一般從模型要解決的問題場景入手。然后介紹模型建模的思路,使用的損失函數,對損失函數的優化如何求解這幾塊。最后介紹下算法模型的優點和缺點。
一、小米面試(涼涼)——一面1小時,二面40分鍾
1、 數據結構很重要(重要指數10顆星)
2、 編程題:
(1)a = [1, 2, 3]
b = a[:-1] 這一步做的是什么,還可以怎么做,另外一種方法和這種方法那個時間復雜度更低
a.pop(2) # 3
視頻名字:(N) name 變金精剛 變形金剛 大黃蜂
query:(M) 金剛 f1: 2 2 0
f2: 1 2 0
f1: 相同字符的個數
f2: 最大連續相同字符的
怎么實現f1和f2
(2)有n個變量,這n個變量分別都有1-n個值,那么這些值肯定會存在重復的情況,請編寫一段程序來找出這些重復的值。
3、 GBDT/XGBoost/LightGBM/Adaboost知識總結(需要再看)
4、 自己做過的項目問得非常細致,我需要再細致化一下,很多細節上的問題我面試時並沒有回答上來
5、 LSTM傳入的是什么,輸出的又是什么,沒了解?
6、 命名主體識別輸入模型的是什么,經過模型怎么就能識別出哪些是主體了,詳細介紹一下實習時怎么做的?
7、 LSTM如何解決長期依賴的問題?/LSTM對RNN改進的地方在那里?
8、 線性模型和分類模型的區別和聯系?
二、騰訊游戲面試(一面失敗)——35分鍾
1、講解了自己做過的比賽(講解時要注意邏輯性,逐條推進)
2、業務場景:有一張游戲地圖,有人物、有怪物,知道人物和怪物的坐標,人物和怪物分別有等級,人物打怪只能打與其相應的等級以及以下的等級,打怪的收益根據等級是遞增的。問:怎么布置怪物的分布地方,使得人物在規定時間內打怪時獲得的收益最高。
答:用優化算法,比如拉格朗日,將距離作為此收益函數的權重,對這個權重的優化又可以利用其它的算法進行。
三、中譯語通面試(等待結果)——15分鍾
1、SVD分解以及它有哪些用途?
https://zhuanlan.zhihu.com/p/36546367 SVD矩陣分解——原理與幾何意義
2、詞嵌入方法有哪些?以及各自的優缺點
3、學習率怎么調,這樣調有什么后果?
https://blog.csdn.net/whut_ldz/article/details/78882871
https://www.cnblogs.com/bonelee/p/8578481.html 機器學習中如何選擇超參數
4、Python的一點小知識,關於numpy的
5、平常工程都用什么軟件,會不會java、大數據處理平台,有沒有打算學
6、解釋一下梯度下降算法?
https://www.cnblogs.com/pinard/p/5970503.html 劉建平講解梯度下降
四、眾微科技(通過)——32分鍾
1、簡單講講自己簡歷上比賽用到的模型、比較他們的優缺點
2、ROC、AUC分別是什么,ROC的橫縱坐標分別是啥
3、python的lambda函數
4、講一下CART樹模型
5、對新網銀行的比賽做了哪些特征處理
異常值處理、類別標簽的組合、數值標簽的歸一化、特征篩選、模型融合
五、文思海輝(通過)——1.5小時
1、面試之前先做了一套筆試題,后面通知我周一下午去面試的,筆試題就是與數學、python、機器學習相關算法有關的,比較簡單
2、問簡歷上面寫到的東西
3、根據筆試題一個求極限問題改的,問怎么求那個函數與任意一個數的大小,提示我說用二分法
4、有哪些概率圖模型,簡單介紹一下HMM
5、有哪些概率分布
6、說一說我做命名實體識別的過程
7、場景:怎么建立一套推薦系統來減輕HR的工作任務
8、場景:結合本科專業,桌子上放着一包香煙,我想要寫些什么東西。我本科是學社會保障專業的,然后就從醫療保險角度介紹了一下,醫療體系與香煙可以產生哪些化學反應
9、怎么用最簡單的方法得到每天從天空中飛過的飛機數,胡說八道了一通。
10、梯度的本質是什么
11、梯度爆炸和梯度消失怎么發生的,怎么解決
12、還有一些忘了
六、京東數科(通過)——40分鍾
1、簡單介紹自己,然后面試官會結合簡歷上面的經歷詳細問你各個知識點
2、XGBoost還有哪些優化方法,為什么它用CART回歸作為基分類器
3、記憶最深的只有上面一個問題,其他好多都忘了,由於沒有立即寫下來