百度數據挖掘筆試題


一、簡答題(本題共30分)

1、如何理解繼承、多態、組合,請舉例說明它們的應用。(10分)

2、請列舉出進程間通信的幾種方式(至少列舉出三種)。(10分)

3、請寫出貝葉斯公式,請描述朴素貝葉斯分類方法的原理和步驟。(10分)

二、算法與程序設計(本題共40分)

1、兩個長度為100的隨機向量X和Y,X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),其中xi和yi都是從均值為0,標准差為1的正態分布中隨機選擇的數,隨機變量Z為X何Y的相關系數,請問:

1)Z的期望和標准差是多少,請寫出簡單的推導公式?(10分)

2)請用蒙特卡洛方法模擬,寫代碼計算Z的期望和標准差。(10分)

2、假設張三的mp3里有1000首歌,現在希望設計一種隨機算法來隨機播放。與普通隨機模式不同的是,張三希望每首歌被隨機到的改了吧是與一首歌的豆瓣評分(0~10分)成正比的,如朴樹的《平凡之路》評分為8.9分,逃跑計划的《夜空中最亮的星》評分為9.5分,則希望聽《平凡之路》的概率與《夜空中最亮的星》的概率比為89:95,。現在我們已知這1000首歌的豆瓣評分:

(1)請設計一種隨機算法來滿足張三的需求。(10分)

(2)請寫代碼實現自己的算法。(10分)

三、系統設計題(本題共30分)

1、我們隊一批一維數據進行回歸擬合。給你訓練數據D=(xi,yi),i=1…n,其中xi∈R是一個實數,yi∈R是xi對應的回歸坐標。我們擬使用線性,二次,高次函數對yi進行擬合:

線性函數:f(x)=ax+b

二次函數:f(x)=ax2+bx+c

三次函數:f(x)=ax3+bx2+cx+d

①我們設定最小均方誤差為損失函數,請寫出損失函數的具體形式。(5分)

②以二次函數你和為例,請使用隨機梯度下降(stochastic gradient decent)對損失函數進行優化,給出參數a,b,c的梯度推倒並寫出算法。(7分)

③下面三圖分別是一次函數,二次函數,七次函數擬合的結果,同時給出它們在D上的損失函數值一次是0.76,0.15,0.01。在選擇用什么函數作為最終擬合函數的時候,你會有哪些考慮。本例中你學會選擇哪個(8分)

baiduint001

 

 

OooO面試的是美團的算法工程師,面試地點:

一面是技術面

1、 自我介紹

2、 簡歷上項目的簡要介紹

3、 算法題:數組先遞增后遞減,要求找到最大值。要求寫出代碼

4、 會不會JAVA、linux,Unix編程、設計模式?

5、 C++多態實現並舉例(寫代碼)

6、 Static變量的作用,堆棧的區別

7、 概率題:2個容器,第一個容器4個紅球和5個白球,第二個容器3個紅球和8個白球,隨機取出一個球,已知是紅球那么它是來自於第一個容器的概率是多少?

OooO說第四個題目一串知識,他全實事求是的答的不了解或者不會,但是還是通過了第一輪面試。

二面仍舊是技術面

1、 跟項目相關的算法題

2、 有兩個數組X1[n],X2[n]。X1是已知的,X2需要計算。定義常數r,X2[i] = X1[i]的前r個元素和后r個元素共2r+1個元素的均值;對於前r個和后r個,由於缺少數據,就有多少個算多少個的均值。先講思想,再寫代碼。

3、 已知數組如X=[1,2,3,4],輸出其所有子集,如1,2,3,4,12,23,34,123,234,1234…(筆試時未完成的題目)。

4、 智力邏輯題:3*3的九宮格,填寫1—9,使得所有行、列、對角線的和都是相等的,那么中間那個方格數字是什么?要求給出理論證明。

三面是HR面

1、智力題::7*7的方格,總左下角走到右上角,最短路徑前提下一共有多少種不同路徑

2、HR相關非技術題目


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM