第一次工作面試(蘑菇街)


前天投了蘑菇街數據挖掘實習工程師;

昨天下午參加了蘑菇街實習生筆試;

============================

選擇題:基礎知識

簡答題:數據結構中的算法

1、二叉樹的任意兩節點的公共父節點。

開始想遞歸,划掉了。然后想循環,又划掉了。最后默默的寫上了逐個遍歷,囧

2、軟件項目管理中的那種圖,結點是:事務+時間,有先后,要求找項目最短需要多久時間?

軟件項目管理里邊做過這種題目,突然遇到這種題,還是寫不出公式。數據結構寫的鄰接矩陣,算法沒寫。感覺像拓撲排序,但是自己又不知道拓撲排序要怎么做,也就沒寫。

附加題:

1、根據一些數據,設計一個推薦系統。(之前看過《推薦系統實踐》,還是起了點作用。

2、無監督機器學習算法,優缺點?(完全想不起來。寫了個NN,交卷時候被告知,NN是有監督的,囧

============================

昨天晚上收到面試通知;

今天去華科參加面試;

以前沒有過面試的經驗,於是啥都沒准備。

面試之前設想的樣子是面試官問一句我答一句,輕松浪漫加愉快。不過這也是白日做夢,都沒准備,怎么能輕松愉快呢。

剛到那里,正好一個面試官閑着,然后就開始了。

============(我把面試過程中存在改進余地的地方用紅字標識了。)============

面試官:介紹下自己吧。

我想了想,不知道要怎么介紹自己,問:怎么介紹啊?

面試官:說說你做過什么。

我瞄了一眼面試官手里的簡歷(貌似我手里也應該也拿一份):本科的還需要么?

面試官:可以啊。

我:那從大一開始介紹吧。(然后開口就說了大一在記者團工作過,馬上心里想,說這個管啥用啊,然后就把大一大二在學生會工作的事用兩句話說完了,引到我做的事情上來)大三做過一個大學生科技創新基金項目,發表一篇中文核心論文《結果可控樹突狀細胞算法》(只記得項目名字和成果,具體細節忘記了,應該把當初的資料拿出來翻翻,這樣也有的說)。參加過一個全國程序設計競賽第六屆ITAT,獲得全國一等獎,這個競賽檔次比較low,自己獲獎也是運氣好,自己對算法其實不怎么了解,也就是當初靠興趣看過一點,只是了解,並不精通。。(不該實話實說啊(/ □ \),應該吹吹這個比賽有1500人參加,有20個一等獎。

本科的基本沒啥了,然后開始介紹研究生期間的。

我:保研之后就一直和導師做科研,做事件抽取方面的。

面試官(面試官遇到感興趣的內容會打斷你的介紹,前面沒有怎么打斷我,說明他不怎么感興趣或者說是我介紹的太淺了不夠提起他的興趣):這個我知道,事件提取。

我:我們做的事件抽取和ACE、TAC那些評測會議做的還存在一些差別,它們都是事件類型相關的(這里還可以說一下我看過的論文中用到的哪些方法,吹吹自己看過多少文章,可是忘記說了),我們做的是事件類型無關的,感覺和知識圖譜、語義網差不多(提到了KG和Semantic web這兩個概念,但是沒有進一步說,可以進一步說清楚一點,為什么差不多。)投了一篇會議文章,被武漢大學學報錄用了,會議的文章在中文信息學報、武漢大學學報、東南大學學報發表,自己文章水平不夠中文信息學報的,只能在武大學報發表。(貌似又說實話了。。。囧

面試官:武大學報應該還不錯(面試官不會是武大的吧。。。囧)。

我:文章里邊用的方法其實不怎么高大上,當時本科剛保研,會的方法也不多,N元模型對我來說都很高大上,方法的開始主要用共現概率,后邊就用規則的方法來進行事件抽取。我們方法中有一個很大的不足就是把高概率當作了100%。(媽蛋,又說實話了。。。囧

面試官:哦,你做的東西都是用規則,是吧?

我一聽這話,感覺被鄙視了,然后趕緊說:前段時間導師讓我准備給ACL投一篇文章,當時用了半個月的時間熟悉HMM,改進HMM,寫論文初稿。改進HMM主要是兩個方面,一個是二階HMM,二階的就是在一階的基礎上擴展。

面試官:二階就是bi-gram,是吧?

我:不是,二階的是tri-gram,一階的是bi-gram(這點感覺還不錯~哈哈)。

面試官:對對對。

我:一個是二維HMM,開始找HMM,找了一個J4HMM,但是不能直接用。

面試官:為什么?

我:網上那些直接找到的,都是傳統原始的HMM,要想改進,就要自己寫代碼。而且訓練的時候不能用BW算法。

面試官:ME算法?

我:Baum-Welch算法。

面試官:哦。

我:直接用這個算法,不適合我們處理的問題。(但是當時忘了問什么不適合,幸好面試官也沒有問。。。)。就用那個什么最大算法。

面試官:最大似然估計。

我:對,最大似然估計。

面試官:就是我剛才說的ME。(我剛查了查,是MLE。。。囧,我記得是三個字母嗎,差點被他騙了。)你知道ME算法背后的原理嗎?

我:最大似然估計不就是一個公式嗎,代碼寫起來也不難,照葫蘆畫瓢唄(這個比喻還行吧。。。體現了我深厚的文學功底),以前概率課上講的,我也不知道背后啥原理。(囧,當時我就蒙逼了。。。看來數學還是有用的。

面試官:哦,好,我知道了。

我:后邊的Viterbi算法也要自己寫代碼。

面試官:事件的不同成分,在句子中的距離可能會比較遠,你的二階HMM也只是tri-gram,怎么保證能抽取出來呢?(這個問題要問的是啥?當時有點沒弄明白。於是出現了下面的回答。。。囧

我:就和N元模型,一般只用三元模型一樣,一方面是訓練數據不夠多,再多元的話,訓練不出健壯的模型,沒意義。另一方面是再多元的話,硬件要求也會比較高。(答的什么玩意兒啊。。。完全答非所問。糾其原因,還是沒有回顧一下自己做的東西,對於一些細節已經忘了,以至於沒有搞明白面試官在問啥。

面試官:我不是問這個,我是問。。。(把問題又說了一遍)。

我:。。。(忘了回答的什么了,反正又是答非所問了

面試官:哦(估計面試官放棄這個問題了。囧)。這就是你做的,是吧?

我:這個只是統計模型,現在不是都統計與規則相結合嗎,我在統計模型之后,還用K-means算法對錯誤實例進行聚類,得出一系列糾錯規則。

面試官:怎么聚類的?

我:一個事件成分,提取它周圍的特征,讓后利用這些特征,計算距離,進行聚類。(感覺說的好爛。。。完全沒有說清楚。。。還是把自己做的東西的細節忘記了。

面試官:cos距離?歐式距離?

我當時想了半天用的啥距離都沒想起來,想了想公式的樣子,說:歐氏距離。這些距離不都是一個簡單的公式嗎,說的很高大上的樣子。

面試官:是。

我:我做的這個就是前邊用統計模型,后邊用規則進行糾錯的方法。

面試官:嗯,可以。你看你有什么問題嗎?

我:。。。(沉默一會兒,因為我真不知道問啥。),我沒啥問題,你跟我說說唄。(我在本科班級群里說了這個之后,祥子說,你應該問一些問題,否則面試官會覺得你來這個公司的意願不是很強烈。萬老板說知乎上看到過這個,應該問問這個職位在公司的發展之類的。。。。。囧,我還真不知道有這回事。

面試官:我也沒啥問題了。那就這樣吧,你回去等我們通知吧。

======================30分鍾的面試就這么結束了===================

出來之后,和ZZH聊了會,從他那得知,ZYW過了一面,在進行二面。這才知道,你回去等我們通知吧=你的一面掛了,走好不送

然后在萬老板的帶領下,逛了逛華科,去華科的百景園食堂蹭了頓飯(才讓萬老板破費30多元。。。囧),還挺好吃的。聊了聊華科、聊了聊武科大,自己默默對比了一下,一句話,說多了都是淚。

飯后踏上返校的公交,第一次在公交上睡着了,還好是終點站(囧),睡醒之后,轉車回到了學校,that’s all.

=======================================================

后來想了想,在自我介紹的過程中,沒有提到簡歷中幾個我參與的項目經驗(可以多扯點),對本科自己動手做的東西也沒有說(至少能體現一點動手能力吧)。

總之,就是面試之前應該好好准備准備,至少對自己做過的東西也應該比較清楚。

這就是第一次面試的經驗,其他形式的面試也沒經歷過。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM