前段時間專心面過騰訊,經過了N輪的技術面,結果還是掛了,但沒掛在技術面,比較欣慰,回來之后寫一點總結,以供有夢想進入騰訊做后台服務器開發的同學參考,本文章為胡成精心總結,胡成原創,copy和轉載請通知。ps:()之內的文字由作者點評,非面試題文字。
linux和os:
netstat tcpdump ipcs ipcrm (如果這四個命令沒聽說過或者不能熟練使用,基本上可以回家,通過的概率較小 ^_^ ,這四個命令的熟練掌握程度基本上能體現面試者實際開發和調試程序的經驗)
cpu 內存 硬盤 等等與系統性能調試相關的命令必須熟練掌握,設置修改權限 tcp網絡狀態查看 各進程狀態 抓包相關等相關命令 必須熟練掌握
awk sed需掌握
共享內存的使用實現原理(必考必問,然后共享內存段被映射進進程空間之后,存在於進程空間的什么位置?共享內存段最大限制是多少?)
c++進程內存空間分布(注意各部分的內存地址誰高誰低,注意棧從高道低分配,堆從低到高分配)
ELF是什么?其大小與程序中全局變量的是否初始化有什么關系(注意.bss段)
使用過哪些進程間通訊機制,並詳細說明(重點)
makefile編寫,雖然比較基礎,但是會被問到
gdb調試相關的經驗,會被問到
如何定位內存泄露?
動態鏈接和靜態鏈接的區別
32位系統一個進程最多多少堆內存
多線程和多進程的區別(重點 面試官最最關心的一個問題,必須從cpu調度,上下文切換,數據共享,多核cup利用率,資源占用,等等各方面回答,然后有一個問題必須會被問到:哪些東西是一個線程私有的?答案中必須包含寄存器,否則悲催)
寫一個c程序辨別系統是64位 or 32位
寫一個c程序辨別系統是大端or小端字節序
信號:列出常見的信號,信號怎么處理?
i++是否原子操作?並解釋為什么???????
說出你所知道的各類linux系統的各類同步機制(重點),什么是死鎖?如何避免死鎖(每個技術面試官必問)
列舉說明linux系統的各類異步機制
exit() _exit()的區別?
如何實現守護進程?
linux的內存管理機制是什么?
linux的任務調度機制是什么?
標准庫函數和系統調用的區別?
補充一個坑爹坑爹坑爹坑爹的問題:系統如何將一個信號通知到進程?(這一題哥沒有答出來)
c語言:
宏定義和展開(必須精通)
位操作(必須精通)
指針操作和計算(必須精通)
內存分配(必須精通)
sizeof必考
各類庫函數必須非常熟練的實現
哪些庫函數屬於高危函數,為什么?(strcpy等等)
c++:
一個String類的完整實現必須很快速寫出來(注意:賦值構造,operator=是關鍵)
虛函數的作用和實現原理(必問必考,實現原理必須很熟)
sizeof一個類求大小(注意成員變量,函數,虛函數,繼承等等對大小的影響)
指針和引用的區別(一般都會問到)
多重類構造和析構的順序
stl各容器的實現原理(必考)
extern c 是干啥的,(必須將編譯器的函數名修飾的機制解答的很透徹)
volatile是干啥用的,(必須將cpu的寄存器緩存機制回答的很透徹)
static const等等的用法,(能說出越多越好)
數據結構或者算法:
《離散數學》范圍內的一切問題皆由可能被深入問到(這個最坑爹,最重要,最體現功底,最能加分,特別是各類樹結構的實現和應用)
各類排序:大根堆的實現,快排(如何避免最糟糕的狀態?),bitmap的運用等等
hash, 任何一個技術面試官必問(例如為什么一般hashtable的桶數會取一個素數?如何有效避免hash結果值的碰撞)
網絡編程:
tcp與udp的區別(必問)
udp調用connect有什么作用?
tcp連接中時序圖,狀態圖,必須非常非常熟練
socket服務端的實現,select和epoll的區別(必問)
epoll哪些觸發模式,有啥區別?(必須非常詳盡的解釋水平觸發和邊緣觸發的區別,以及邊緣觸發在編程中要做哪些更多的確認)
大規模連接上來,並發模型怎么設計
tcp結束連接怎么握手,time_wait狀態是什么,為什么會有time_wait狀態?哪一方會有time_wait狀態,如何避免time_wait狀態占用資源(必須回答的詳細)
tcp頭多少字節?哪些字段?(必問)
什么是滑動窗口(必問)
connect會阻塞,怎么解決?(必考必問,提示:設置非阻塞,返回之后用select檢測狀態)
如果select返回可讀,結果只讀到0字節,什么情況?
網絡編程:
tcp與udp的區別(必問)
udp調用connect有什么作用?
tcp連接中時序圖,狀態圖,必須非常非常熟練
socket服務端的實現,select和epoll的區別(必問)
epoll哪些觸發模式,有啥區別?(必須非常詳盡的解釋水平觸發和邊緣觸發的區別,以及邊緣觸發在編程中要做哪些更多的確認)
大規模連接上來,並發模型怎么設計
tcp結束連接怎么握手,time_wait狀態是什么,為什么會有time_wait狀態?哪一方會有time_wait狀態,如何避免time_wait狀態占用資源(必須回答的詳細)
tcp頭多少字節?哪些字段?(必問)
什么是滑動窗口(必問)
connect會阻塞,怎么解決?(必考必問,提示:設置非阻塞,返回之后用select檢測狀態)
如果select返回可讀,結果只讀到0字節,什么情況?
keepalive 是什么東東?如何使用?
列舉你所知道的tcp選項,並說明其作用。
socket什么情況下可讀?
db:
mysql,會考sql語言,服務器數據庫大規模數據怎么設計,db各種性能指標
最后:補充一個最最重要,最最坑爹,最最有難度的一個題目:一個每秒百萬級訪問量的互聯網服務器,每個訪問都有數據計算和I/O操作,如果讓你設計,你怎么設計?
前些時間去了騰訊面試, 可惜現場沒回答好。
是一些基礎問題,同時也比較深入的問題。 在此列出來, 歡迎大家討論交流。
提問(不按時間順序):
1, 使用Linux epoll模型,水平觸發模式(Level-Triggered);當socket可寫時,會不停的觸發socket可寫的事件,如何處理?
2, 從socket讀數據時,socket緩存里的數據,可能超過用戶緩存的長度,如何處理? 例如,socket緩存有8kB的數據,而你的緩存只有2kB空間。
3, 向socket發送數據時, 可能只發送了用戶緩存里的一半,如何處理?例如,需要向socket發送8kB數據,返回值只有2kB發送成功。
4, C++的虛函數是怎么實現的?
5, C++的虛函數有什么作用?
6, 非阻塞connect()如何實現?
7,sizeof()問題
class A
{
char c;
int val;
short sh;
}
class B
{
char c;
int val;
short sh;
void func1(void);
virtual func2(void);
}
sizeof(A), sizeof(B) 分別是多少?
8, 實現字符串比較函數 strcmp(char *src, char * sub)
9, 實現內存拷貝函數 strcpy(void*dst, char * src, size_t len)
10,條件變量的如何使用? 你使用的線程函數是什么?
11, deamon進程如何實現?
12, HTTP和CGI是什么?
13, TCP的三次握手, TIME_WAIT和CLOSE_WAIT狀態是什么?
因為第7題之后的屬於客觀題,不打算在此寫答案。 朋友們如有好的答案也歡迎跟貼。
本人在此寫出自己對前6個問題的回答:
1, 使用linux epoll模型,水平觸發模式(Level-Triggered);當socket可寫時,會不停的觸發socket可寫的事件,如何處理?
第一種最普通的方式:
當需要向socket寫數據時,將該socket加入到epoll模型(epoll_ctl);等待可寫事件。
接收到socket可寫事件后,調用write()或send()發送數據。。。
當數據全部寫完后, 將socket描述符移出epoll模型。
這種方式的缺點是: 即使發送很少的數據,也要將socket加入、移出epoll模型。有一定的操作代價。
第二種方式,(是本人的改進方案, 叫做directly-write)
向socket寫數據時,不將socket加入到epoll模型;而是直接調用send()發送;
只有當或send()返回錯誤碼EAGAIN(系統緩存滿),才將socket加入到epoll模型,等待可寫事件后,再發送數據。
全部數據發送完畢,再移出epoll模型。
這種方案的優點: 當用戶數據比較少時,不需要epool的事件處理。
在高壓力的情況下,性能怎么樣呢?
對一次性直接寫成功、失敗的次數進行統計。如果成功次數遠大於失敗的次數, 說明性能良好。(如果失敗次數遠大於成功的次數,則關閉這種直接寫的操作,改用第一種方案。同時在日志里記錄警告)
在我自己的應用系統中,實驗結果數據證明該方案的性能良好。
事實上,網絡數據可分為兩種到達/發送情況:
一是分散的數據包, 例如每間隔40ms左右,發送/接收3-5個 MTU(或更小,這樣就沒超過默認的8K系統緩存)。
二是連續的數據包, 例如每間隔1s左右,連續發送/接收 20個 MTU(或更多)。
回來查了資料,發現以下兩種方式:
第三種方式: 使用Edge-Triggered(邊沿觸發),這樣socket有可寫事件,只會觸發一次。
可以在應用層做好標記。以避免頻繁的調用 epoll_ctl( EPOLL_CTL_ADD, EPOLL_CTL_MOD)。 這種方式是epoll 的 man 手冊里推薦的方式, 性能最高。但如果處理不當容易出錯,事件驅動停止。
第四種方式: 在epoll_ctl()使用EPOLLONESHOT標志,當事件觸發以后,socket會被禁止再次觸發。
需要再次調用epoll_ctl(EPOLL_CTL_MOD),才會接收下一次事件。 這種方式可以禁止socket可寫事件,應該也會同時禁止可讀事件。會帶來不便,同時並沒有性能優勢,因為epoll_ctl()有一定的操作代價。
2, 從socket讀數據時,socket緩存里的數據,可能超過用戶緩存的長度,如果處理?
可以調用realloc(),擴大原有的緩存塊尺寸。
但是臨時申請內存的有一定性能損失。
這種情況要看接收緩存的方式。
第一種方式: 使用100k的大接收緩存為例。
如果要等待數據,並進行解析。可能發生緩存不夠的情況。此時只能擴充緩存,或先處理100k的數據,再接收新的數據。
第二種方式: 使用緩存隊列,分成8K大小的隊列。
不存在接收緩存不夠的情況。 除非用戶解析已出錯,使用數據接收、使用脫勾。 這種方式的代價是,可能需要將緩存隊列再次拷貝、拼接成一塊大的緩存,再進行解析。 而在本人的系統中,只需要將socket接收的數據再次原樣分發給客戶, 所以這種方案是最佳方案。
3, 向socket發送數據時, 可能只發送了用戶緩存里的一半,然后失敗,如何處理?
記錄緩存的偏移量。 下一次socket寫事件時, 再從偏移的位置接着發送。
那個面試官居然對這個問題問了我兩次, 看來我解釋的不夠清晰。。。。。。 郁悶。
4, C++的虛函數是怎么實現的?
使用虛函數表。
回來查下資料: C++對象使用虛表, 如果是基類的實例,對應位置存放的是基類的函數指針;如果是繼承類,對應位置存放的是繼承類的函數指針(如果在繼承類有實現)。所以,當使用基類指針調用對象方法時,也會根據具體的實例,調用到繼承類的方法。
5, C++的虛函數有什么作用?
虛函數作用是實現多態, 很多人都能理解這一點。但卻不會回答下面這一點。
更重要的,虛函數其實是實現封裝,使得使用者不需要關心實現的細節。在很多設計模式中都是這樣用法,例如Factory、Bridge、Strategy模式。 前兩天在書上剛好看到這個問題,但在面試的時候卻沒想起來。
個人覺得這個問題可以很好的區分C++的理解水平。
6, 非阻塞connect()如何實現?
將socket設置成non-blocking,操作方法同非阻塞read()、write();
面試官是在聽到我介紹之后,才問我這個問題。可惜還是問我兩遍。
這次面試, 總的來說准備不夠充足, 所以這次機會沒有青睞我!
也有其它一些問題:
1, 對於一般的面試提問, 總是想很簡要的回答完。因為對方可能本來就很清楚,所以自己就想一兩句話說完。 但是有時候這樣行不通。需要適當的回答清晰、完整一些。
2, 對TCP/UDP的問題本來是很熟悉的,但因為長時間沒復習,忘的差不多了。
3, 以前已經對RTSP進行了仔細的學習。 HTTP、SIP屬於同一類協議。而我卻回答不了HTTP的問題。努力學習啊................
4, 有些問題要問我兩遍,說明我的表達確實不夠清晰。有的問題可能面試官自己並不清晰,所以除了表達清晰之外,完全有必要適當的回答稍完整些。否則很難讓人滿意。
5, 精神狀態不太好,思維有些慢了。 因為總是睡的晚。
接下來打算繼續研究 lighttpd源碼, 這樣對我自己的水平提高會有很大幫助。
機會總是青睞有准備的人! 期待下次。