第九節 面試專項


0 面試類型
一般為線上視頻面試,國內疫情形式緊張。線下面試較少。線上面試有些技巧可言的。面試時間一般每個人就五分鍾時間左右。
1 自我介紹
不要以為只有英文自我介紹,在正式面試的時候需要准備一下1-2分鍾左右的自我介紹。自我介紹可以在本地開啟一個文本文檔,面試時照着念就行,避免緊張說不出話,或者說錯話,說話沒有邏輯性。可參考以下模板進行。
【備注:我不知道你們考研復試還有雙機位等,自己准備好自我介紹,然后自己背誦下來,反正也就幾百字!!!】
1.1 成績優秀類型

老師們好,我叫小明,今年22歲,初試分數為:370分,本科專業是讀的軟件工程,一直以來對計算機都很感興趣,大學期間所有關於專業課相關的比賽我都積極參加,也拿到過不少獎項,大學期間成績還可以,專業排名一直都是前10%,先后獲得**獎學金。因為對計算機人工智能等方面比較感興趣,在大二至大三期間就加入了學院的創新實驗室,參加了一個名為《機器學習體驗平台》的項目,該項目主要提供一些常見的人工智能工具供老師和學生進行使用,目前工具已經集成了圖像識別、文字識別、自然語言處理、語音識別、人臉識別等AI工具。通過這個項目,我對人工智能機器學習方面充滿了興趣,自學了機器學習的基礎知識和線性回歸和邏輯回歸的算法,然后利用線性回歸做了一個房價預測模型,完成了這個模型后,我欣喜若狂,這也堅定了我考研的決心,想在研究生階段深入學習這方面知識,希望老師們能給我這個機會,我將感激不盡。

老師們好,我叫小李,初試分數為:370分,本科專業是讀的計算機科學與技術,大學期間成績優異,獲得了獎學金,除此之外,我還積極參與學科類競賽,在比賽中獲得獎,並且拿到了四六級證書,軟件設計師證書等。在校期間和同學一起完成了一個文字識別小程序項目,該項目是拍照將圖片中的文字提取出來,主要是利用百度飛槳的AI能力實現。通過這個項目,我對人工智能機器學習方面充滿了興趣,自學了機器學習的基礎知識和線性回歸和邏輯回歸的算法,然后利用線性回歸做了一個預測模型,其中在預測的結果模型評估中,MSE值降低至:1021.457,R2值為0.918。本科期間在人工智能方面接觸較少,希望再研究生期間深入研究學習這方面知識。謝謝老師的傾聽。

1.2 學習一般且啥也沒有類型
老師們好,我叫小王,初試分數為:370分,本科專業是讀的計算機科學與技術專業,興趣愛好比較廣泛,喜歡戶外運動、爬山、旅游等,在本科期間也很喜歡學習新的技術,大學期間除了學校教的C++、Java,我還自學了Python語言以及Java的Spring Boot等框架,並使用Java做了一個人工智能平台,***,使用Python語言和線性回歸做了一個項目。

1.3 跨專業考研類型
老師們好,我叫小張,初試分數為:370分,本科專業是土木工程專業,本科期間成績優異,獲得獎學金,並拿到證書。(開始解鎖為什么要考計算機) 除了對本專業感興趣之外,我對計算機專業也非常感興趣,大學期間加入了學校的計算機協會,在計算機協會里面做了一個**項目,該項目主要功能是(一兩句話描述項目,讓老師知道你做了啥。)業余時間自學了計算機相關知識,也結實了很多計算機的朋友,我對計算機的熱愛,絲毫不亞於計算機專業的同學,於是我想考取計算機的研究生,深入學習計算機知識。謝謝老師

1.3 跨專業考研避雷。
雖然你們的目的都是因為計算機好就業薪資高,但是在復試中不要提到這些東西,因為研究生是屬於研究性質的,學術性質的,很忌諱出現如此功利性的目的。所以盡可能的避開這些詞匯的出現。

2 面試應該如何准備
2.1 基礎知識篇
基礎知識一般會問一寫《計算機網絡》、《操作系統》、《計算機組成原理》、《數據庫原理》專業課知識。

2.1.1 計算機網絡
1、TCP,UDP介紹,差別
�TCP是面向連接的可靠傳輸 UDP是無連接的不可靠傳輸
TCP是頭部消耗大最少20字節 UDP8字節
TCP是面向字節流的 UDP是面向報文的
TCP是只支持1對1通信 UDP可以1對多 多對一 多對多通信

�2、簡述TCP的三次握手四次揮手
三次握手:客戶端發出一個報文頭部SYN標志位為1,並發送一個sqn為x,此時客戶端進入SYN—SEND狀態,服務端收到連接請求回應一個報文,
其中標志位ACK確認號為1,SYN標志位為1,seq為y,ack為x+1,此時客戶端進入SYN—received狀態。客戶端收到報文后,發送ACK確認號為1,
ack為y+1,seq為x+1。

四次握手: 客戶端發出一個報文,其中標志位FIN為1,seq為x,客戶端進入final-wait狀態。服務端收到后發送ACK=1 ack=x+1 seq=y,
此時服務端進入Close-wait狀態,此時服務端任然可以繼續發送數據,等服務端發送完后發送一個FIN=1,ACK=1,seq=z,ack=x+1,
此時服務端進入Last-ACK狀態。客戶端收到后發送確認ACK=1,seq=x+1,ack=z+1。服務端收到后進入連接關閉狀態,此時客戶端進入
Time—wait狀態,等待2個MSL時間后,連接關閉。

3、TCP/IP協議的可靠性是怎樣保證的?(滑動窗口)

主要是停止等待協議和連續ARQ協議。
停止等待協議是最簡單的可靠傳輸,因為它發送一個包就等待對方確認,收到確認后就發送下一個包,若超時就重發。
停止等待協議效率太低了,所以就基於流水線的原理有了連續ARQ協議,連續ARQ協議是維持了一個滑動窗口,位於發送窗口內的分組都可連續發送出去,
而不需要等待對方的確認,發送方每收到一個確認, 就把發送窗口向前滑動一個分組的位置。TCP每發送一個報文段,就對這個報文段設置一次計時器,
只要計時器設置的重傳時間到但還沒有收到確認,就要重傳這一報文段。

4、IP地址有哪幾類
A類,B類,C類,D類,E類。
A類、B類、和C類這三類地址用於TCP/IP節點,其它兩類D類和E類被用於特殊用途。

�5、TCP、OSI網絡模型有幾層
TCP四層(網絡接口層、網絡層、傳輸層、應用層)
OSI七層(物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層、應用層)
五層模型(物理層、數據鏈路層、網絡層、傳輸層、應用層)

其他的有時間就自己多去准備。

2.1.2 操作系統
時間關系,你們自己去百度答案。
1、進程和線程
2、進程的狀態
3、進程的調度策略
4、死鎖、死鎖條件、死鎖避免
5、物理地址、邏輯地址、相對地址、絕對地址
這方面一般問的不多。

2.1.3 計算機組成原理
馮諾依曼體系結構的計算機分為哪幾層?

這個一般問的比較少,網上找一下別人問過的問題,簡單准備一下就行。

2.1.4 數據庫原理
這個問的也比較少,記得一二三BC范式這些,其他好像問的也不多,網上找找吧。

2.2 項目篇
2.2.1 百度AI平台搭建的人工智能平台
昨天模擬面試了三個同學,發現大家的項目雖然名字不一樣,但是功能描述都很相似,我覺得這樣子不妥,所以給了幾個參考供大家選擇。
1、文字提取器
這個主要是在學習過程中、期末考試復習中會有很多資料是以圖片形式,或者是圖書館的書籍上的文字,想把這些資料以文字形式保存在電腦中,若人工去打字需要消耗大量的時間,所以利用百度PaddlePaddle的AI能力進行文字識別,做了一個文字提取器。
2、圖書管理系統
在做圖書管理系統課設的時候,發現同學借書輸入書本的ISBN編碼非常的費時且不方便,於是利用百度AI的能力,在圖書系統中加了一個文字識別功能,只需要將書本放入攝像頭下,就能自動識別書本名稱,作者,版本,然后拱管理員選擇對應的書本,大大節省圖書借閱時間。
3、語音識別系統
在上課的時候,將老師講的關鍵知識點錄音記錄下來,但是語言轉文字基本上都是收費的,免費額度基本上都是一分鍾左右,所以利用百度飛槳AI平台做了一個語言轉文字的小工具。
4....
項目細節:

1、你有沒有了解過文字識別背后的過程是什么?
(以下是詳細流程,整理成自己的話,幾句話描述清楚整個流程)
OCR識別提取圖片中文字原理
· 預處理:對包含文字的圖像進行處理以便后續進行特征提取、學習。這個過程的主要目的是減少圖像中的無用信息,以便方便后面的處理。在這個步驟通常有:灰度化(如果是彩色圖像)、降噪、二值化、字符切分以及歸一化這些子步驟。經過二值化后,圖像只剩下兩種顏色,即黑和白,其中一個是圖像背景,另一個顏色就是要識別的文字了。降噪在這個階段非常重要,降噪算法的好壞對特征提取的影響很大。字符切分則是將圖像中的文字分割成單個文字——識別的時候是一個字一個字識別的。如果文字行有傾斜的話往往還要進行傾斜校正。歸一化則是將單個的文字圖像規整到同樣的尺寸,在同一個規格下,才能應用統一的算法。

· 特征提取和降維:特征是用來識別文字的關鍵信息,每個不同的文字都能通過特征來和其他文字進行區分。對於數字和英文字母來說,這個特征提取是比較容易的,因為數字只有10個,英文字母只有52個,都是小字符集。對於漢字來說,特征提取比較困難,因為首先漢字是大字符集,國標中光是最常用的第一級漢字就有3755個;第二個漢字結構復雜,形近字多。在確定了使用何種特征后,視情況而定,還有可能要進行特征降維,這種情況就是如果特征的維數太高(特征一般用一個向量表示,維數即該向量的分量數),分類器的效率會受到很大的影響,為了提高識別速率,往往就要進行降維,這個過程也很重要,既要降低維數吧,又得使得減少維數后的特征向量還保留了足夠的信息量(以區分不同的文字)。

· 分類器設計、訓練和實際識別:分類器是用來進行識別的,就是對於第二步,對一個文字圖像,提取出特征給,丟給分類器,分類器就對其進行分類,告訴你這個特征該識別成哪個文字。

· 后處理:后處理是用來對分類結果進行優化的,第一個,分類器的分類有時候不一定是完全正確的(實際上也做不到完全正確),比如對漢字的識別,由於漢字中形近字的存在,很容易將一個字識別成其形近字。后處理中可以去解決這個問題,比如通過語言模型來進行校正——如果分類器將“在哪里”識別成“存哪里”,通過語言模型會發現“存哪里”是錯誤的,然后進行校正。第二個,OCR的識別圖像往往是有大量文字的,而且這些文字存在排版、字體大小等復雜情況,后處理中可以嘗試去對識別結果進行格式化,比如按照圖像中的排版排列什么的,舉個栗子,一張圖像,其左半部分的文字和右半部分的文字毫無關系,而在字符切分過程中,往往是按行切分的,那么識別結果中左半部分的第一行后面會跟着右半部分的第一行諸如此類。

項目提問:
2、分類器是怎么設計的,運用了什么算法。
遇到這種不會的話題,統一話術,往自己會的地方引入,看似答得朗朗上口,其實答非所問。
我了解到的分類算法一般是,邏輯回歸、K-近鄰算法、決策樹、神經網絡這些。因為是用的百度訓練好的模型,不清楚百度用到的什么分類算法。

3、介紹一下你了解的決策樹算法?
我會一些簡單的機器學習算法,線性回歸邏輯回歸這些,因為當時要准備初試原因,所以沒有深入的去學習后面的算法,我會抓緊時間在入學前掌握這些常見的機器學習算法的。

4、那介紹一下邏輯回歸算法吧?
自己去總結,我之前文檔寫的很詳細了。

5、說說你了解的人工智能。
人工智能包含機器學習和深度學習,其中機器學習又包含深度學習,學習的形式一般分為監督學習和無監督學習....

3、其他問題:
1 平時有哪些興趣愛好?
說正能量的,說喜歡打游戲、看劇、看小說我™呼死你。說唱歌、看電影、運動、戶外、旅行都可以。
2 平時喜歡看那些書?
說專業書比較好,比如說《大話數據結構》、最近在看李開復教授的《深度學習》,當然也可以說一些名著,哲學等其他學科的書籍,盡量不要說一些很隨意的書。

3 關系類的,男女朋友有嗎?
這個隨意答,有就說我們二人共同進步,一起考研,切記不要一個工作一個讀研。沒有就說暫時沒有遇到有緣人。

4 如何評價你自己?(你的優點是什么?你的缺點是什么?)
說說自己的優缺點


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM