史上最全Python工程師常見面試題集錦,有這一份就夠了


從互聯網誕生以來,基本上所有的程序都屬於網絡程序,也就需要設計到網絡編程,在python中,就是在python程序本身這個進程內,鏈接別的服務器進程的通信端口進行通信。在Python程序員找工作的時候,京城被問到關於網絡編程的問題。下面就和大家分享一下那些面試中經常出現的問題吧。

 

Python工程師常見面試題集錦--網絡編程(1)

  1.Tcp 協議和 udp 協議有什么區別?

  (1)TCP 面向連接(如打電話要先撥號建立連接);UDP 是無連接的,即發送數據之前不需要建立連接。
  (2)每一條 TCP 連接只能是點到點的;UDP 支持一對一,一對多,多對一和多對多的交互通信。
  (3)TCP 首部開銷 20 字節;UDP 的首部開銷小,只有 8 個字節。
  (4)TCP 的邏輯通信信道是全雙工的可靠信道,UDP 則是不可靠信道。

  2.Post 和 get 區別?

  (1)GET 請求的數據會暴露在地址欄中,而 POST 請求則存在表單中提交所以 post 相對安全。
  (2)post 傳輸數據比 get 大。
  (3)post 比 get 安全。

  3.cookie 和 session 的區別?

  (1)cookie 數據存放在客戶的瀏覽器上,session 數據放在服務器上。
  (2)cookie 不是很安全,別人可以分析存放在本地的 COOKIE 並進行 COOKIE欺騙考慮到安全應當使用 session。
  (3)session 會在一定時間內保存在服務器上。當訪問增多,會比較占用服務器的性能考慮到減輕服務器性能方面,應當使用 COOKIE。
  (4)單個 cookie 保存的數據不能超過 4K,很多瀏覽器都限制一個站點最多保存 20 個 cookie。
  (5)建議:將登陸信息等重要信息存放為 SESSION其他信息如果需要保留,可以放在 COOKIE 中。

  4.什么是僵屍進程和孤兒進程,怎么避免僵屍進程?

  (1)孤兒進程:父進程退出,子進程還在運行的這些子進程都是孤兒進程,孤兒進程將被會被其它進程收養,不會造成影響。
  (2)僵屍進程:子進程退出,而父進程遲遲不回收,造成資源浪費。
  (3)避免僵屍進程的方法:1.fork 兩次用孫子進程去完成子進程的任務。2.用 wait()函數使父進程阻塞。

 

      5.scrapy 和 scrapy-redis 有什么區別?

  答:scrapy 是一個 Python 爬蟲框架,爬取效率極高,具有高度定制性,但是不支持分布式。而 scrapy-redis 一套基於 redis 數據庫、運行在 scrapy 框架之上的組件,可以讓scrapy 支持分布式策略,Slaver 端共享 Master 端 redis 數據庫里的 item 隊列、請求隊列和請求指紋集合。

 

    6.描述下 scrapy 框架運行的機制?

  答:從 start_urls 里獲取第一批 url 並發送請求,請求由引擎交給調度器入請求隊列,獲取完畢后,調度器將請求隊列里的請求交給下載器去獲取請求對應的響應資源,並將響應交給自己編寫的解析方法做提取處理:1. 如果提取出需要的數據,則交給管道文件處理;2. 如果提取出url,則繼續執行之前的步驟(發送url請求,並由引擎將請求交給調度器入隊列...),直到請求隊列里沒有請求,程序結束。

 

   7.Post 和 get 區別和應用場合?

  區別:

  Get:從指定的服務器中獲取數據。GET 請求能夠被緩存;GET 請求會保存在瀏覽器的瀏覽記錄中;以 GET 請求的URL能夠保存為瀏覽器書簽;GET 請求有長度限制;GET 請求主要用以獲取數據。

  Post:POST 請求不能被緩存下來;POST 請求不會保存在瀏覽器瀏覽記錄中; POST 請求的 URL 無法保存為瀏覽器書簽;POST 請求沒有長度限制;POST 請求會把請求的數據放置在HTTP 請求包的包體中,POST 的安全性比 GET的高。可能修改變服務器上的資源的請求

  應用場合:

  post:請求的結果有持續性的副作用(數據庫內添加新的數據行)若使用 GET 方法,則表單上收集的數據可能讓 URL 過長。要傳送的數據不是采用 7 位的 ASCII 編碼。

  get:請求是為了查找資源,HTML表單數據僅用來幫助搜索。請求結果無持續性的副作用。收集的數據及 HTML 表單內的輸入字段名稱的總長不超過 1024 個字符。

 

   8.說一下 mysql 數據庫存儲的原理?

  儲存過程是一個可編程的函數,它在數據庫中創建並保存。它可以有 SQL 語句和一些特殊的控制結構組成。當希望在不同的應用程序或平台上執行相同的函數,或者封裝特定功能時,存儲過程是非常有用的。數據庫中的存儲過程可以看做是對編程中面向對象方法的模擬。它允許控制數據的訪問方式。存儲過程通常有以下優點:

  a、存儲過程能實現較快的執行速度。

  b、存儲過程允許標准組件是編程。

  c、存儲過程可以用流程控制語句編寫,有很強的靈活性,可以完成復雜的判斷和較復雜的運算。

  d、存儲過程可被作為一種安全機制來充分利用。

  e、存儲過程能夠減少網絡流量。

 

  9.數據庫索引

  數據庫索引,是數據庫管理系統中一個排序的數據結構,以協助快速查詢、更新數據庫表中數據。索引的實現通常使用 B_TREE。B_TREE 索引加速了數據訪問,因為存儲引擎不會再去掃描整張表得到需要的數據;相反,它從根節點開始,根節點保存了子節點的指針,存儲引擎會根據指針快速尋找數據。

 

  10.數據庫優化方案

  優化索引、SQL 語句、分析慢查詢

  設計表的時候嚴格根據數據庫的設計范式來設計數據庫

  使用緩存,把經常訪問到的數據而且不需要經常變化的數據放在緩存中,能節約磁盤 IO

  優化硬件;采用 SSD,使用磁盤隊列技術(RAID0,RAID1,RDID5)等;

  采用MySQL內部自帶的表分區技術,把數據分層不同的文件,能夠提高磁盤的讀取效率

  垂直分表;把一些不經常讀的數據放在一張表里,節約磁盤 I/O

  主從分離讀寫;采用主從復制把數據庫的讀操作和寫入操作分離開來

  分庫分表分機器(數據量特別大),主要的的原理就是數據路由

  選擇合適的表引擎,參數上的優化

  進行架構級別的緩存,靜態化和分布式

  不采用全文索引

  采用更快的存儲方式,例如 NoSql 存儲經常訪問的數據。

 

  11.數據庫怎么優化查詢效率?

  1、儲存引擎選擇:如果數據表需要事務處理,應該考慮使用 InnoDB,因為它完全符合 ACID 特性。如果不需要事務處理,使用默認存儲引擎 MyISAM 是比較明智的

  2、分表分庫,主從。

  3、對查詢進行優化,要盡量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引

  4、應盡量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描

  5、應盡量避免在 where 子句中使用 != 或 <> 操作符,否則將引擎放棄使用索引而進行全表掃描

  6、應盡量避免在 where 子句中使用 or 來連接條件,如果一個字段有索引,一個字段沒有索引,將導致引擎放棄使用索引而進行全表掃描

  7、Update 語句,如果只更改 1、2 個字段,不要 Update 全部字段,否則頻繁調用會引起明顯的性能消耗,同時帶來大量日志

  8、對於多張大數據量(這里幾百條就算大了)的表 JOIN,要先分頁再 JOIN,否則邏輯讀會很高,性能很差。


以上就是Python工程師數據庫常見面試題。你面試的時候有遇到過嗎?又或許你現在剛剛開始學習Python開發,一定要着重掌握關於數據庫相關的知識,未來是大數據時代,對於數據庫的要求會越來越多。所以能掌握數據庫的知識也是為自己未來的職場發展提供更多的機會。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM