從瀏覽器地址欄輸入url到顯示頁面的步驟(前端面試)


從瀏覽器地址欄輸入url到顯示頁面的步驟

最近在看面試題,發現了一道非常經典且高頻的題目,它是每個程序員都應該熟知的原理。

基礎版本(面試筆試)

  • 瀏覽器根據請求的 URL 交給 DNS 進行域名解析,找到真實 IP 地址,向服務器發起請求;
  • 服務器交給后台處理完成后返回數據,瀏覽器接收文件(HTMLCSSJSimages等);
  • 瀏覽器對加載到的資源(HTMLCSSJSimages等)進行語法解析,建立相應的內部數據結構(如HTMLDOM);
  • 載入解析到的資源文件,渲染頁面,完成。

詳細版本

  1. 在瀏覽器地址欄輸入URL

  2. 瀏覽器查看*緩存**,如果請求資源在緩存中並且新鮮,跳轉到轉碼步驟

    1. 如果資源未緩存,發起新請求;

    2. 如果已緩存,檢驗是否足夠新鮮,足夠新鮮直接提供給客戶端,否則與服務器進行驗證;

    3. 檢驗新鮮通常有兩個HTTP頭進行控制ExpiresCache-Control

      • HTTP1.0 提供Expires,值為一個絕對時間表示緩存新鮮日期
      • HTTP1.1 增加了Cache-Control:max-age=,值為以秒為單位的最大新鮮時間
  3. 瀏覽器解析URL獲取協議,主機、端口、path

  4. 瀏覽器組裝一個HTTP(GET)請求報文

  5. 瀏覽器獲取主機IP地址,過程如下:

    1. 瀏覽器緩存
    2. 本機緩存
    3. hosts文件
    4. 路由器緩存
    5. ISP DNS 緩存
    6. DNS 遞歸查詢(可能存在負載均衡導致每次IP不一樣)
  6. 打開一個socket與目標IP地址,端口建立TCP鏈接,三次握手如下:

    1. 客戶端發送一個TCP的SYN=1,Seq=X 的包到服務器端口
    2. 服務器發回SYN=1,ACK=X+1,Seq=Y 的響應包
    3. 客戶端發送 ACK=Y+1,Seq=Z
  7. TCP鏈接建立后發送HTTP請求

  8. 服務器接受請求並解析,將請求轉發到服務程序,如虛擬主機使用HTTP Host 頭部判斷請求的服務器程序

  9. 服務器檢查HTTP請求頭是否包含緩存驗證信息,如果驗證緩存新鮮,返回304等對應狀態碼

  10. 處理程序讀取完整請求並准備HTTP響應,可能需要查詢數據庫等操作

  11. 服務器將響應報文通過TCP連接發送回瀏覽器

  12. 瀏覽器接收HTTP響應,然后根據情況選擇關閉TCP連接或者保留重用,關閉TCP連接的四次握手如下:

    1. 主動方發送Fin=1,Ack=Z,Seq=X報文
    2. 被動方發送Ack=X+1,Seq=Z報文
    3. 被動方發送Fin=1,Ack=X,Seq=Y報文
    4. 主動方發送Ack=Y,Seq=X報文
  13. 瀏覽器檢查響應狀態碼:是否為 1xx,3xx,4xx,5xx,這些情況處理與2xx不同

  14. 如果資源可緩存,進行緩存

  15. 對響應進行解碼(比如gzip壓縮)

  16. 根據資源類型決定如何處理(假設資源為HTML文檔)

  17. 解析HTML文檔,構建DOM樹,下載資源,構造CSSOM樹,執行js腳本,這些操作沒有嚴格的先后順序,以下分別解釋:

  18. 構建DOM樹:

    1. Tokenizing:根據HTML規范將字符流解析為標記
    2. Lexing:詞法分析將標記轉換為對象並定義屬性和規則
    3. DOM construction:根據HTML標記關系將對象組成DOM樹
  19. 解析過程中遇到圖片、樣式表、js文件,啟動下載

  20. 構建CSSOM樹

    1. Tokenizing:字符流轉換為標記流
    2. Node:根據標記創建節點
    3. CSSOM:節點創建CSSOM樹
  21. 根據DOM樹和CSSOM樹構建渲染樹

    1. 從DOM樹的根節點遍歷所有可見節點,不可見節點包括:
      1)script,meta這樣本身不可見的標簽。2)被css隱藏的節點,如display: none
    2. 對每一個可見節點,找到恰當的CSSOM規則並應用
    3. 發布可視節點的內容和計算樣式
  22. js解析

    1. 瀏覽器創建Document對象並解析HTML,將解析到的元素和文本節點添加到文檔中,此時document.readystateloading
    2. HTML解析器遇到沒有asyncdeferscript時,將他們添加到文檔中,然后執行行內或外部腳本。這些腳本會同步執行,並且在腳本下載和執行時解析器會暫停。這樣就可以用document.write()把文本插入到輸入流中。同步腳本經常簡單定義函數和注冊事件處理程序,他們可以遍歷和操作script和他們之前的文檔內容
    3. 當解析器遇到設置了async屬性的script時,開始下載腳本並繼續解析文檔。腳本會在它下載完成后盡快執行,但是解析器不會停下來等它下載。異步腳本禁止使用document.write(),它們可以訪問自己script和之前的文檔元素
    4. 當文檔完成解析,document.readState變成interactive
    5. 所有defer腳本會按照在文檔出現的順序執行,延遲腳本能訪問完整文檔樹,禁止使用document.write()
    6. 瀏覽器在Document對象上觸發DOMContentLoaded事件
    7. 此時文檔完全解析完成,瀏覽器可能還在等待如圖片等內容加載,等這些內容完成載入並且所有異步腳本完成載入和執行,document.readState變為completewindow觸發load事件
  23. 顯示頁面(HTML解析過程中會逐步顯示頁面)


詳細簡版

  1. 從瀏覽器接收url到開啟網絡請求線程(這一部分可以展開瀏覽器的機制以及進程與線程之間的關系)
  2. 開啟網絡線程到發出一個完整的HTTP請求(這一部分涉及到dns查詢,TCP/IP請求,五層因特網協議棧等知識)
  3. 從服務器接收到請求到對應后台接收到請求(這一部分可能涉及到負載均衡,安全攔截以及后台內部的處理等等)
  4. 后台和前台的HTTP交互(這一部分包括HTTP頭部、響應碼、報文結構、cookie等知識,可以提下靜態資源的cookie優化,以及編碼解碼,如gzip壓縮等)
  5. 單獨拎出來的緩存問題,HTTP的緩存(這部分包括http緩存頭部,ETagcatch-control等)
  6. 瀏覽器接收到HTTP數據包后的解析流程(解析html-詞法分析然后解析成dom樹、解析css生成css規則樹、合並成render樹,然后layoutpainting渲染、復合圖層的合成、GPU繪制、外鏈資源的處理、loadedDOMContentLoaded等)
  7. CSS的可視化格式模型(元素的渲染規則,如包含塊,控制框,BFCIFC等概念)
  8. JS引擎解析過程(JS的解釋階段,預處理階段,執行階段生成執行上下文,VO,作用域鏈、回收機制等等)
  9. 其它(可以拓展不同的知識模塊,如跨域,web安全,hybrid模式等等內容)

各位加油!面試成功!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM