🎓 盡人事,聽天命。博主東南大學研究生在讀,熱愛健身和籃球,正在為兩年后的秋招准備中,樂於分享技術相關的所見所得,關注公眾號 @ 飛天小牛肉,第一時間獲取文章更新,成長的路上我們一起進步
🎁 本文已收錄於 CS-Wiki(Gitee 官方推薦項目,現已 0.9k star),致力打造完善的后端知識體系,在技術的路上少走彎路,歡迎各位小伙伴前來交流學習
0. 前言
為了保證網址的正常訪問,域名解析協議(DNS)其實在背后做出了很多努力,本文將透徹講解 DNS 協議的原理,了解我們每天都在接觸的網址到底是怎么工作的。
1. 什么是 DNS 協議
在學習 DNS 協議之前,我們先區分一下域名和 IP 地址這個兩個概念:
- IP 地址:一長串能夠唯一地標記網絡上的計算機的數字
- 域名:又稱網域,是由一串用點分隔的名字組成的 Internet 上某一台計算機或計算機組的名稱,用於在數據傳輸時對計算機的定位標識(有時也指地理位置)比如
www.baidu.com
不知道有沒有同學會混淆域名和網址的概念,可以這樣理解,網址里面含有域名。舉個例子:
www.gitee.com/veal98
就是一個網址,而www.gitee.com
就是域名
由於 IP 地址具有不方便記憶並且不能顯示地址組織的名稱和性質等缺點,人們設計出了域名,並通過域名解析協議(DNS,Domain Name System)來將域名和 IP 地址相互映射,使人更方便地訪問互聯網,而不用去記住能夠被機器直接讀取的 IP 地址數串。將域名映射成 IP 地址稱為正向解析,將 IP 地址映射成域名稱為反向解析。
💡 DNS 協議可以使用 UDP 或者 TCP 進行傳輸,使用的端口號都為 53。但大多數情況下 DNS 都使用 UDP 進行傳輸。
2. 域名詳解
❓ 那么域名由誰來規定和管理呢?不能是隨便寫吧?
全世界域名的最高管理機構,是一個叫做 ICANN (Internet Corporation for Assigned Names and Numbers)的組織,總部在美國加州。ICANN 負責管理全世界域名系統的運作。
域名其實是具有一定的層次結構的,從上到下依次為:根域名、頂級域名(top level domain,TLD)、二級域名、(三級域名)
① 頂級域名
先來講講頂級域名(TLD),即最高層級的域名。簡單說,就是網址的最后一個部分。比如,網址www.baidu.com
的頂級域名就是 .com
。ICANN 的一項主要工作,就是規定哪些字符串可以當作頂級域名。截至 2015 年 7 月,頂級域名共有 1058 個,它們大致可以分成兩類:
- 一類是通用頂級域名(gTLD),比如
.com
、.net
、.edu
、.org
、.xxx
等等,共有 700 多個。 - 另一類是國家頂級域名(ccTLD),代表不同的國家和地區,比如
.cn
(中國)、.io
(英屬印度洋領地)、.cc
( 科科斯群島)、.tv
(圖瓦盧)等,共有 300 多個。
當然,ICANN 自己不會去管理這些頂級域名,因為根本管不過來。想想看,頂級域名有1000多個,每個頂級域名下面都有許多批發商,如果每個都要管,就太麻煩了。ICANN 的政策是,每個頂級域名都找一個托管商,該域名的所有事項都由托管商負責。ICANN 只與托管商聯系,這樣管理起來就容易多了。舉例來說,.cn
國家頂級域名的托管商就是中國互聯網絡信息中心(CNNIC),它決定了 .cn
域名的各種政策。
② 二級域名
而二級域名(Second Level Domain,SLD) 在通用頂級域名或國家頂級域名之下具有不同的意義:
- 通用頂級域名下的二級域名:一般是指域名注冊人選擇使用的網上名稱,如
yahoo.com
(商業組織通常使用自己的商標、商號或其他商業標志作為自己的網上名稱,如baidu.com
) - 國家頂級域名下的二級域名:一般是指類似於通用頂級域名的表示注冊人類別和功能的標志。例如,在
.com.cn
域名結構中,.com
此時是置於國家頂級域名.cn
下的二級域名,表示中國的商業性組織,以此類推。
三級域名是形如 www.baidu.com
的域名,可以當做是二級域名的子域名,特征為域名包含兩個 .
。對於域名所有者/使用者而言,三級域名都是二級域名的附屬物而無需單獨費用。三級域名甚至不能稱為域名,一般稱之為域名下的 “二級目錄”。
③ 根域名
❓ 那么根域名在哪里呢?在層次結構中根域名不是最頂級的嗎?域名中怎么沒有看見它?
由於 ICANN 管理着所有的頂級域名,所以它是最高一級的域名節點,被稱為根域名(root domain)。在有些場合,www.xxx.com
被寫成 www.xxx.com.
,即最后還會多出一個點。這個點就是根域名。
理論上,所有域名的查詢都必須先查詢根域名,因為只有根域名才能告訴你,某個頂級域名由哪台服務器管理。事實上也確實如此,ICANN 維護着一張列表(根域名列表),里面記載着頂級域名和對應的托管商。
比如,我要訪問abc.xyz
,也必須先去詢問根域名列表,它會告訴我 .xyz
域名由 CentralNic 公司托管。根域名列表還記載,.google
由谷歌公司托管,.apple
由蘋果公司托管等等。
由於根域名列表很少變化,大多數 DNS 服務商都會提供它的緩存,所以根域名的查詢事實上不是那么頻繁。
3. 域名服務器詳解
域名服務器是指管理域名的主機和相應的軟件,它可以管理所在分層的域的相關信息。一個域名服務器所負責管里的分層叫作 區 (ZONE)。域名的每層都設有一個域名服務器:
- 根域名服務器
- 頂級域名服務器
- 權限域名服務器
下面這幅圖就很直觀了:
除了上面三種 DNS 服務器,還有一種不在 DNS 層次結構之中,但是很重要的 DNS 服務器,即本地域名服務器。下面我們分別講解這四種服務器都是用來干什么的 👇
① 根域名服務器
上面我們提到,ICANN 維護着一張根域名列表,里面記載着頂級域名和對應的托管商,其實根域名列表的正式名稱是 DNS 根區(DNS root zone),保存 DNS 根區文件的服務器,就叫做 DNS 根域名服務器(root name server)。根域名服務器保存所有的頂級域名服務器的地址
由於早期的 DNS 查詢結果是一個 512 字節的 UDP 數據包。這個包最多可以容納 13 個服務器的地址,因此就規定全世界有 13 個根域名服務器,編號從 a.root-servers.net
一直到 m.root-servers.net
。其中 10 台設置在美國,另外各有一台設置於荷蘭、瑞典和日本。
前面我們說過,理論上所有域名的查詢都必須先查詢根域名,所以一般來說所有的域名服務器都會注冊一份根域名服務器的 IP 地址的緩存,用於在必要的時候向其發送請求。
② 頂級域名服務器
按照根域名服務器管理頂級域名的邏輯,頂級域名服務器顯然就是用來管理注冊在該頂級域名下的所有二級域名的,記錄這些二級域名的 IP 地址。
③ 權限域名服務器
按照上面的邏輯,權限域名服務器應該是管理注冊在二級域名下的所有三/四級域名的,但其實不是這樣,如果一個二級域名或者一個三/四級域名對應一個域名服務器,則域名服務器數量會很多,我們需要使用划分區的辦法來解決這個問題。那么權限域名服務器就是負責管理一個“區”的域名服務器。
❓ 什么是區?怎樣划分區呢?
區和域其實是不同的,區可以有多種不同的划分方法。以百度為例,我們假設有 fanyi.baidu.com
、ai.baidu.com
、tieba.baidu.com
這三個三級域名。我們可以這樣分區,fanyi.baidu.com
和 tieba.baidu.com
放在 baidu.com
權限域名服務器,ai.baidu.com
放在 ai.baidu.com
權限域名服務器中。並且 baidu.com
權限域名服務器和 ai.baidu.com
權限域名服務器是同等地位的,而具體怎么分區是百度公司根據域名多少、訪問多少等情況去自己規定的。
畫個圖直觀理解一下:
④ 本地域名服務器
除了上面三種 DNS 服務器,還有一種不在 DNS 層次結構之中,但是很重要的 DNS 服務器,就是本地域名服務器(也被稱為權威域名服務器)。本地域名服務器是電腦解析時的默認域名服務器,即電腦中設置的首選 DNS 服務器和備選 DNS 服務器。常見的有電信、聯通、谷歌、阿里等的本地 DNS 服務。
每個因特網服務提供者或一所大學,甚至一所大學中的各個系,都可以擁有一個本地域名服務器。當一台主機發出 DNS 查詢請求時,這個查詢請求報文就發送給該主機的本地域名服務器。本地域名服務器管理本地域名的解析和映射,並且能夠向上級域名服務器進行查詢。
那么具體本地域名服務器是如何向上級域名服務器轉發查詢請求的呢?
4. DNS 查詢方式
具體 DNS 查詢的方式有兩種:
- 遞歸查詢
- 迭代查詢
所謂迭代就是,如果請求的接收者不知道所請求的內容,那么接收者將扮演請求者,發出有關請求,直到獲得所需要的內容,然后將內容返回給最初的請求者。
👍 通俗點來說,在遞歸查詢中,如果 A 請求 B,那么 B 作為請求的接收者一定要給 A 想要的答案;而迭代查詢則是指,如果接收者 B 沒有請求者 A 所需要的准確內容,接收者 B 將告訴請求者 A,如何去獲得這個內容,但是自己並不去發出請求。
一般來說,域名服務器之間的查詢使用迭代查詢方式,以免根域名服務器的壓力過大。通過下面這兩個圖就能很好的理解了 👇
1)遞歸查詢:
2)迭代查詢:
5. 域名緩存
上面講解的是域名服務器之間的 DNS 查詢請求過程,但實際上,每個時刻都有無數網民要上網,那每次都去訪問本地域名服務器去獲取 IP 地址顯然是不實際的。解決方法就是使用緩存保存域名和 IP 地址的映射。
計算機中 DNS 記錄在本地有兩種緩存方式:瀏覽器緩存和操作系統緩存。
1)瀏覽器緩存:瀏覽器在獲取網站域名的實際 IP 地址后會對其進行緩存,減少網絡請求的損耗。每種瀏覽器都有一個固定的 DNS 緩存時間,如 Chrome 的過期時間是 1 分鍾,在這個期限內不會重新請求 DNS
2)操作系統緩存:操作系統的緩存其實是用戶自己配置的 hosts 文件。比如 Windows10 下的 hosts 文件存放在 C:\Windows\System32\drivers\etc\hosts
Windows 系統默認開啟 DNS 緩存服務,服務名是 DNSClient
,可以緩存一些常用的域名。
使用命令 ipconfig/displaydns
可以查看電腦中緩存的域名。
⭐ 在瀏覽器中進行訪問的時候,會優先查詢瀏覽器緩存,如果未命中則繼續查詢操作系統緩存,最后再查詢本地域名服務器,然后本地域名服務器會遞歸的查找域名記錄,最后返回結果。主機和本地域名服務器之間的查詢方式是遞歸查詢,也就是說主機請求本地域名服務器,那么本地域名服務器作為請求的接收者一定要給主機想要的答案。
6. 完整域名解析過程
OK,將我們上面所說的域名服務器之間的 DNS 查詢請求過程和域名緩存結合起來,就是一個完整的 DNS 協議進行域名解析的過程。這里我們以正向解析為例(域名解析成 IP 地址):
1)首先搜索瀏覽器的 DNS 緩存,緩存中維護一張域名與 IP 地址的對應表;
2)若沒有命中,則繼續搜索操作系統的 DNS 緩存;
3)若仍然沒有命中,則操作系統將域名發送至本地域名服務器,本地域名服務器查詢自己的 DNS 緩存,查找成功則返回結果(注意:主機和本地域名服務器之間的查詢方式是遞歸查詢);
4)若本地域名服務器的 DNS 緩存沒有命中,則本地域名服務器向上級域名服務器進行查詢,通過以下方式進行迭代查詢(注意:本地域名服務器和其他域名服務器之間的查詢方式是迭代查詢,防止根域名服務器壓力過大):
- 首先本地域名服務器向根域名服務器發起請求,根域名服務器是最高層次的,它並不會直接指明這個域名對應的 IP 地址,而是返回頂級域名服務器的地址,也就是說給本地域名服務器指明一條道路,讓他去這里尋找答案
- 本地域名服務器拿到這個頂級域名服務器的地址后,就向其發起請求,獲取權限域名服務器的地址
- 本地域名服務器根據權限域名服務器的地址向其發起請求,最終得到該域名對應的 IP 地址
4)本地域名服務器將得到的 IP 地址返回給操作系統,同時自己將 IP 地址緩存起來
5)操作系統將 IP 地址返回給瀏覽器,同時自己也將 IP 地址緩存起來
6)至此,瀏覽器就得到了域名對應的 IP 地址,並將 IP 地址緩存起來
配合下圖直觀理解:
🎉 關注公眾號 | 飛天小牛肉,即時獲取更新
- 博主東南大學研究生在讀,利用課余時間運營一個公眾號『 飛天小牛肉 』,2020/12/29 日第一次開通,專注分享計算機基礎(數據結構 + 算法 + 計算機網絡 + 數據庫 + 操作系統 + Linux)、Java 基礎和面試指南的相關原創技術好文。本公眾號的目的就是讓大家可以快速掌握重點知識,有的放矢。希望大家多多支持哦,和小牛肉一起成長 😃
- 並推薦個人維護的開源教程類項目: CS-Wiki(Gitee 推薦項目,現已 0.9k star), 致力打造完善的后端知識體系,在技術的路上少走彎路,歡迎各位小伙伴前來交流學習 ~ 😊