CS架構&BS架構
# 互聯通信軟件有兩種模式:CS架構和BS架構
CS指的是Client-Server,分別有一個客戶端軟件和一個服務端軟件
BS指的是Browser-Server,一個瀏覽器和一個服務端軟件
客戶端軟件send 服務端軟件recv
操作系統 操作系統
計算機硬件 <====物理介質=====> 計算機硬件
網絡通信
網絡 = 物理鏈接介質 + 互聯網通信協議
網絡存在的意義就是跨地域數據傳輸, 稱之為通信
互聯網的本質就是一系列的網絡協議
互聯網協議的功能:定義計算機如何接入internet,以及接入internet的計算機通信的標准。
體系結構
把計算機網絡的各層及其協議的集合,稱為網絡的體系結構。
互聯網通信協議更具歷史的發展分別有:osi七層協議、TCP/IP四層協議、TCP/IP五層協議
- OSI七層協議是國際標准化組織ISO提出的,但由於是市場原因和該協議本身的缺點(協議實現過一復雜,層次划分不太合理等)導致起初市場上大規模使用的並不是該協議,而是因特網。所以有這樣一個現象:得到最廣泛應用的不是法律上的國際標准OSI,而是非國際標准TCP/IP。這樣TCP/IP成為了事實上的國際標准。
- OSI七層協議體系結構的概念清楚,理論也比較完整,但它既復雜又不實用。TCP/IP體系結構則不同,它現在已經得到了非常廣泛的應用。TCP/IP是一個四層的體系結構。因為最下面的網絡接口層基本上和一般的通信鏈路在功能上沒有多大區別,對於計算機網絡來說,這一層並沒有特別新的具體內容。因此在在學習計算機網絡的原理是往往采取折中的辦法,即綜合OSI和TCP/IP的優點,采用一種只有五層協議的體系結構,遮掩既簡潔又能將概念闡述清楚。
- TCP/IP代表傳輸控制協議/網際協議,指的是一系列協組。
# 協議:規定數據的組織格式
# 格式:頭部 + 數據部分
物理層
物理層由來:上面提到,孤立的計算機之間要想一起玩,就必須接入internet,言外之意就是計算機之間必須完成組網。
物理層功能:主要是基於電器特性發送高低電壓(電信號),高電壓對應數字1,低電壓對應數字0
# 一組物理層數據稱之為:位
# 單純的電信號毫無意義,必須對其進行分組
數據鏈路層
數據鏈路層由來:單純的電信號0和1沒有任何意義,必須規定電信號多少位一組,每組什么意思
數據鏈路層的功能:定義了電信號的分組方式
數據鏈路層:遵循以太網協議(ethernet)
規定1:一組數據稱之為一個數據幀
規定2:數據幀分成兩部分=》頭+數據
頭包含:源地址與目標地址,該地址是mac地址
數據包含:包含的是網絡層發過來的整體的內容
規定3:規定但凡接入互聯網的主機必須有一塊網卡,每塊網卡在出廠時都燒制好一個全世界獨一無二的地址,該地址稱之為mac地址
head包含:(固定18個字節)
發送者/源地址,6個字節
接收者/目標地址,6個字節
數據類型,6個字節
data包含:(最短46字節,最長1500字節)
數據包的具體內容
head長度+data長度=最短64字節,最長1518字節,超過最大限制就分片發送
head中包含的源和目標地址由來:ethernet規定接入internet的設備都必須具備網卡,發送端和接收端的地址便是指網卡的地址,即mac地址
mac地址:每塊網卡出廠時都被燒制上一個世界唯一的mac地址,長度為48位2進制,通常由12位16進制數表示(前六位是廠商編號,后六位是流水線號)
有了mac地址,同一網絡內的兩台主機就可以通信了(一台主機通過arp協議獲取另外一台主機的mac地址)
ethernet采用最原始的方式,廣播的方式進行通信,即計算機通信基本靠吼。
網絡層
網絡層的目的是划分廣播域。
網絡層由來:有了ethernet、mac地址、廣播的發送方式,世界上的計算機就可以彼此通信了,問題是世界范圍的互聯網是由
一個個彼此隔離的小的局域網組成的,那么如果所有的通信都采用以太網的廣播方式,那么一台機器發送的包全世界都會收到,這就不僅僅是效率低的問題了,這會是一種災難.
必須找出一種方法來區分哪些計算機屬於同一廣播域,哪些不是,如果是就采用廣播的方式發送,如果不是,
就采用路由的方式(向不同廣播域/子網分發數據包),mac地址是無法區分的,它只跟廠商有關
每一個廣播域但凡要接通外部,一定要有一個網關幫內部的計算機轉發包到公網。網關與外界通信走的是路由協議。
網絡層功能:引入一套新的地址用來區分不同的廣播域/子網,這套地址即網絡地址(IP地址)。
網絡層:遵循IP協議
IP協議:
- 規定網絡地址的協議叫ip協議,它定義的地址稱之為ip地址,廣泛采用的v4版本即ipv4,它規定網絡地址由32位2進制表示
- 范圍0.0.0.0-255.255.255.255
- 一個ip地址通常寫成四段十進制數,例:172.16.10.1
規定1:一組數據稱之為一個數據包
規定2:數據幀分成兩部分=》頭+數據
頭包含:源地址與目標地址,該地址是IP地址
數據包含的:傳輸層發過來的整體的內容
ip地址分成兩部分
- 網絡部分:標識子網
- 主機部分:標識主機
注意:單純的ip地址段只是標識了ip地址的種類,從網絡部分或主機部分都無法辨識一個ip所處的子網
例:172.16.10.1與172.16.10.2並不能確定二者處於同一子網
子網掩碼
所謂”子網掩碼”,就是表示子網絡特征的一個參數。它在形式上等同於IP地址,也是一個32位二進制數字,它的網絡部分全部為1,主機部分全部為0。比如,IP地址172.16.10.1,如果已知網絡部分是前24位,主機部分是后8位,那么子網絡掩碼就是11111111.11111111.11111111.00000000,寫成十進制就是255.255.255.0。
子網掩碼:它的書寫方式和ip地址的形式相同。也可以寫成多少個1,即24表示前面24個1,后面8位0,如果不寫,默認是24
zip地址要配合子網掩碼一塊使用才有意義
知道”子網掩碼”,我們就能判斷,任意兩個IP地址是否處在同一個子網絡。
將IP地址和子網掩碼都換算成二進制,然后進行與運算,結果就是網絡地址。網絡地址相同則在一個局域網內。
# 判斷兩個IP地址是否處於一個自網絡內:
將兩個IP地址與子網掩碼分別進行AND運算(兩個數位都為1,運算結果為1,否則為0),然后比較結果是否相同。
如果是的話,就表明它們在同一個子網絡中,否則就不是。
# 應用:
已知IP地址172.16.10.1和172.16.10.2的子網掩碼都是255.255.255.0,請問它們是否在同一個子網絡?
兩者與子網掩碼分別進行AND運算,
172.16.10.1:10101100.00010000.00001010.000000001
255255.255.255.0:11111111.11111111.11111111.00000000
AND運算得網絡地址結果:10101100.00010000.00001010.000000001 --> 172.16.10.0
172.16.10.2:10101100.00010000.00001010.000000010
255255.255.255.0:11111111.11111111.11111111.00000000
AND運算得網絡地址結果:10101100.00010000.00001010.000000001 --> 172.16.10.0
結果都是172.16.10.0,因此它們在同一個子網絡。
總結一下,IP協議的作用主要有兩個:
- 一個是為每一台計算機分配IP地址
- 另一個是確定哪些地址在同一個子網絡。
ip數據包
# ip數據包也分為head和data部分,無須為ip包定義單獨的欄位,直接放入以太網包的data部分
head:長度為20到60字節
data:最長為65,515字節。
而以太網數據包的”數據”部分,最長只有1500字節。因此,如果IP數據包超過了1500字節,它就需要分割成幾個以太網數據包,分開發送了
ARP協議
arp協議由來:計算機通信基本靠吼,即廣播的方式,所有上層的包到最后都要封裝上以太網頭,然后通過以太網協議發送,在談及以太網協議時候,我們了解到通信是基於mac的廣播方式實現,計算機在發包時,獲取自身的mac是容易的,如何獲取目標主機的mac,就需要通過arp協議。
arp協議功能:廣播的方式發送數據包,獲取目標主機的mac地址
協議工作方式:每台主機ip都是已知的
例如:主機172.16.10.10/24訪問172.16.10.11/24
一:首先通過ip地址和子網掩碼區分出自己所處的子網
場景 | 數據包地址 |
---|---|
同一子網 | 目標主機mac,目標主機ip |
不同子網 | 網關mac,目標主機ip |
二:分析172.16.10.10/24與172.16.10.11/24處於同一網絡(如果不是同一網絡,那么下表中目標ip為172.16.10.1,通過arp獲取的是網關的mac)
源mac | 目標mac | 源ip | 目標ip | 數據部分 | |
---|---|---|---|---|---|
發送端主機 | 發送端mac | FF:FF:FF:FF:FF:FF | 172.16.10.10/24 | 172.16.10.11/24 | 數據 |
三:這個包會以廣播的方式在發送端所處的自網內傳輸,所有主機接收后拆開包,發現目標ip為自己的,就響應,返回自己的mac
很容易知道目標主機的ip地址/子網掩碼,通過ip地址/子網掩碼的位運算(邏輯與)就可以判斷通信雙方是否在一個局域網內。
# 相同局域網內的主機通信
知道目標主機的ip地址,通過廣播的方式在局域網發送數據。
發送數據前,通過arp協議可以獲悉對方主機的mac地址。
這個arp協議是局域網內的每個主機ip地址和mac地址映射關系表。
每個主機的ip地址
數據傳輸流程總結1
- <1> 網絡層拿到上層傳過來的數據,將數據打包,加一個ip頭。這個ip頭至少包含兩部分(我的ip和對方主機的ip,ip包含子網掩碼)
- <2> 將打包好ip頭的數據傳給下一層的數據鏈路層前會做一個判斷,判斷對方主機的ip和我自己的ip是不是在一個局域網內。
- <3> 判斷的方式:ip和子網掩碼做一個邏輯與的位運算。計算后的結果相等則表示在一個局域網內,否則對方主機不在當前局域網內。
- <4> 當兩台主機在一個局域網內,此時會自動觸發arp協議執行。通過廣播的方式發一個arp包,就會獲取局域網內的對方主機的mac地址。ARP協議是建立在各個主機之間信任的基礎之上的,收到消息后發現arp包里面是自己的ip就會將mac地址響應給發送arp協議的主機,如果包里面的ip不是自己就將包丟掉。
- <5> 拿到對方主機mac地址后,此時就到了數據鏈路層,將網絡層傳過來的數據整體打包,加一個以太網的頭。這個頭主要包含兩個數據,自己的mac地址和對方主機的mac地址。通過廣播的方式將數據發出去。
- <6> 然后經過物理層將數據轉為二進制,通過網線傳輸出去,此時就會經過二層交換機,二層交換機可以將數據包解開到數據鏈路層,發現里面對方主機的mac地址,然后就知道將數據包交給哪台主機了(mac地址記憶功能,不需要再廣播)。
- <7> 回到第3步,如果計算后發現兩台主機不在一個局域網內,此時也會自動觸發arp協議的執行,通過arp協議的數據包將獲取當前局域網網關的mac地址。
- <8> 數據下交給數據鏈路層,打上一個以太網的頭,分別是自己的mac地址和當前局域網網關的mac地址。內層ip包里面的頭是自己的ip地址和對方主機的ip地址。
- <9> 上面封裝好以太網頭的數據交給物理層轉二進制,再經過二層交換機,再經過網關交到公網的路由系統。路由相當於一個三層交換機,可以解壓到網絡層,發現里面對方主機的ip地址。
- <10> 路由根據對方主機的ip地址可以映射找到一個子網(另一個局域網),將數據交給對方子網的網關。對方的網關自動觸發arp協議根據對方主機的ip地址找到是哪個mac地址的主機,最終將數據交到對方主機。
- <11> 此時,對方局域網的網關通過路由的mac地址和網關的映射關系就知道了發數據過來的子網網關的mac地址,對方主機也知道了發數據過來的主機的ip地址。這就分別實現了數據鏈路層的交流通信和網絡層的交流通信。
補充:
補充1:arp協議只在一個局域網內通過ip解析獲取mac地址,不會跨局域網根據ip地址獲取主機mac地址。
補充2:局域網內每個主機的ip地址各不相同,這才實現了arp協議根據ip地址解析成mac地址的可能。
補充3:ip地址本質是網絡地址加主機地址。通過ip地址可以唯一確定一個機器,因為局域網內每個主機的mac地址不同就會分配不同的ip地址。
傳輸層
傳輸層的由來:網絡層的ip幫我們區分子網,以太網層的mac幫我們找到主機。但是我們寫網絡通信軟件最主要的是找到目標計算機上的某個軟件,上面的mac+ip還不能實現這個需求。這就需要再提出一個端口的概念。端口即應用程序與網卡關聯的編號。
傳輸層功能:建立端口到端口的通信
補充:端口范圍0-65535,0-1023為系統占用端口
客戶端軟件的端口號是由操作系統動態分配的。一個機器上的端口號不能沖突。
服務端軟件的端口號是綁定的,不能變的。
傳輸層遵循的協議有兩個:TCP協議和UDP協議,基於端口工作
mac + ip 標識唯一一個主機
ip + port 標識唯一一台主機上的一個基於網絡通信的軟件
tcp頭里面放的是源端口和目標端口,udp頭也一樣。
# tcp協議
可靠傳輸,TCP數據包沒有長度限制,理論上可以無限長,但是為了保證網絡的效率,通常TCP數據包的長度不會超過IP數據包的長度,以確保單個TCP數據包不必再分割。
# 至此:數據包裝結果
以太網頭 --> ip頭 --> tcp頭 --> 數據
# udp協議
不可靠傳輸,”報頭”部分一共只有8個字節,總長度不超過65,535字節,正好放進一個IP數據包。
# 至此:數據包裝結果
以太網頭 --> ip頭 --> udp頭 --> 數據
TCP協議
tcp協議又稱好人協議,只要收到請求,就會發出一個確認信息。這也是從安全性的角度出發產生的一個'漏洞'。
tcp報文
tcp協議又稱可靠協議:tcp的請求確認機制是保證數據安全的原因,但這是一犧牲數據傳輸效率為代價的。
三次握手
<1> 客戶端作為主動方,首先向服務端發一個建立鏈接的請求。
<2> 服務端接收到請求后,回復同意。
<3> 然后服務端也要向客戶端發一個請求建立鏈接。
<4> 客戶端收到請求后,回復同意
<2>和<3>是兩個連續從服務端發出的消息,可以合並從一個回復並請求。整個過程就是三次握手建立TCP連接
握手流程分析:
- <1> 起初,TCP客戶端A和TCP服務端B都處於關閉狀態(CLOSED)。注意:A主動打開連接,B被動打開鏈接。
- <2> 服務端B先啟動,准備接收客戶端的連接請求,然后服務端就進入監聽狀態(LISTEN),等待客戶端的連接請求。
- <3> 客戶端A啟動,向B發出連接請求報文段,此時A進入SYN-SENT狀態。
- <4> B收到連接請求后,如同意建立連接,則向A發送確認。同時也發送一個報文請求段,注意此時服務端不能攜帶數據。 服務端進入SYN-RCVD狀態。
- <5> 客戶端A收到B的確認后,還要向B給出確認。TCP規定此時報文段可以攜帶數據。但如果不攜帶數據時不會消耗一個序 號,在這種情況下,下一個數據報文段的序號仍是seq=x+1。這時,TCP連接已經建立,A進入ESTABLISHED狀態。
- <6> 等B收到A的確認后,也進入ESTABLISHED狀態。
# 上面給出的建立連接的過程叫做三次握手(three-way handshake)。
# 客戶端A最后一次還要再發送一次確認是有必要的,這主要是為了防止已失效的連接請求報文段突然又傳送到了B,因而產生錯誤。
# 正常情況下:
服務端會大多數時間處在LISTEN狀態,有正常客戶端進來時,會瞬間經歷SYN-RCVD狀態快速到ESTABLISHED,等數據發送結束后又進入LISTEN狀態。
客戶端在SYN-SENT狀態的時間非常短,多數處於入ESTABLISHED狀態,斷開與服務端連接后不再是ESTABLISHED狀態。
# 非正常客戶端:SYN-洪水攻擊,模擬大量假的客戶端向服務端發請求,占用服務端的資源,正常的客戶端就進不去。
服務端大量處於:SYN-RCVD狀態可能處於洪水攻擊,也可能處於大並發狀態。
當觸發洪水攻擊時,服務端也不會一直處於SYN-RCVD狀態,但會浪費大量的時間在此處。
補充:SYN-洪水攻擊
非法分子模擬大量假的客戶端給服務端發一個消息就跑了,然后服務端浪費大量時間在SYN-RCVD等待狀態,嚴重占用正常客戶端的訪問。
補充:半連接池
tcp協議有一個半連接池的概念,又稱backlog。它的本質是一個隊列,隊列的大小一般為5-10個
它的目的是為了讓服務端起到緩沖的作用。當客戶端的請求過多時,請求先到半連接池等待服務端的挨個處理。
一邊處理請求,一般新的請求再依次進入半連接池。
半連接池無法解決SYN-洪水攻擊。
數據傳輸(來自掘金網:https://juejin.im/post/5cb93204f265da039955d770#heading-2)
-
客戶端喊了一句話(data),接收方聽見了之后要回復自己聽見了(ack)。如果喊了一句,半天沒聽到對方回復,就認為自己的話被大風吹走了,沒聽見,所以需要重新喊話,這就是tcp重傳。也有可能是服務端聽到了客戶端的話,但是Server向Client的回復被大風吹走了,以至於Client沒聽見Server的回復。Client並不能判斷究竟是自己的話被大風吹走了還是Server的回復被大風吹走了,Client也不用管,重傳一下就是。
-
Client可以向Server喊話,同樣Server也可以向Client喊話,因為tcp鏈接是「雙工的」,雙方都可以主動發起數據傳輸。不過無論是哪方喊話,都需要收到對方的確認才能認為對方收到了自己的喊話。
-
Client可能是個高射炮,一說連說了八句話,這時候Server可以不用一句一句回復,而是連續聽了這八句話之后,一起向對方回復說前面你說的八句話我都聽見了,這就是批量ack。但是Client也不能一次性說了太多話,Server的腦子短時間可能無法消化太多,兩人之間需要有協商好的合適的發送和接受速率,這個就是「TCP窗口大小」。
四次揮手
揮手流程分析:
- 數據傳輸后,通信的雙方都可以主動釋放連接。現在A和B都處於ESTABLISHED狀態。
- <1> A停止發送數據,主動關閉TCP連接。這是A進入終止狀態1狀態(FIN-WAIT-1),等待B的確認。注意,TCP規定FIN報文即 使不攜帶數據,也要消耗一個序號。即此時的u是上一次字節序號加1。
- <2> B收到連接釋放報文段后即發出確認。然后B進入關閉等待狀態(CLOSE-WAIT)。這時TCP連接處於半關閉狀態(half-close),即A已經沒有數據要發了,但若B發送數據,A仍要接收。也就是說從B到A這個方向的連接沒有關閉,這個狀態要持續到B給A發送完所有數據后。
- <3> A收到來自B的確認后,進入終止等待2狀態(FIN-WAIT-2),等待B發出連接釋放報文段。
- <4> 若B發完數據,就會發釋放連接FIN報文段。B還必須重復上次發過的確認好ack=u+1。這時B進入最后確認狀態(LAST-ACK),等待A的確認。
- <5> A收到B的連接釋放報文段后,必須對此發出確認。然后進入時間等待狀態(TIME-WAIT)。
- <6> B收到A的確認信息后,按照步驟進入關閉狀態(CLOSED)。
- <7> 注意, 此時TCP連接還沒有釋放掉。A必須經過時間等待計時器(TIME-WAIT timer)設置的時間2MSL后, A才進入CLOSED狀態。
# 補充,A必須在TIME-WAIT狀態下等待2MSL。目的有兩個:
- 第一是保證A先進入CLOSED狀態;
- 第二是為了防止已失效的連接請求報文段突然又傳送到了B,因而產生錯誤。
# B只要收到了A發出來的確認,就進入CLOSED狀態。A必須等待2MSL。這就表明,B結束TCP連接的時間要比A早一些,這是提前結束連接的代價。
# 現實中,一般服務器要處理多個客戶端用戶,所以服務端一般處理完一個客戶端的請求就會主動終止TCP連接,服務端多事4次揮手的發起者。
# 當服務端大量處於TIME-WAIT狀態,意味着服務端正在經歷高並發。
UDP協議
udp協議特點:
- UDP是無連接的,即發數據之前不需要建立連接,同理發送數據結束也沒有連接可釋放,這極大減少了開銷和發送數據之前的時延。
- UDP不保證數據的可靠交付,只負責將數據盡可能快的發出去。
應用層
應用層由來:用戶使用的都是應用程序,均工作於應用層,互聯網是開發的,大家都可以開發自己的應用程序,數據多種多樣,必須規定好數據的組織形式 。
應用層功能:規定應用程序的數據格式。
例:TCP協議可以為各種各樣的程序傳遞數據,比如Email、WWW、FTP等等。那么,必須有不同協議規定電子郵件、網頁、FTP數據的格式,這些應用程序協議就構成了”應用層”。應用層也可以自定義協議。
可以自定義協議 ---> 頭部 + 數據部分
自定義協議需要注意的問題:
1、兩大組成部分 = 頭部 + 數據部分
頭部:放對數據的描述信息。比如:數據要發給誰,數據的類型,數據的長度
數據部分:想要發的數據
2、頭部的長度必須固定
因為接收端要通過頭部獲取所接接收數據的詳細信息
我們知道兩個進程如果需要進行通訊最基本的一個前提能能夠唯一的標示一個進程,在本地進程通訊中我們可以使用PID來唯一標示一個進程,但PID只在本地唯一,網絡中的兩個進程PID沖突幾率很大,這時候我們需要另辟它徑了,我們知道IP層的ip地址可以唯一標示主機,而TCP層協議和端口號可以唯一標示主機的一個進程,這樣我們可以利用ip地址+協議+端口號唯一標示網絡中的一個進程。
能夠唯一標示網絡中的進程后,它們就可以利用socket進行通信了,什么是socket呢?我們經常把socket翻譯為套接字,socket是在應用層和傳輸層之間的一個抽象層,它把TCP/IP層復雜的操作抽象為幾個簡單的接口供應用層調用已實現進程在網絡中通信。
socket起源於UNIX,在Unix一切皆文件哲學的思想下,socket是一種"打開—讀/寫—關閉"模式的實現,服務器和客戶端各自維護一個"文件",在建立連接打開后,可以向自己文件寫入內容供對方讀取或者讀取對方內容,通訊結束時關閉文件。
總結
每層都有自己的協議
網絡通信實現
想實現網絡通信,每台主機需具備四要素:
- 本機的IP地址
- 子網掩碼
- 網關的IP地址
- DNS的IP地址
獲取這四要素分兩種方式:
-
靜態獲取:即手動配置
-
動態獲取:通過dhcp協議動態獲取相關ip參數。dhcp采用udp協議交互。
# dhcp數據包的格式 以太網頭 --> ip頭 --> udp頭 --> dhcp數據包 # 每個頭的內容 <1> 最前面的”以太網標頭”,設置發出方(本機)的MAC地址和接收方(DHCP服務器)的MAC地址。 前者就是本機網卡的MAC地址,后者這時不知道,就填入一個廣播地址:FF-FF-FF-FF-FF-FF。 <2> 后面的”IP標頭”,設置發出方的IP地址和接收方的IP地址。這時,對於這兩者,本機都不知道。 於是,發出方的IP地址就設為0.0.0.0,接收方的IP地址設為255.255.255.255。 <3> 最后的”UDP標頭”,設置發出方的端口和接收方的端口。 這一部分是DHCP協議規定好的,發出方是68端口,接收方是67端口。過程分析
dhcp動態獲取主機相關ip參數的過程分析:
- 這個數據包構造完成后,就可以發出了。以太網是廣播發送,同一個子網絡的每台計算機都收到了這個包。
- 因為接收方的MAC地址是FF-FF-FF-FF-FF-FF,看不出是發給誰的,所以每台收到這個包的計算機,還必須分析這個包的IP地址,才能確定是不是發給自己的。當看到發出方IP地址是0.0.0.0,接收方是255.255.255.255,於是DHCP服務器知道”這個包是發給我的”,而其他計算機就可以丟棄這個包。
- DHCP服務器讀出這個包的數據內容,分配好IP地址,發送回去一個”DHCP響應”數據包。
- 這個響應包的結構也是類似的,以太網標頭的MAC地址是雙方的網卡地址,IP標頭的IP地址是DHCP服務器的IP地址(發出方)和255.255.255.255(接收方),UDP標頭的端口是67(發出方)和68(接收方),分配給請求端的IP地址和本網絡的具體參數則包含在Data部分。
- 新加入的計算機收到這個響應包,於是就知道了自己的IP地址、子網掩碼、網關地址、DNS服務器等等參數
DNS協議
DNS是域名解析服務器。也可以是域名解析系統,是用來綁定ip和域名的關系,它基於udp協議。
# 不管是BS架構還是CS架構的互聯網通信軟件都是基於IP地址+端口工作的。
# 對於BS架構,從方便使用者的角度出發(不需要用戶記住復雜無趣的ip,引入的域名的概念)。於是BS軟件就需要DNS域名解析過程。
# 基於CS架構的軟件不需要DNS。
13台根dns:
A.root-servers.net198.41.0.4美國
B.root-servers.net192.228.79.201美國(另支持IPv6)
C.root-servers.net192.33.4.12法國
D.root-servers.net128.8.10.90美國
E.root-servers.net192.203.230.10美國
F.root-servers.net192.5.5.241美國(另支持IPv6)
G.root-servers.net192.112.36.4美國
H.root-servers.net128.63.2.53美國(另支持IPv6)
I.root-servers.net192.36.148.17瑞典
J.root-servers.net192.58.128.30美國
K.root-servers.net193.0.14.129英國(另支持IPv6)
L.root-servers.net198.32.64.12美國
M.root-servers.net202.12.27.33日本(另支持IPv6)
域名定義:http://jingyan.baidu.com/article/1974b289a649daf4b1f774cb.html
頂級域名:以.com,.net,.org,.cn等等屬於國際頂級域名,根據目前的國際互聯網域名體系,國際頂級域名分為兩類:類別頂級域名(gTLD)和地理頂級域名(ccTLD)兩種。類別頂級域名是 以"COM"、"NET"、"ORG"、"BIZ"、"INFO"等結尾的域名,均由國外公司負責管理。地理頂級域名是以國家或地區代碼為結尾的域名,如"CN"代表中國,"UK"代表英國。地理頂級域名一般由各個國家或地區負責管理。
二級域名:二級域名是以頂級域名為基礎的地理域名,比喻中國的二級域有,.com.cn,.net.cn,.org.cn,.gd.cn等.子域名是其父域名的子域名,比喻父域名是abc.com,子域名就是www.abc.com或者*.abc.com.
一般來說,二級域名是域名的一條記錄,比如alidiedie.com是一個域名,www.alidiedie.com是其中比較常用的記錄,一般默認是用這個,但是類似*.alidiedie.com的域名全部稱作是alidiedie.com的二級
網絡通信流程
1.本機獲取
- 本機的IP地址:192.168.1.100
- 子網掩碼:255.255.255.0
- 網關的IP地址:192.168.1.1
- DNS的IP地址:8.8.8.8
2.打開瀏覽器,想要訪問Google,在地址欄輸入了網址:www.google.com。
3.dns協議(基於udp協議)
4.HTTP部分的內容,類似於下面這樣。我們假定這個部分的長度為4960字節,它會被嵌在TCP數據包之中。
GET / HTTP/1.1
Host: www.google.com
Connection: keep-alive
User-Agent: Mozilla/5.0 (Windows NT 6.1) ……
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3
Cookie: … …
5.TCP協議
TCP數據包需要設置端口,接收方(Google)的HTTP端口默認是80,發送方(本機)的端口是一個隨機生成的1024-65535之間的整數,假定為51775。TCP數據包的標頭長度為20字節,加上嵌入HTTP的數據包,總長度變為4980字節。
6.IP協議
然后,TCP數據包再嵌入IP數據包。IP數據包需要設置雙方的IP地址,這是已知的,發送方是192.168.1.100(本機),接收方是172.194.72.105(Google)。IP數據包的標頭長度為20字節,加上嵌入的TCP數據包,總長度變為5000字節。
7.以太網協議
最后,IP數據包嵌入以太網數據包。以太網數據包需要設置雙方的MAC地址,發送方為本機的網卡MAC地址,接收方為網關192.168.1.1的MAC地址(通過ARP協議得到)。以太網數據包的數據部分,最大長度為1500字節,而現在的IP數據包長度為5000字節。因此,IP數據包必須分割成四個包。因為每個包都有自己的IP標頭(20字節),所以四個包的IP數據包的長度分別為1500、1500、1500、560。
8.服務器端響應
經過多個網關的轉發,Google的服務器172.194.72.105,收到了這四個以太網數據包。根據IP標頭的序號,Google將四個包拼起來,取出完整的TCP數據包,然后讀出里面的”HTTP請求”,接着做出”HTTP響應”,再用TCP協議發回來。
本機收到HTTP響應以后,就可以將網頁顯示出來,完成一次網絡通信。
網絡通信流程總結2
基於網絡通信的軟件有兩種:BS架構、CS架構。不同之處在於BS架構沒有客戶端軟件,它依賴瀏覽器(特殊的客戶端)。
在網絡通信流程方面的不同之處在於,BS架構的軟件在客戶端(瀏覽器網址輸入欄)多一個DNS域名解析過程。
在瀏覽器的網址輸入欄上輸入一個網址,按回車鍵到獲取頁面響應信息發生了:
<1> 本機的DNS域名解析系統啟動,獲取域名對應的ip地址交給瀏覽器。
<2> TCP/IP封包過程,主要將瀏覽器輸入欄中的虛擬路徑和其他信息作為基本數據依次打包。
<3> 通過網絡傳輸到對方主機,依次解包,對方主機應用層軟件獲取這個虛擬路徑對應的資源,原路返回響應給客戶端。
<4> 本地主機接收到響應信息,依次解包,獲取請求的資源。
<5> 至此完成一次網絡通信交流流程。
客戶端的數據包裝結構:
比如我們訪問百度:https://www.cnblogs.com/the3times/p/12715643.html
- 首先DNS協議啟動工作,獲取域名對應的ip
- 應用層將數據the3times/p/12715643.html打包一個https協議的協議頭,將這個包交給傳輸層。
- 傳輸層基於TCP協議,將應用層下交的數據再打包一個tcp頭,這個頭包含自己瀏覽器的端口和對方主機的端口。再將數據交給網絡層。
- 網絡層拿到數據后,再打包一個ip頭,包含自己主機的ip和對方主機的ip。將包裹下交給數據鏈路層。
- 數據鏈路層拿到數據后,發現兩個ip地址的網絡地址不同,判斷是外網的ip,就會在整個包裹上再打包一個以太網頭。這個以太網頭主要是自己主機的mac地址和當前局域網網關的mac地址。
- 物理層拿到數據后,轉為二進制01數據,通過網絡傳輸送到對方局域網的網關(這中間經過交互機、路由系統等),根據ip地址找到主機(arp協議),再根據端口號找到軟件,再根據url路徑找到資源。
- 然后對方主機返回響應數據,按原路返回資源。我方接受到響應資源后就完成了一次網絡通信。