*** 此文轉載於:https://blog.csdn.net/WangTaoTao_/article/details/97488206 ***
*** 文章中彩圖源自: https://blog.csdn.net/u011318077 ***
*** 應用配置七層VS時,有些應用訪問異常,了解http通信,方便做排錯 ***
一、了解下HTTP協議
HTTP協議(超文本傳輸協議):是瀏覽器和Web服務器之間進行數據通信的格式,也就是說如果想要實現瀏覽器和Web服務器之間的通信就需要HTTP這個協議。並且HTTP協議是基於TCP協議的,發送數據之前都需要建立連接。
接下來我們來介紹一下瀏覽器訪問Web服務器的通信過程:(重點)
- 首先用戶在瀏覽器的地址欄中輸入網址
- 瀏覽器會通過DNS將輸入的域名解析成IP地址
- 通過IP地址找到服務器並建立連接
- 然后瀏覽器向服務器發送HTTP請求數據
- 服務區收到請求數據后在服務器內部尋找資源
- 找到資源后將HTTP響應數據返回給瀏覽器
二、普及一下URL (統一資源定位符)
URL就是網絡資源的地址,簡稱也就是我們平時所說的網址。通過URL能夠找到網絡中對應的資源數據。
URL的表現形式:
例如:https://www.csdn.com/WangTaoTao_.html
其中https://是協議部分 、www.csdn.com是域名部分 、 /WangTaoTao_.html是資源路徑部分
這里的域名指的就是IP地址的別名,使用域名的原因就是為了方便記住某台主機的IP地址。
三、查看HTTP協議的通信過程
使用谷歌瀏覽器打開www.csdn.com界面,然后按快捷鍵crtl+shift+I / F12或者右擊任意處選擇’檢查’皆可調出開發者工具
開發者工具的效果圖:
開發者工具的標簽選項說明:
Elements(元素標簽):用來查看或者修改HTML中的內容等
Console(控制台):查看錯誤信息,打印調試信息,調試js代碼等
Sources(源代碼):查看靜態資源文件,調試JS代碼等
Network(網絡):查看網頁的http協議通信過程等
開發者工具Network效果圖:
. 注:這里的每項記錄都是請求+響應的一次過程
雙擊進入其中任何一個過程,可以看到這個過程里的請求信息和響應信息。
• Headers選項總共有三部分組成:
- General: 主要信息
- Response Headers: 響應頭
- Request Headers: 請求頭
• Response選項是查看響應體信息的
響應體中存放的主要是服務器返回給瀏覽器的數據
四、HTTP的請求報文
HTTP最常見的請求報文有兩種:
GET方式的請求報文(獲取Web服務器的數據)
POST方式的請求報文(向Web服務器提交數據)
HTTP GET請求報文效果圖:
GET請求報文的說明:
—請求行—
GET / HTTP/1.1 # GET 請求方式 請求資源路徑 HTTP協議版本
—請求頭—
Host: www.csdn.net # Web服務器的主機地址和端口號,這里端口號沒寫,默認是80
Connection: keep-alive #與服務器保持長連接 close 代表保持短連接
Cache-Control: max-age=0 # 緩存控制
Upgrade-Insecure-Requests: 1 #使用https請求
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36 #用戶代理,就是客戶端信息
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8,application/signed-exchange;v=b3 #可以接受的數據類型
Accept-Encoding: gzip, deflate, br #可以接受的壓縮格式
Accept-Language: zh-CN,zh;q=0.9 # 可以接受的語言 zh-CN簡體中文 q=0.9代表優先級
Cookie: uuid_tt_dd=10_20345828700-1562254029050-135310;UserName=WangTaoTao_。。。; #登錄用戶的身份標識
—空行—
注:GET方式一般沒有請求體,每一行后面都有一個\r\n換行字符,只是瀏覽器中看不到
HTTP POST請求報文效果圖:
POST方式下是有請求體的
POST請求報文的說明:
---- 請求行 ----
POST /xmweb?host=mail.wtt.cn&_t=1542884567319 HTTP/1.1 # POST請求方式 請求資源路徑 HTTP協議版本
---- 請求頭 ----
Host: mail.wtt.cn # 服務器的主機地址和端口號,默認是80
Connection: keep-alive # 和服務端保持長連接
Content-Type: application/x-www-form-urlencoded # 告訴服務端請求的數據類型
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 # 客戶端的名稱
---- 空行 ----
---- 請求體 ----
username=hello&pass=hello # 請求參數
#注:POST方式請求體,每一行后面也都有一個\r\n換行字符,只是瀏覽器中看不到
總結一下請求報文:
一個HTTP的GET方式請求報文由:請求行、請求頭、空行組成
POST方式的請求報文由:請求行、請求頭、空行和請求體組成
請求行都是由:請求方式、資源路徑、HTTP協議版本組成
五、HTTP的響應報文
1.HTTP響應報文效果圖:
響應報文的說明:
—響應行—
HTTP/1.1 200 OK # 協議版本 狀態碼 狀態說明
—響應頭—
Date: Fri, 26 Jul 2019 15:12:26 GMT # 服務器的響應的時間
Content-Type: text/html; charset=UTF-8 # 發送的內容類型
Transfer-Encoding: chunked # 發送給瀏覽器的內容是不確定的長度,Content-length 表示固定長度
Connection: keep-alive #與客戶端瀏覽器保持長連接
Server: openresty # 服務器的名字
Content-Encoding: gzip # 內容的壓縮格式
—空行—
—響應體—
響應體中的數據在Response中,也就是返回給瀏覽器的數據
注:每項數據的后面也都有\r\n
補充:HTTP狀態碼的介紹
HTTP 狀態碼是用於表示web服務器響應狀態的3位數字代碼。
狀態碼 說明
200 請求成功
307 重定向
400 錯誤的請求,請求地址或者參數有誤
404 請求資源在服務器不存在
500 服務器內部源代碼出現錯誤
5XX 有可能是反爬蟲
總結一下HTTP響應報文:
一個HTTP響應報文是有響應行、響應頭、空行、響應體組成
響應行由HTTP協議版本、狀態碼和狀態描述組成
六、HTTP響應頭信息
應答頭 |
說明 |
Allow |
服務器支持哪些請求方法(如GET、POST等)。 |
Content-Encoding |
文檔的編碼(Encode)方法。只有在解碼之后才可以得到Content-Type頭指定的內容類型。利用gzip壓縮文檔能夠顯著地減少HTML文檔的下載時間。Java的GZIPOutputStream可以很方便地進行gzip壓縮,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet應該通過查看Accept-Encoding頭(即request.getHeader("Accept-Encoding"))檢查瀏覽器是否支持gzip,為支持gzip的瀏覽器返回經gzip壓縮的HTML頁面,為其他瀏覽器返回普通頁面。 |
Content-Length |
表示內容長度。只有當瀏覽器使用持久HTTP連接時才需要這個數據。如果你想要利用持久連接的優勢,可以把輸出文檔寫入 ByteArrayOutputStream,完成后查看其大小,然后把該值放入Content-Length頭,最后通過byteArrayStream.writeTo(response.getOutputStream()發送內容。 |
Content-Type |
表示后面的文檔屬於什么MIME類型。Servlet默認為text/plain,但通常需要顯式地指定為text/html。由於經常要設置Content-Type,因此HttpServletResponse提供了一個專用的方法setContentType。 |
Date |
當前的GMT時間。你可以用setDateHeader來設置這個頭以避免轉換時間格式的麻煩。 |
Expires |
應該在什么時候認為文檔已經過期,從而不再緩存它? |
Last-Modified |
文檔的最后改動時間。客戶可以通過If-Modified-Since請求頭提供一個日期,該請求將被視為一個條件GET,只有改動時間遲於指定時間的文檔才會返回,否則返回一個304(Not Modified)狀態。Last-Modified也可用setDateHeader方法來設置。 |
Location |
表示客戶應當到哪里去提取文檔。Location通常不是直接設置的,而是通過HttpServletResponse的sendRedirect方法,該方法同時設置狀態代碼為302。 |