掀開斷點續傳那一層面紗(下載篇)


1、簡介

  這一篇文章主要介紹的是http協議下載時的斷點續傳,詳細到各個步驟。主要步驟有:DNS查找、TCP三次握手、http請求發送、TCP協議數據傳輸、暫停后的狀態、繼續下載、TCP三次握手、http請求發送、數據傳輸、。。。、下載成功發送http響應信息、TCP四次握手斷開連接。

2、原理知識

  2.1、問答問答

  問:什么是斷點續傳?斷點續傳的原理是什么?

  答:斷點續傳就是信號中斷后(掉線或關機等),下次能夠從上次的地方接着傳送(一般指下載或上傳),不支持斷點續傳就意味着下次下載或上傳必須從零開始。http協議中的斷點續傳是基於Http頭Range以及Content-Range。HTTP頭中一般斷點下載時才用到Range和Content-Range實體頭,Range用戶請求頭中,指定第一個字節的位置和最后一個字節的位置,如( Range:200-300或者Range:200- );Content-Range用於響應頭。通俗的來講就是文件大小為10,這次下載了3,被中斷了,下次繼續下載時則將指針移到3位置,從3開始下載,最終將整個文件下載下來。

  2.2、簡單http下載文件

  請求下載整個文件: 
  GET /test.rar HTTP/1.1 
  Connection: close 
  Host: 192.168.95.11
  Range: bytes=0-801 //一般請求下載整個文件是bytes=0- 或不用這個頭
  一般正常回應 :
  HTTP/1.1 200 OK 
  Content-Length: 801      
  Content-Type: application/octet-stream 
  Content-Range: bytes 0-800/801 //801:文件總大小

  2.3、重要的幾個頭

  響應頭:

  Content-type:Content-type 告訴瀏覽器文件的MIME 類型,這是非常重要的一個響應頭了,MIME種類繁多。很可能會在程序中漏掉一些MIME類型,表示全部為 content-type:application/octet-stream(字節流)

  Content-Disposition:是 MIME 協議的擴展,MIME 協議指示 MIME 用戶代理如何顯示附加的文件。當 Internet Explorer 接收到頭時,它會激活文件下載對話框,它的文件名框自動填充了頭中指定的文件名。 嗯,就是這個頭喲,激活彈出提示下載框,一般這樣寫content-disposition:attachment; filename=name

   Content-Length:" Content-Length: 321" 就是告訴瀏覽器這個文件的大小是321字節,其實我發現好像不設置這個頭,瀏覽器也能自己識別
   Pragma Cache-control:把這2個頭都設置成public 告訴瀏覽器緩存,我一般設置 cache-control:public

  Content-Range:字段說明服務器返回了文件的某個范圍及文件的總長度。這時Content-Length字段就不是整個文件的大小了,而是對應文件這個范圍的字節數,這一點一定要注意。一般格式,Content-Range: bytes 500-999/1000

  響應頭: 

  Range:可以請求實體的一個或者多個子范圍。

  例如:
  表示頭500個字節:bytes=0-499
  表示第二個500字節:bytes=500-999
  表示最后500個字節:bytes=-500
  表示500字節以后的范圍:bytes=500-  【下載斷點續傳(一般range格式為500-)】
  第一個和最后一個字節:bytes=0-0,-1
  同時指定幾個范圍:bytes=500-600,601-999
  但是服務器可以忽略此請求頭,如果無條件GET包含Range請求頭,響應會以狀態碼206(PartialContent)返回而不是以200(OK)。【206表示服務器已經完成get的部分請求,即表示斷點續傳】

3、支持斷點續傳的文件下載類

類中含有注釋,這里不再多解釋了

FileDownload.class.php

  1 <?PHP
  2 #文件下載(支持斷點續傳)
  3 class FileDownload
  4 {
  5     #下載速度
  6     private $_speed = 512;
  7 
  8     /**
  9     * @desc 下載文件
 10     *  
 11     * @param $file string 下載的文件路徑
 12     * @param $name string 保存文件時的文件名,不寫則最終下載文件默認為原文件名
 13     * @param $reload bool 是否使用斷點續傳方式下載
 14     */
 15     public function download($file, $name='', $reload=false)
 16     {
 17         if(file_exists($file))  #判斷文件是否存在
 18         {
 19             if($name == '')     #判斷命名參數是否存在
 20             {
 21                 $name = basename($file);    #采用原文件名進行存儲
 22             }
 23             $fHandle = fopen($file, 'rb');   #只讀方式打開;為移植性考慮,使用b標記打開文件(不同系統有不同換行符)
 24             $fileSize = filesize($file);    #文件大小
 25             $ranges = $this->getRange($fileSize);  #斷點續傳時,先查看下載的區間范圍
 26             header('cache-control:public');         #可以被任何緩存所緩存
 27             header('content-type:application/octet-stream');  #告訴瀏覽器響應的對象的類型(字節流、瀏覽器默認使用下載方式處理)
 28             header('content-disposition:attachment; filename='.$name); #不打開此文件,刺激瀏覽器彈出下載窗口
 29             #判斷是否使用續傳方式進行下載
 30             #且請求頭ranges不能為null(為null表示第一次請求下載)
 31             if($reload && $ranges!=null)
 32             {
 33                 header('HTTP/1.1 206 Partial Content');     #發送自定義報文 206續傳狀態碼
 34                 header('Accept-Ranges:bytes');              #表明服務器支持Range請求,所支持的單位是字節
 35                 # 剩余長度 
 36                 header(sprintf('content-length:%u',$ranges['end']-$ranges['start'])); 
 37                 # range信息 
 38                 header(sprintf('content-range:bytes %s-%s/%s', $ranges['start'], $ranges['end'], $fileSize));  
 39                 # fHandle指針跳到斷點位置 
 40                 fseek($fHandle, sprintf('%u', $ranges['start'])); 
 41             }
 42             else
 43             {
 44                 header('HTTP/1.1 200 OK'); 
 45                 header('content-length:'.$fileSize);
 46             }
 47             while(!feof($fHandle))
 48             { 
 49                 echo fread($fHandle, round($this->_speed*1024,0)); 
 50                 ob_flush();    #把數據從PHP的緩沖中釋放出來
 51                 //sleep(2); // 用於測試,減慢下載速度 
 52             } 
 53             ($fHandle!=null) && fclose($fHandle);
 54         }
 55         else
 56         {
 57             #沒文件
 58             header("HTTP/1.1 404 Not Found");
 59             return false;
 60         }
 61     }
 62 
 63     /**
 64     * @desc 獲取請求頭部range信息
 65     *
 66     * @param $fileSize int 該文件的大小
 67     *
 68     * @return array|null 返回range信息或者null
 69     */
 70     public function getRange($fileSize)
 71     {
 72         if(isset($_SERVER['HTTP_RANGE']) && !empty($_SERVER['HTTP_RANGE']))
 73         {
 74             #請求頭部range信息  Range: bytes=41078-\r\n
 75             $range = $_SERVER['HTTP_RANGE']; 
 76             $range = preg_replace('/[\s|,].*/', '', $range); 
 77             $range = explode('-', substr($range, 6));       #只需將41078-進行分割變成數組
 78             #斷點續傳頭部range信息都是為 4444- 這種形式 ,因此切割后形成的數組就只有兩個元素
 79             $range = array_combine(array('start','end'), $range); 
 80             if(empty($range['start']))
 81             { 
 82                 $range['start'] = 0; 
 83             } 
 84             if(empty($range['end']))
 85             { 
 86                 $range['end'] = $fileSize; 
 87             } 
 88             return $range; 
 89         }
 90         return null;    #第一次請求沒有range信息
 91     }
 92 
 93     /**
 94     * @desc 設置文件下載速度
 95     *
 96     * @param $speed int 下載速度
 97     */
 98     public function setSpeed($speed)
 99     { 
100         if(is_numeric($speed) && $speed>16 && $speed<4096)
101         { 
102             $this->_speed = $speed; 
103         } 
104     } 
105 
106 }
107 
108 ?>

4、測試並分析其中的步驟

  4.1、前提准備工作

  • 將上面類文件中第六行下載速度更改為10
  • 去掉上面類文件第51行的注釋,使它有延遲
  • 使用火狐瀏覽器進行下載測試
  • 使用Wireshark抓包工具進行抓包分析
  • test.php文件
1 <?php
2 include 'FileDownload.class.php';
3 $a=new FileDownload();
4 #不支持斷點續傳
5 #$b=$a->download('./aa.txt','bb.txt');  
6 #支持斷點續傳
7 #$b=$a->download('./aa.txt','bb.txt',1);    
8 ?>

  開始測試:

  4.2、測試支持斷點續傳下載

  執行步驟:

  1、打開抓包工具進行監控

  2、用火狐瀏覽器進行訪問,Enter下載

  

  3、確認下載

  4、中途暫停兩次,最后下載成功

成功下載!

  分析抓包:

  1、首先Enter,第一步當然是進行DNS查找啦。這里就不展開講了,可以參考這里的內容http://www.cnblogs.com/phpstudy2015-6/p/6810130.html#_label18

  2、拿到域名對應的IP后,瀏覽器向服務器80端口發起TCP的連接請求,請看下面的抓包圖-1,一到三行尾TCP連接,即TCP三次握手。具體可以參考我寫的這篇文章http://www.cnblogs.com/phpstudy2015-6/p/6810130.html#_label2

 抓包圖-1

  3、TCP連接后,瀏覽器發起一個HTTP請求,即抓包圖-1中的第4行。下圖是該http GET請求。第一次請求不存在信息頭range

http請求圖 

  4、http請求后,開始TCP數據傳輸,請看上面的抓包圖-1,第5行后就開始有順序的進行tcp層數據傳輸(192.168.95.11Web主機連續發送兩次數據給192.168.95.10瀏覽器;瀏覽器接收並回應一次Web主機,告訴Web主機已經收到數據並且完整無誤,可以繼續傳輸!)

  5、此時暫停下載,。請看下面的抓包圖-2,第72行的時候,暫停下載(即斷開與Web服務器的連接)。因為這是突然斷開的,Web主機並不知道瀏覽器已經斷開了,所以還一直發送數據給瀏覽器(73~76),但是Web服務器沒有收到瀏覽器的回應,最后它也不發數據,大家分手了。

  這個請求最后是沒有收到Web服務器的http響應信息的。按照原本的請求是下載完整個文件后,Web才發送http響應消息的,但是瀏覽器突然單方面斷開,此時數據都沒傳送完,怎么會給你相應消息呢!

抓包圖-2

  6、繼續下載。請看下圖的抓包圖-3。

  點擊繼續下載時,即再從新發送一個http請求給服務器。

  第77~79行是TCP連接(三次握手)

  第80行為發送http請求信息

  請看下面的http請求信息,這一次含有請求頭Range,這是Web重要機制。在暫停下載的時候,瀏覽器會記住已經已經接受的字節數,待繼續下載的時候,在構建http請求信息的時候會增加這一個重要的請求頭信息。這也是支持斷點續傳的一個前提條件。

  瀏覽器攜帶Range頭信息請求Web服務器,此時我們需要在代碼層對這個重要信息進行處理。即取出該字節數出,然后在文件中定位指針,然后讀文件開始續傳。【這是斷點續傳應用中的邏輯關鍵】

抓包圖-3

  7、重復暫停一次,在繼續下載,觀察對比。暫停兩次可以從抓包圖-1中最右邊可以看到兩個紅色的橫線。

  8、最后下載成功啦,此時Web服務器會發送http響應信息給瀏覽器。

  第350行尾響應行

  看下面的http響應圖,響應狀態碼為206

  用紅色線標記的是我們代碼中自定義的響應頭

 抓包圖-4

http響應圖

  9、TCP四次握手,端斷開連接。看上面的抓包圖-4

  第352~354是TCP斷開連接。四次握手為什么是只有三次通訊呢?

  TCP斷開具體也可以參考我之前寫的文章。

  第一次,瀏覽器發送FIN包(表示要斷開)、ACK(確認序列號)。seq=361 

  第二、三次,Web服務器接受到瀏覽器發來的包,並回復FIN包(我也要要斷開)、ACK(確認序列號)。seq=174554、ack=362 【Web將瀏覽器發來的seq=361+1=362,轉變成ack=362發給瀏覽器,表示我已經知道了】【此時瀏覽器並一起發送seq=174554,告訴瀏覽器說我要關閉連接啦】

  第四次,瀏覽器回復Web服務器,ack=174555 【瀏覽器將Web服務器發來的seq=174554+1,轉變換成ack=174555發給Web主機,表示我已經知道了】

   TCP一直說是四次握手斷開,我認為這應該是邏輯上的四次握手,從抓包上來看的話,第二、三次合並為一次通訊了。

  4.3、測試不支持斷點續傳下載

  執行步驟:

  1、打開抓包工具進行監控

  2、用火狐瀏覽器進行訪問,Enter下載

  3、暫停下載

  4、繼續下載。突然不行了,下載失敗!為什么會這樣呢!下面我們來分析分析

  抓包分析:

  1、TCP連接、http get請求無異常

 

  2、從抓包分析在斷開前都無任何異常

  3、繼續下載抓包分析

  TCP連接正常

  http請求信息,看上去是正常的,但是相對於我們所寫的程序就不對勁了。請求信息中含有Range請求頭,他需要的是數據該該Range范圍內的,而我們程序定義的是非斷點續傳,即每次訪問都是重寫下載,因此Web傳輸的數據對不上瀏覽器之前的數據,最終出錯啦!

 5、總結

  從學習OSI網絡模型、TCP/IP網絡模型到深入了解TCP傳輸、http協議、DNS查找、以及http URL訪問具體細節步驟,最后到這個HTTP協議應用--斷點續傳,收獲還是挺豐厚的。 以上是自己對斷點續傳的理解,以及做的相應測試,若有不對的地方,希望大家指出,好讓我改正改正。

 

(以上是自己的一些見解,若有不足或者錯誤的地方請各位指出)

 作者:那一葉隨風   http://www.cnblogs.com/phpstudy2015-6/

 原文地址:http://www.cnblogs.com/phpstudy2015-6/p/6821478.html 

 聲明:本博客文章為原創,只代表本人在工作學習中某一時間內總結的觀點或結論。轉載時請在文章頁面明顯位置給出原文鏈接

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM