php://input, $_POST與$_GET獲取請求輸入的差別


PHP輸入流php://input

在使用xml-rpc的時候,server端獲取client數據,主要是通過php輸入流input,而不是$_POST數組。所以,這里主要探討php輸入流php://input

對於php://input介紹,PHP官方手冊文檔有一段話對它進行了很明確地概述:

“php://input allows you to read raw POST data. It is a less memory intensive alternative to $HTTP_RAW_POST_DATA and does not need any special php.ini directives. php://input is not available with enctype=”multipart/form-data”.

翻譯過來,是這樣:

“php://input可以讀取沒有處理過的POST數據。相較於$HTTP_RAW_POST_DATA而言,它給內存帶來的壓力較小,並且不需要特殊的php.ini設置。php://input不能用於enctype=multipart/form-data”

我們應該怎么去理解這段概述呢?我把它划分為三部分,逐步去理解:

  1. 讀取POST數據
  2. 不能用於multipart/form-data類型
  3. php://input VS $HTTP_RAW_POST_DATA

讀取POST數據

PHPer們一定很熟悉$_POST這個內置變量。$_POST與php://input存在哪些關聯與區別呢?另外,客戶端向服務端交互數據,最常用的方法除了POST之外,還有GET。既然php://input作為PHP輸入流,它能讀取GET數據嗎?這二個問題正是我們這節需要探討的主要內容。

經驗告訴我們,從測試與觀察中總結,會是一個很湊效的方法。這里,我寫了幾個腳本來幫助我們測試。

1 @file 192.168.0.6:/phpinput_server.php 打印出接收到的數據
2 @file 192.168.0.8:/phpinput_post.php 模擬以POST方法提交表單數據
3 @file 192.168.0.8:/phpinput_xmlrpc.php 模擬以POST方法發出xmlrpc請求.
4 @file 192.168.0.8:/phpinput_get.php 模擬以GET方法提交表單表數

phpinput_server.php與phpinput_post.php

1 //@file phpinput_server.php
2 $raw_post_data = file_get_contents('php://input', 'r');
3 echo "-------\$_POST------------------\n";
4 echo var_dump($_POST) . "\n";
5 echo "-------php://input-------------\n";
6 echo $raw_post_data . "\n";
01 //@file phpinput_post.php
02 $http_entity_body = 'n=' . urldecode('perfgeeks') . '&p=' . urldecode('7788');
03 $http_entity_type = 'application/x-www-form-urlencoded';
04 $http_entity_length = strlen($http_entity_body);
05 $host = '192.168.0.6';
06 $port = 80;
07 $path = '/phpinput_server.php';
08 $fp = fsockopen($host, $port, $error_no, $error_desc, 30);
09 if ($fp) {
10   fputs($fp, "POST {$path} HTTP/1.1\r\n");
11   fputs($fp, "Host: {$host}\r\n");
12   fputs($fp, "Content-Type: {$http_entity_type}\r\n");
13   fputs($fp, "Content-Length: {$http_entity_length}\r\n");
14   fputs($fp, "Connection: close\r\n\r\n");
15   fputs($fp, $http_entity_body . "\r\n\r\n");
16   
17   while (!feof($fp)) {
18     $d .= fgets($fp, 4096);
19   }
20   fclose($fp);
21   echo $d;
22 }

我們可以通過使用工具ngrep抓取http請求包(因為我們需要探知的是php://input,所以我們這里只抓取http Request數據包)。我們來執行測試腳本phpinput_post.php

01 @php /phpinput_post.php
02 HTTP/1.1 200 OK
03 Date: Thu, 08 Apr 2010 03:23:36 GMT
04 Server: Apache/2.2.3 (CentOS)
05 X-Powered-By: PHP/5.1.6
06 Content-Length: 160
07 Connection: close
08 Content-Type: text/html; charset=UTF-8
09 -------$_POST------------------
10 array(2) {
11   ["n"]=> string(9) "perfgeeks"
12   ["p"]=> string(4) "7788"
13 }
14 -------php://input-------------
15 n=perfgeeks&p=7788

通過ngrep抓到的http請求包如下:

1 T 192.168.0.8:57846 -> 192.168.0.6:80 [AP]
2   POST /phpinput_server.php HTTP/1.1..
3   Host: 192.168.0.6..Content-Type: application/x-www-form-urlencoded..Co
4   ntent-Length: 18..Connection: close....n=perfgeeks&p=7788....

仔細觀察,我們不難發現:

  1. $_POST數據,php://input 數據與httpd entity body數據是“一致”的。
  2. http請求中的Content-Type是application/x-www-form-urlencoded ,它表示http請求body中的數據是使用http的post方法提交的表單數據,並且進行了urlencode()處理。

(注:注意加粗部分內容,下文不再提示)。

我們再來看看腳本phpinput_xmlrpc.php的原文件內容,它模擬了一個POST方法提交的xml-rpc請求。

01 //@file phpinput_xmlrpc.php
02 $http_entity_body = "\n\n   jt_userinfo\n";
03 $http_entity_type = 'text/html';
04 $http_entity_length = strlen($http_entity_body);
05 $host = '192.168.0.6';
06 $port = 80;
07 $path = '/phpinput_server.php';
08 $fp = fsockopen($host, $port, $error_no, $error_desc, 30);
09 if ($fp) {
10   fputs($fp, "POST {$path} HTTP/1.1\r\n");
11   fputs($fp, "Host: {$host}\r\n");
12   fputs($fp, "Content-Type: {$http_entity_type}\r\n");
13   fputs($fp, "Content-Length: {$http_entity_length}\r\n");
14   fputs($fp, "Connection: close\r\n\r\n");
15   fputs($fp, $http_entity_body . "\r\n\r\n");
16   while (!feof($fp)) {
17     $d .= fgets($fp, 4096);
18   }
19   
20   fclose($fp);
21   echo $d;
22 }

同樣地,讓我們來執行這個測試腳本:

01 @php /phpinput_xmlrcp.php
02 HTTP/1.1 200 OK
03 Date: Thu, 08 Apr 2010 03:47:18 GMT
04 Server: Apache/2.2.3 (CentOS)
05 X-Powered-By: PHP/5.1.6
06 Content-Length: 154
07 Connection: close
08 Content-Type: text/html; charset=UTF-8
09  
10 -------$_POST------------------
11 array(0) {
12 }
13  
14 -------php://input-------------
15 <?xml version="1.0">
16 <methodcall>
17    <name>jt_userinfo</name>
18 </methodcall>

執行這個腳本的時候,我們通過ngrep抓取的http請求數據包如下:

1 T 192.168.0.8:45570 -> 192.168.0.6:80 [AP]
2   POST /phpinput_server.php HTTP/1.1..
3   Host: 192.168.0.6..Content-Type: text/html..Content-Length: 75..Connec
4   tion: close....<?xml version="1.0">.<methodcall>.   <name>jt_userinfo<
5   /name>.</methodcall>....

同樣,我樣也可以很容易地發現:

  1. http請求中的Content-Type是text/xml。它表示http請求中的body數據是xml數據格式。
  2. 服務端$_POST打印出來的是一個空數組,即與http entity body不一致了。這跟上個例子不一樣了,這里的Content-Type是text/xml,而不是application/x-www-form-urlencoded
  3. 而php://input數據還是跟http entity body數據一致。也就是php://input數據和$_POST數據不一致了。

我們再來看看通過GET方法提交表單數據的情況,php://input能不能讀取到GET方法的表單數據?在這里,我們稍加改動一下phpinput_server.php文件,將$_POST改成$_GET。

1 //@file phpinput_server.php
2 $raw_post_data = file_get_contents('php://input', 'r');
3 echo "-------\$_GET------------------\n";
4 echo var_dump($_GET) . "\n";
5 echo "-------php://input-------------\n";
6 echo $raw_post_data . "\n";
01 //@file phpinput_get.php
02 $query_path = 'n=' . urldecode('perfgeeks') . '&p=' . urldecode('7788');
03 $host = '192.168.0.6';
04 $port = 80;
05 $path = '/phpinput_server.php';
06 $d = '';
07 $fp = fsockopen($host, $port, $error_no, $error_desc, 30);
08 if ($fp) {
09   fputs($fp, "GET {$path}?{$query_path} HTTP/1.1\r\n");
10   fputs($fp, "Host: {$host}\r\n");
11   fputs($fp, "Connection: close\r\n\r\n");
12   
13   while (!feof($fp)) {
14     $d .= fgets($fp, 4096);
15   }
16   fclose($fp);
17   echo $d;
18  }

同樣,我們執行下一phpinput_get.php測試腳本,它模擬了一個通常情況下的GET方法提交表單數據。

01 @php /phpinput_get.php
02 HTTP/1.1 200 OK
03 Date: Thu, 08 Apr 2010 07:38:15 GMT
04 Server: Apache/2.2.3 (CentOS)
05 X-Powered-By: PHP/5.1.6
06 Content-Length: 141
07 Connection: close
08 Content-Type: text/html; charset=UTF-8
09  
10 -------$_GET------------------
11 array(2) {
12   ["n"]=>
13   string(9) "perfgeeks"
14   ["p"]=>
15   string(4) "7788"
16 }
17  
18 -------php://input-------------

在這個時候,使用ngrep工具,捕獲的相應的http請求數據包如下:

1 T 192.168.0.8:36775 -> 192.168.0.6:80 [AP]
2   GET /phpinput_server.php?n=perfgeeks&p=7788 HTTP/1.1..
3   Host: 192.168.0.6..Connection: close....

比較POST方法提交的http請求,通常GET方法提交的請求中,entity body為空。同時,不會指定Content-Type和Content-Length。但是,如果強硬數據http entity body,並指明正確地Content-Type和Content-Length,那么php://input還可是讀取得到http entity body數據,但不是$_GET數據。

所根據,上面幾個探測,我們可以作出以下總結:

  1. Content-Type取值為application/x-www-form-urlencoded時,php會將http請求body相應數據會填入到數組$_POST,填入到$_POST數組中的數據是進行urldecode()解析的結果。(其實,除了該Content-Type,還有multipart/form-data表示數據是表單數據,稍后我們介紹)
  2. php://input數據,只要Content-Type不為multipart/form-data(該條件限制稍后會介紹)。那么php://input數據與http entity body部分數據是一致的。該部分相一致的數據的長度由Content-Length指定。
  3. 僅當Content-Type為application/x-www-form-urlencoded且提交方法是POST方法時,$_POST數據與php://input數據才是”一致”(打上引號,表示它們格式不一致,內容一致)的。其它情況,它們都不一致。
  4. php://input讀取不到$_GET數據。是因為$_GET數據作為query_path寫在http請求頭部(header)的PATH字段,而不是寫在http請求的body部分。

這也幫助我們理解了,為什么xml_rpc服務端讀取數據都是通過file_get_contents(‘php://input’, ‘r’)。而不是從$_POST中讀取,正是因為xml_rpc數據規格是xml,它的Content-Type是text/xml。

php://input碰到了multipart/form-data

上傳文件的時候,表單的寫法是這樣的:

1 <form enctype="multipart/form-data" action="phpinput_server.php"method="POST" >
2     <input type="text" name="n"  />
3     <input type="file" name="f" />
4     <input type="submit" value="upload now" />
5 </form>

那么,enctype=multipart/form-data這里的意義,就是將該次http請求頭部(head)中的Content-Type設置為multipart/form-data。請查閱RFC1867對它的描述。multipart/form-data也表示以POST方法提交表單數據,它還伴隨了文件上傳,所以會跟application/x-www-form-urlencoded數據格式不一樣。它會以一更種更合理的,更高效的數據格式傳遞給服務端。我們提交該表單數據,並且打印出響應結果,如下:

1 -------$_POST------------------
2 array(1) { ["n"]=> string(9) "perfgeeks" }
3 -------php://input-------------

同時,我們通過ngrep抓取的相應的http請求數據包如下:

01 ########
02 T 192.168.0.8:3981 -> 192.168.0.6:80 [AP]
03   POST /phpinput_server.php HTTP/1.1..Host: 192.168.0.6..Connection: kee
04   p-alive..User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) A
05   ppleWebKit/533.2 (KHTML, like Gecko) Chrome/5.0.342.3 Safari/533.2..Re
06   ferer: http://192.168.0.6/phpinput_server.php..Content-Length: 306..Ca
07   che-Control: max-age=0..Origin: http://192.168.0.6..Content-Type: mult
08   ipart/form-data; boundary=----WebKitFormBoundarybLQwkp4opIEZn1fA..Acce
09   pt: application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q
10   =0.8,image/png,*/*;q=0.5..Accept-Encoding: gzip,deflate,sdch..Accept-L
11   anguage: zh-CN,zh;q=0.8..Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3..Cook
12   ie: SESS3b0e658f87cf58240de13ab43a399df6=lju6o5bg8u04lv1ojugm2ccic6...
13   .
14 ##
15 T 192.168.0.8:3981 -> 192.168.0.6:80 [AP]
16   ------WebKitFormBoundarybLQwkp4opIEZn1fA..Content-Disposition: form-da
17   ta; name="n"....perfgeeks..------WebKitFormBoundarybLQwkp4opIEZn1fA..C
18   ontent-Disposition: form-data; name="f"; filename="test.txt"..Content-
19   Type: text/plain....i am file..multipart/form-data..------WebKitFormBo
20   undarybLQwkp4opIEZn1fA--..
21 ##

從響應輸出來比對,$_POST數據跟請求提交數據相符,即$_POST = array(‘n’ => ‘perfgeeks’)。這也跟http請求body中的數據相呼應,同時說明PHP把相應的數據填入$_POST全局變量。而php://input輸出為空,沒有輸出任何東西,盡管http請求數據包中body不為空。這表示,當Content-Type為multipart/form-data的時候,即便http請求body中存在數據,php://input也為空,PHP此時,不會把數據填入php://input流。所以,可以確定: php://input不能用於讀取enctype=multipart/form-data數據。

我們再比較這次通過ngrep抓取的http請求數據包,我們會發現,最大不同的一點是Content-Type后面跟了boundary定義了數據的分界符,bounday是隨機生成的。另外一個大不一樣的,就是http entity body中的數據組織結構不一樣了。

上一節,我們概述了,當Content-Type為application/x-www-form-urlencoded時,php://input和$_POST數據是“一致”的,為其它Content-Type的時候,php://input和$_POST數據數據是不一致的。因為只有在Content-Type為application/x-www-form-urlencoded或者為multipart/form-data的時候,PHP才會將http請求數據包中的body相應部分數據填入$_POST全局變量中,其它情況PHP都忽略。而php://input除了在數據類型為multipart/form-data之外為空外,其它情況都可能不為空。通過這一節,我們更加明白了php://input與$_POST的區別與聯系。所以,再次確認,php://input無法讀取enctype=multipart/form-data數據,當php://input遇到它時,永遠為空,即便http entity body有數據。

php://input VS $http_raw_post_data

相信大家對php://input已經有一定深度地了解了。那么$http_raw_post_data是什么呢?$http_raw_post_data是PHP內置的一個全局變量。它用於,PHP在無法識別的Content-Type的情況下,將POST過來的數據原樣地填入變量$http_raw_post_data。它同樣無法讀取Content-Type為multipart/form-data的POST數據。需要設置php.ini中的always_populate_raw_post_data值為On,PHP才會總把POST數據填入變量$http_raw_post_data。

把腳本phpinput_server.php改變一下,可以驗證上述內容:

1 $raw_post_data = file_get_contents('php://input', 'r');
2 $rtn = ($raw_post_data == $HTTP_RAW_POST_DATA) ? 1 : 0;
3 echo $rtn;

執行測試腳本:

1 @php phpinput_post.php
2 @php phpinput_get.php
3 @php phpinput_xmlrpc.php

得出的結果輸出都是一樣的,即都為1,表示php://input和$HTTP_RAW_POST_DATA是相同的。至於對內存的壓力,我們這里就不做細致地測試了。有興趣的,可以通過xhprof進行測試和觀察。

以此,我們這節可以總結如下:

  1. php://input 可以讀取http entity body中指定長度的值,由Content-Length指定長度,不管是POST方式或者GET方法提交過來的數據。但是,一般GET方法提交數據時,http request entity body部分都為空。
  2. php://input 與$HTTP_RAW_POST_DATA讀取的數據是一樣的,都只讀取Content-Type不為multipart/form-data的數據。

小結

  1. Coentent-Type僅在取值為application/x-www-data-urlencoded和multipart/form-data兩種情況下,PHP才會將http請求數據包中相應的數據填入全局變量$_POST
  2. PHP不能識別的Content-Type類型的時候,會將http請求包中相應的數據填入變量$HTTP_RAW_POST_DATA
  3. 只有Coentent-Type不為multipart/form-data的時候,PHP不會將http請求數據包中的相應數據填入php://input,否則其它情況都會。填入的長度,由Coentent-Length指定。
  4. 只有Content-Type為application/x-www-data-urlencoded時,php://input數據才跟$_POST數據相一致。
  5. php://input數據總是跟$HTTP_RAW_POST_DATA相同,但是php://input比$HTTP_RAW_POST_DATA更湊效,且不需要特殊設置php.ini
  6. PHP會將PATH字段的query_path部分,填入全局變量$_GET。通常情況下,GET方法提交的http請求,body為空。

原文:深入剖析PHP輸入流 php://input


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM