PHP輸入流php://input
在使用xml-rpc的時候,server端獲取client數據,主要是通過php輸入流input,而不是$_POST數組。所以,這里主要探討php輸入流php://input
對於php://input介紹,PHP官方手冊文檔有一段話對它進行了很明確地概述:
“php://input allows you to read raw POST data. It is a less memory intensive alternative to $HTTP_RAW_POST_DATA and does not need any special php.ini directives. php://input is not available with enctype=”multipart/form-data”.
翻譯過來,是這樣:
“php://input可以讀取沒有處理過的POST數據。相較於$HTTP_RAW_POST_DATA而言,它給內存帶來的壓力較小,並且不需要特殊的php.ini設置。php://input不能用於enctype=multipart/form-data”
我們應該怎么去理解這段概述呢?我把它划分為三部分,逐步去理解:
- 讀取POST數據
- 不能用於multipart/form-data類型
- php://input VS $HTTP_RAW_POST_DATA
讀取POST數據
PHPer們一定很熟悉$_POST這個內置變量。$_POST與php://input存在哪些關聯與區別呢?另外,客戶端向服務端交互數據,最常用的方法除了POST之外,還有GET。既然php://input作為PHP輸入流,它能讀取GET數據嗎?這二個問題正是我們這節需要探討的主要內容。
經驗告訴我們,從測試與觀察中總結,會是一個很湊效的方法。這里,我寫了幾個腳本來幫助我們測試。
1 |
@file 192.168.0.6:/phpinput_server.php 打印出接收到的數據 |
2 |
@file 192.168.0.8:/phpinput_post.php 模擬以POST方法提交表單數據 |
3 |
@file 192.168.0.8:/phpinput_xmlrpc.php 模擬以POST方法發出xmlrpc請求. |
4 |
@file 192.168.0.8:/phpinput_get.php 模擬以GET方法提交表單表數 |
phpinput_server.php與phpinput_post.php
2 |
$raw_post_data = file_get_contents ( 'php://input' , 'r' ); |
3 |
echo "-------\$_POST------------------\n" ; |
4 |
echo var_dump( $_POST ) . "\n" ; |
6 |
echo $raw_post_data . "\n" ; |
02 |
$http_entity_body = 'n=' . urldecode( 'perfgeeks' ) . '&p=' . urldecode( '7788' ); |
03 |
$http_entity_type = 'application/x-www-form-urlencoded' ; |
04 |
$http_entity_length = strlen ( $http_entity_body ); |
05 |
$host = '192.168.0.6' ; |
07 |
$path = '/phpinput_server.php' ; |
08 |
$fp = fsockopen ( $host , $port , $error_no , $error_desc , 30); |
10 |
fputs ( $fp , "POST {$path} HTTP/1.1\r\n" ); |
11 |
fputs ( $fp , "Host: {$host}\r\n" ); |
12 |
fputs ( $fp , "Content-Type: {$http_entity_type}\r\n" ); |
13 |
fputs ( $fp , "Content-Length: {$http_entity_length}\r\n" ); |
14 |
fputs ( $fp , "Connection: close\r\n\r\n" ); |
15 |
fputs ( $fp , $http_entity_body . "\r\n\r\n" ); |
18 |
$d .= fgets ( $fp , 4096); |
我們可以通過使用工具ngrep抓取http請求包(因為我們需要探知的是php://input,所以我們這里只抓取http Request數據包)。我們來執行測試腳本phpinput_post.php
01 |
@php /phpinput_post.php |
03 |
Date : Thu, 08 Apr 2010 03:23:36 GMT |
04 |
Server: Apache/2.2.3 (CentOS) |
05 |
X-Powered-By: PHP/5.1.6 |
08 |
Content-Type: text/html; charset=UTF-8 |
09 |
------- $_POST ------------------ |
11 |
[ "n" ]=> string(9) "perfgeeks" |
12 |
[ "p" ]=> string(4) "7788" |
通過ngrep抓到的http請求包如下:
1 |
T 192.168.0.8:57846 -> 192.168.0.6:80 [AP] |
2 |
POST /phpinput_server.php HTTP/1.1.. |
3 |
Host: 192.168.0.6..Content-Type: application/x-www-form-urlencoded..Co |
4 |
ntent-Length: 18..Connection: close....n=perfgeeks&p=7788.... |
仔細觀察,我們不難發現:
- $_POST數據,php://input 數據與httpd entity body數據是“一致”的。
- http請求中的Content-Type是application/x-www-form-urlencoded ,它表示http請求body中的數據是使用http的post方法提交的表單數據,並且進行了urlencode()處理。
(注:注意加粗部分內容,下文不再提示)。
我們再來看看腳本phpinput_xmlrpc.php的原文件內容,它模擬了一個POST方法提交的xml-rpc請求。
02 |
$http_entity_body = "\n\n jt_userinfo\n" ; |
03 |
$http_entity_type = 'text/html' ; |
04 |
$http_entity_length = strlen ( $http_entity_body ); |
05 |
$host = '192.168.0.6' ; |
07 |
$path = '/phpinput_server.php' ; |
08 |
$fp = fsockopen ( $host , $port , $error_no , $error_desc , 30); |
10 |
fputs ( $fp , "POST {$path} HTTP/1.1\r\n" ); |
11 |
fputs ( $fp , "Host: {$host}\r\n" ); |
12 |
fputs ( $fp , "Content-Type: {$http_entity_type}\r\n" ); |
13 |
fputs ( $fp , "Content-Length: {$http_entity_length}\r\n" ); |
14 |
fputs ( $fp , "Connection: close\r\n\r\n" ); |
15 |
fputs ( $fp , $http_entity_body . "\r\n\r\n" ); |
17 |
$d .= fgets ( $fp , 4096); |
同樣地,讓我們來執行這個測試腳本:
01 |
@php /phpinput_xmlrcp.php |
03 |
Date : Thu, 08 Apr 2010 03:47:18 GMT |
04 |
Server: Apache/2.2.3 (CentOS) |
05 |
X-Powered-By: PHP/5.1.6 |
08 |
Content-Type: text/html; charset=UTF-8 |
10 |
------- $_POST ------------------ |
17 |
<name>jt_userinfo</name> |
執行這個腳本的時候,我們通過ngrep抓取的http請求數據包如下:
1 |
T 192.168.0.8:45570 -> 192.168.0.6:80 [AP] |
2 |
POST /phpinput_server.php HTTP/1.1.. |
3 |
Host: 192.168.0.6..Content-Type: text/html..Content-Length: 75..Connec |
4 |
tion: close....<?xml version= "1.0" >.<methodcall>. <name>jt_userinfo< |
5 |
/name>.</methodcall>.... |
同樣,我樣也可以很容易地發現:
- http請求中的Content-Type是text/xml。它表示http請求中的body數據是xml數據格式。
- 服務端$_POST打印出來的是一個空數組,即與http entity body不一致了。這跟上個例子不一樣了,這里的Content-Type是text/xml,而不是application/x-www-form-urlencoded
- 而php://input數據還是跟http entity body數據一致。也就是php://input數據和$_POST數據不一致了。
我們再來看看通過GET方法提交表單數據的情況,php://input能不能讀取到GET方法的表單數據?在這里,我們稍加改動一下phpinput_server.php文件,將$_POST改成$_GET。
2 |
$raw_post_data = file_get_contents ( 'php://input' , 'r' ); |
3 |
echo "-------\$_GET------------------\n" ; |
4 |
echo var_dump( $_GET ) . "\n" ; |
6 |
echo $raw_post_data . "\n" ; |
02 |
$query_path = 'n=' . urldecode( 'perfgeeks' ) . '&p=' . urldecode( '7788' ); |
03 |
$host = '192.168.0.6' ; |
05 |
$path = '/phpinput_server.php' ; |
07 |
$fp = fsockopen ( $host , $port , $error_no , $error_desc , 30); |
09 |
fputs ( $fp , "GET {$path}?{$query_path} HTTP/1.1\r\n" ); |
10 |
fputs ( $fp , "Host: {$host}\r\n" ); |
11 |
fputs ( $fp , "Connection: close\r\n\r\n" ); |
14 |
$d .= fgets ( $fp , 4096); |
同樣,我們執行下一phpinput_get.php測試腳本,它模擬了一個通常情況下的GET方法提交表單數據。
01 |
@php /phpinput_get.php |
03 |
Date : Thu, 08 Apr 2010 07:38:15 GMT |
04 |
Server: Apache/2.2.3 (CentOS) |
05 |
X-Powered-By: PHP/5.1.6 |
08 |
Content-Type: text/html; charset=UTF-8 |
10 |
------- $_GET ------------------ |
在這個時候,使用ngrep工具,捕獲的相應的http請求數據包如下:
1 |
T 192.168.0.8:36775 -> 192.168.0.6:80 [AP] |
2 |
GET /phpinput_server.php?n=perfgeeks&p=7788 HTTP/1.1.. |
3 |
Host: 192.168.0.6..Connection: close.... |
比較POST方法提交的http請求,通常GET方法提交的請求中,entity body為空。同時,不會指定Content-Type和Content-Length。但是,如果強硬數據http entity body,並指明正確地Content-Type和Content-Length,那么php://input還可是讀取得到http entity body數據,但不是$_GET數據。
所根據,上面幾個探測,我們可以作出以下總結:
- Content-Type取值為application/x-www-form-urlencoded時,php會將http請求body相應數據會填入到數組$_POST,填入到$_POST數組中的數據是進行urldecode()解析的結果。(其實,除了該Content-Type,還有multipart/form-data表示數據是表單數據,稍后我們介紹)
- php://input數據,只要Content-Type不為multipart/form-data(該條件限制稍后會介紹)。那么php://input數據與http entity body部分數據是一致的。該部分相一致的數據的長度由Content-Length指定。
- 僅當Content-Type為application/x-www-form-urlencoded且提交方法是POST方法時,$_POST數據與php://input數據才是”一致”(打上引號,表示它們格式不一致,內容一致)的。其它情況,它們都不一致。
- php://input讀取不到$_GET數據。是因為$_GET數據作為query_path寫在http請求頭部(header)的PATH字段,而不是寫在http請求的body部分。
這也幫助我們理解了,為什么xml_rpc服務端讀取數據都是通過file_get_contents(‘php://input’, ‘r’)。而不是從$_POST中讀取,正是因為xml_rpc數據規格是xml,它的Content-Type是text/xml。
php://input碰到了multipart/form-data
上傳文件的時候,表單的寫法是這樣的:
1 |
<form enctype= "multipart/form-data" action= "phpinput_server.php" method= "POST" > |
2 |
<input type= "text" name= "n" /> |
3 |
<input type= "file" name= "f" /> |
4 |
<input type= "submit" value= "upload now" /> |
那么,enctype=multipart/form-data這里的意義,就是將該次http請求頭部(head)中的Content-Type設置為multipart/form-data。請查閱RFC1867對它的描述。multipart/form-data也表示以POST方法提交表單數據,它還伴隨了文件上傳,所以會跟application/x-www-form-urlencoded數據格式不一樣。它會以一更種更合理的,更高效的數據格式傳遞給服務端。我們提交該表單數據,並且打印出響應結果,如下:
1 |
------- $_POST ------------------ |
2 |
array (1) { [ "n" ]=> string(9) "perfgeeks" } |
同時,我們通過ngrep抓取的相應的http請求數據包如下:
02 |
T 192.168.0.8:3981 -> 192.168.0.6:80 [AP] |
03 |
POST /phpinput_server.php HTTP/1.1..Host: 192.168.0.6..Connection: kee |
04 |
p-alive..User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) A |
05 |
ppleWebKit/533.2 (KHTML, like Gecko) Chrome/5.0.342.3 Safari/533.2..Re |
07 |
che-Control: max-age=0..Origin: http: |
08 |
ipart/form-data; boundary=----WebKitFormBoundarybLQwkp4opIEZn1fA..Acce |
09 |
pt: application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q |
10 |
=0.8,image/png,*/*;q=0.5..Accept-Encoding: gzip,deflate,sdch..Accept-L |
11 |
anguage: zh-CN,zh;q=0.8..Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3..Cook |
12 |
ie: SESS3b0e658f87cf58240de13ab43a399df6=lju6o5bg8u04lv1ojugm2ccic6... |
15 |
T 192.168.0.8:3981 -> 192.168.0.6:80 [AP] |
16 |
------WebKitFormBoundarybLQwkp4opIEZn1fA..Content-Disposition: form-da |
17 |
ta; name= "n" ....perfgeeks..------WebKitFormBoundarybLQwkp4opIEZn1fA..C |
18 |
ontent-Disposition: form-data; name= "f" ; filename= "test.txt" ..Content- |
19 |
Type: text/plain....i am file..multipart/form-data..------WebKitFormBo |
20 |
undarybLQwkp4opIEZn1fA--.. |
從響應輸出來比對,$_POST數據跟請求提交數據相符,即$_POST = array(‘n’ => ‘perfgeeks’)。這也跟http請求body中的數據相呼應,同時說明PHP把相應的數據填入$_POST全局變量。而php://input輸出為空,沒有輸出任何東西,盡管http請求數據包中body不為空。這表示,當Content-Type為multipart/form-data的時候,即便http請求body中存在數據,php://input也為空,PHP此時,不會把數據填入php://input流。所以,可以確定: php://input不能用於讀取enctype=multipart/form-data數據。
我們再比較這次通過ngrep抓取的http請求數據包,我們會發現,最大不同的一點是Content-Type后面跟了boundary定義了數據的分界符,bounday是隨機生成的。另外一個大不一樣的,就是http entity body中的數據組織結構不一樣了。
上一節,我們概述了,當Content-Type為application/x-www-form-urlencoded時,php://input和$_POST數據是“一致”的,為其它Content-Type的時候,php://input和$_POST數據數據是不一致的。因為只有在Content-Type為application/x-www-form-urlencoded或者為multipart/form-data的時候,PHP才會將http請求數據包中的body相應部分數據填入$_POST全局變量中,其它情況PHP都忽略。而php://input除了在數據類型為multipart/form-data之外為空外,其它情況都可能不為空。通過這一節,我們更加明白了php://input與$_POST的區別與聯系。所以,再次確認,php://input無法讀取enctype=multipart/form-data數據,當php://input遇到它時,永遠為空,即便http entity body有數據。
php://input VS $http_raw_post_data
相信大家對php://input已經有一定深度地了解了。那么$http_raw_post_data是什么呢?$http_raw_post_data是PHP內置的一個全局變量。它用於,PHP在無法識別的Content-Type的情況下,將POST過來的數據原樣地填入變量$http_raw_post_data。它同樣無法讀取Content-Type為multipart/form-data的POST數據。需要設置php.ini中的always_populate_raw_post_data值為On,PHP才會總把POST數據填入變量$http_raw_post_data。
把腳本phpinput_server.php改變一下,可以驗證上述內容:
1 |
$raw_post_data = file_get_contents ( 'php://input' , 'r' ); |
2 |
$rtn = ( $raw_post_data == $HTTP_RAW_POST_DATA ) ? 1 : 0; |
執行測試腳本:
3 |
@php phpinput_xmlrpc.php |
得出的結果輸出都是一樣的,即都為1,表示php://input和$HTTP_RAW_POST_DATA是相同的。至於對內存的壓力,我們這里就不做細致地測試了。有興趣的,可以通過xhprof進行測試和觀察。
以此,我們這節可以總結如下:
- php://input 可以讀取http entity body中指定長度的值,由Content-Length指定長度,不管是POST方式或者GET方法提交過來的數據。但是,一般GET方法提交數據時,http request entity body部分都為空。
- php://input 與$HTTP_RAW_POST_DATA讀取的數據是一樣的,都只讀取Content-Type不為multipart/form-data的數據。
小結
- Coentent-Type僅在取值為application/x-www-data-urlencoded和multipart/form-data兩種情況下,PHP才會將http請求數據包中相應的數據填入全局變量$_POST
- PHP不能識別的Content-Type類型的時候,會將http請求包中相應的數據填入變量$HTTP_RAW_POST_DATA
- 只有Coentent-Type不為multipart/form-data的時候,PHP不會將http請求數據包中的相應數據填入php://input,否則其它情況都會。填入的長度,由Coentent-Length指定。
- 只有Content-Type為application/x-www-data-urlencoded時,php://input數據才跟$_POST數據相一致。
- php://input數據總是跟$HTTP_RAW_POST_DATA相同,但是php://input比$HTTP_RAW_POST_DATA更湊效,且不需要特殊設置php.ini
- PHP會將PATH字段的query_path部分,填入全局變量$_GET。通常情況下,GET方法提交的http請求,body為空。
原文:深入剖析PHP輸入流 php://input