/**
* 抓取遠程圖片
*
* @param string $url 遠程圖片路徑
* @param string $filename 本地存儲文件名
*/
function grabImage($url, $filename = '') {
if($url == '') {
return false; //如果 $url 為空則返回 false;
}
$ext_name = strrchr($url, '.'); //獲取圖片的擴展名
if($ext_name != '.gif' && $ext_name != '.jpg' && $ext_name != '.bmp' && $ext_name != '.png') {
return false; //格式不在允許的范圍
}
if($filename == '') {
$filename = time().$ext_name; //以時間戳另起名
}
//開始捕獲
ob_start();
readfile($url);
$img_data = ob_get_contents();
ob_end_clean();
$size = strlen($img_data);
$local_file = fopen($filename , 'a');
fwrite($local_file, $img_data);
fclose($local_file);
return $filename;
}
上面的函數有幾個缺點:
1.不能自動識別圖片后綴名(很多圖片的url並不指向一個靜態圖片地址,而是直接將圖片流輸出到客戶端)
2.不支持圖片url的302跳轉
這個函數並不符合本人項目的需求,於是花了點時間自己寫了一個下載函數,此函數支持:
1.靜態圖片下載
2.服務端直接輸出圖片流下載
3.服務端使用302跳轉到真實圖片地址的下載(可限定跳轉次數)
函數代碼如下:
/**
* 下載遠程圖片
* @param string $url 圖片的絕對url
* @param string $filepath 文件的完整路徑(包括目錄,不包括后綴名,例如/www/images/test) ,此函數會自動根據圖片url和http頭信息確定圖片的后綴名
* @return mixed 下載成功返回一個描述圖片信息的數組,下載失敗則返回false
*/
function downloadImage($url, $filepath) {
//服務器返回的頭信息
$responseHeaders = array();
//原始圖片名
$originalfilename = '';
//圖片的后綴名
$ext = '';
$ch = curl_init($url);
//設置curl_exec返回的值包含Http頭
curl_setopt($ch, CURLOPT_HEADER, 1);
//設置curl_exec返回的值包含Http內容
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//設置抓取跳轉(http 301,302)后的頁面
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
//設置最多的HTTP重定向的數量
curl_setopt($ch, CURLOPT_MAXREDIRS, 2);
//服務器返回的數據(包括http頭信息和內容)
$html = curl_exec($ch);
//獲取此次抓取的相關信息
$httpinfo = curl_getinfo($ch);
curl_close($ch);
if ($html !== false) {
//分離response的header和body,由於服務器可能使用了302跳轉,所以此處需要將字符串分離為 2+跳轉次數 個子串
$httpArr = explode("\r\n\r\n", $html, 2 + $httpinfo['redirect_count']);
//倒數第二段是服務器最后一次response的http頭
$header = $httpArr[count($httpArr) - 2];
//倒數第一段是服務器最后一次response的內容
$body = $httpArr[count($httpArr) - 1];
$header.="\r\n";
//獲取最后一次response的header信息
preg_match_all('/([a-z0-9-_]+):\s*([^\r\n]+)\r\n/i', $header, $matches);
if (!empty($matches) && count($matches) == 3 && !empty($matches[1]) && !empty($matches[1])) {
for ($i = 0; $i < count($matches[1]); $i++) {
if (array_key_exists($i, $matches[2])) {
$responseHeaders[$matches[1][$i]] = $matches[2][$i];
}
}
}
//獲取圖片后綴名
if (0 < preg_match('{(?:[^\/\\\\]+)\.(jpg|jpeg|gif|png|bmp)$}i', $url, $matches)) {
$originalfilename = $matches[0];
$ext = $matches[1];
} else {
if (array_key_exists('Content-Type', $responseHeaders)) {
if (0 < preg_match('{image/(\w+)}i', $responseHeaders['Content-Type'], $extmatches)) {
$ext = $extmatches[1];
}
}
}
//保存文件
if (!empty($ext)) {
$filepath .= ".$ext";
//如果目錄不存在,則先要創建目錄
CFiles::createDirectory(dirname($filepath));
$local_file = fopen($filepath, 'w');
if (false !== $local_file) {
if (false !== fwrite($local_file, $body)) {
fclose($local_file);
$sizeinfo = getimagesize($filepath);
return array('filepath' => realpath($filepath), 'width' => $sizeinfo[0], 'height' => $sizeinfo[1], 'orginalfilename' => $originalfilename, 'filename' => pathinfo($filepath, PATHINFO_BASENAME));
}
}
}
}
return false;
}
