七牛php-sdk使用-文檔處理


所用到的七牛文檔轉換服務,主要是:ppt文件轉為pdf文件,pdf文件轉圖片(png)。

描述一下需求:上傳PPT或者PDF文件到七牛,最終轉換為圖片。文件上傳部分的功能已經講過了,這里說一下轉換處理的部分。

文檔類型

因為七牛整個的文件存儲系統中文件類型並不靠后綴來區分,而是有它自己的 文件類型(mineType),所以在堆bucket中的資源進行處理的時候,首先要判斷minetype。

多次的測試結果表明,pdf文件上傳后的minetype一為application/pdf,而ppt上傳后的類型就比較多了,通過jssdk上傳,以及直接在七牛上傳,上傳后綴為ppt、pptx的結果都有可能不一樣。最終總結出如下的幾種類型:

  1. application/vnd.openxmlformats-officedocument.presentationml.presentation
  2. application/zip
  3. application/vnd.ms-powerpoint
  4. application/ppt
  5. application/x-ole-storage

這里的文檔類型判斷PHP-SDK已經提供了,是BucketManager這個類。

//使用方式
$bucketManager = new BucketManager($this->getAuth());//getAuth()方法見七牛php-sdk使用-文件上傳
$mineTypeInfo  = $bucketManager->stat(bucketName, 七牛資源名);
$mimeType      = $mineTypeInfo[0]['mimeType'];
持久化處理

七牛的服務都是通過http請求附加不同的參數來實現的,比如我們處理剪裁一張圖片,或者獲取視頻某一秒的截圖,在我們的頁面中可以直接使用src=http://qiniu.com.cn?xxx這種方式,就能得到我們想要結果,但有的時候我們需要把處理的結果保存到我們的bucket中,這個就是持久化處理了。

根據sdk封裝一個持久化處理的方法,用到的sdk類為PersistentFop

/**
 * 文件持久化處理
 * @param   $key 七牛資源名
 * @param   $pfop 對資源進行的數據處理操作的命令 
 * @param   $bucket bucketName 
 * @return  persistentId
 */
 public function persistentOps($key,$bucket,$pfop,$notifyUrl='',$check=true)
 {
     header('Access-Control-Allow-Origin:*');

     $auth = $this->getAuth();
     $persistOps = new PersistentFop($auth,$bucket,$this->qiniu_image_pipeline,$notifyUrl);
     list($id,$error) = $persistOps->execute($key,$pfop);
     if($check){
	     //可暫時忽略,用來檢查資源持久化處理狀態
         $result = $this->checkStatus($id,$persistOps);
     }else{
         $result = true;
     }
     return $result;
 }
PPT轉PDF

使用到的持久化出來命令為:$pfop[] = 'yifangyun_preview/v2|saveas/'.$key;,這里使用的是七牛的第三方文檔轉換服務,因為七牛之前的odconv/pdf已經不再更新維護了,而且出現過轉為pdf排版出現遮擋以及亂碼等問題,所以改為使用億方雲的服務。

這里面saveas,即保存為一個新的資源,$key需要做一下說明,按照七牛的要求必須是:

$key = \Qiniu\base64_urlSafeEncode(bucketName.':'.$sourceName);

如果不按照規則進行encode,無法保存成功。base64_urlSafeEncode,sdk functions.php中已經存在。

有了原始的key,saveas的key,以及pfop持久化處理命令,就可以調用persistentOps方法了:

$result = $this->persistentOps($sourceName,$bucketName,$pfop);

pfop可以是一個數組,包含多個處理命令。

PDF轉圖片PNG

因為沒有PPT轉圖片這條路,所以只能先轉PDF。

用到的pfop命令:

odconv/png/page/頁碼/density/150/quality/80|saveas/'.$key;

參數包括頁碼,質量,像素密度等,還有更多的參數可以查閱文檔。所以這里我們首先要獲取PDF文檔的總頁數。使用到的接口命令是:

//odconv/png/info
$url = 'http://'.$this->qiniu_image_domain.'/'.$sourceName.'.pdf?odconv/png/info';
//url部分就是七牛資源可以訪問的完整鏈接,?后面就是要用到的命令

使用curl去請求這個鏈接,會返回json數據,里面會包含page_num成員。

有了page_num,就可以構造pfop數組了。

public function pdf2PngPfop($page,$sourceName)
{
	 $pfop = [];
     $pngName = $sourceName;//原圖
     for($i=1;$i<=$page;$i++){
         $randName = $pngName.'_'.$i.'.png';//原圖
         $key = \Qiniu\base64_urlSafeEncode($this->bucket_for_image.':'.$randName);
         $pfop[] = 'odconv/png/page/'.$i.'/density/150/quality/80|saveas/'.$key;
     }
     return $pfop;
 }

然后調用:

$res = $this->persistentOps($sourceName.'.pdf',$this->bucket_for_image,$pfop,'',false);

note:在處理比較大的文檔,例如一個PPT有100多頁,那PHP運行等待七牛的結果返回再進行數據的保存就可能會超時,一個解決方案,是指定回調url,persistentOps的倒數第二個參數就是回調url,當文檔轉換完成的時候,七牛會向這個地址發起一個請求,后續的圖片鏈接保存操作我們交給回調來做。

tips: 如果對每個pfop命令都指定回調地址,對我們的(普通)業務服務器也會造成些許的請求壓力,所以我的做法是給最后一頁的PDF轉圖片命令添加回調url。

回調地址函數
public function actionQiniuCallback()
{
    $notifyBody = file_get_contents('php://input');
    $notifyBodyArray = json_decode($notifyBody,true);

    $topicId = Yii::$app->request->get('topicId');
    $totalPage = Yii::$app->request->get('totalPage');//pdf頁數
	$key = $notifyBodyArray['inputKey'];//這個是pdf文件的key
    //業務代碼
    ...      
}
總結

php來做這個文檔轉換七牛七牛遇到的一個主要問題就是超時的問題,所以我們可以把轉換的過程拆解,在數據庫中保存處理狀態,然后用定時任務來自動處理。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM