思路
1. 加載word文件。
2. 循環判斷加載出來的數據。
( 數據下面有很多個節點 )
( 節點是按照數據的類型分類的 例如 無樣式的文本是RunText,換行是TextBreak,表格是table.....等)
3. 循環判斷他們的數據類型是什么進行讀取。
4. 如果是文本的話就使用 節點->getText() 就直接可以獲取到文本內容 表格的話有點麻煩。
關於操作word的一些東西
https://segmentfault.com/a/1190000019479817?utm_source=tag-newest
https://www.cnblogs.com/mengluo/p/10280381.html(本博源於這個博客)
代碼
// 准備條件 下載 phpword 的拓展庫
// 加載
$source = IOFactory::load($filePath)->getSections();
foreach ($source as $S)
{
$elements = $S->getElements();
if (!empty($this->GetElement($elements)))
{
$arr = $this->GetElement($elements);
$this->todoGo($arr,$tableCatId,$tableStageId,$filePath,$versionId);
}
}
// 逐級讀取/讀取節點
function GetElement($elements)
{
$arrx=[];
foreach ($elements as $k=>$e1)
{
// 獲取word對象中對應內容類型類的節點的類名
$class = $this->getClass($e1);
if ($class=='Table')
{
// 獲取最大行
$rows=count($e1->getRows());
// 獲取最大列
$cells=$e1->countColumns();
$arrx[$k]['rows']=$rows;
$arrx[$k]['cells']=$cells;
// 循環獲取對應行和列下的單元格的文本內容
for($i=0;$i<$rows;$i++)
{
// 獲取對應行
$rows_a=$e1->getRows()[$i];
for($j = 0; $j < $cells; $j++)
{
// 獲取對應列
$x=$rows_a->getCells()[$j];
$arrx[$k]['text'][$i+1][$j+1]=$this->getTextElement($x);
}
}
}
}
}
//獲取文本的節點
function getTextElement($E)
{
$elements = $E->getElements();
$xas='';
$result = [];
$inResult=[];
$text=[];
foreach($elements as $inE)
{
$ns = get_class($inE);
$elName = explode('\\', $ns)[3];
if($elName == 'Text')
{
$result[] = $this->textarr($inE);
}
elseif (method_exists($inE, 'getElements'))
{
$inResult = $this->getTextElement($inE);
}
if(!is_null($inResult))
{
$result = array_merge($result, $inResult);
}
}
return count($result) > 0 ? $result : null;
}
//獲取文本
function textarr($e)
{
$textArr['text']=$e->getText();
return $textArr;
}