處理html富文本的時候,碰到批量處理img標簽,要把img標簽格式化,並且去除不用的代碼,class,各種data-等,首先想到使用正則匹配,然后處理匹配到的img標簽和參數,經過一番嘗試終於搞定了,代碼如下:
<?php
$content = '<br/><img mime="image/jpeg" class="img-scroll" data-img="xxx" src="src-xxx"/><br/>';
$regImg = '/<img[^>]*src\s*=\s*[\"|\']?\s*([^>\"\'\s]*)(\">|\"\/>)/i';
$res = preg_match_all($regImg,$content,$matchAll);
print_r($res);
print_r($matchAll);
?>
運行結果:
Array
(
[0] => Array
(
[0] => <img mime="image/jpeg" class="img-scroll" data-img="xxx" src="src-xxx"/>
)
[1] => Array
(
[0] => src-xxx
)
[2] => Array
(
[0] => "/>
)
)
備注:
匹配的img標簽都是以"/>或者">結束,如有不同和自行修改正則。
done!