使用php的中文分詞的composer:https://packagist.org/packages/liliuwei/liliuwei-pscws4
如果電腦的鏡像沒有使用國內鏡像,推薦使用最新的 Composer 版本。
阿里雲composer鏡像與 Packagist 官方實時同步,
所有項目都會使用該鏡像地址:
composer config -g repo.packagist composer https://mirrors.aliyun.com/composer/
取消配置還原到默認的地址:
composer config -g --unset repos.packagist
然后使用命令拉取分詞的composer包:
composer require liliuwei/liliuwei-pscws4
使用:先引入分詞類,然后實例化對象並使用
use liliuwei\pscws4\PSCWS4API;//引入分詞類
$text = 'wekyun博客是一個分享開發中一些應用技術的博客!';
$pscws = new PSCWS4API('utf8');
$pscws->PSCWS4($text); //獲取所有分詞
$res = $pscws->PSCWS4_TOP($text, 4); //返回分詞結果的詞語按權重統計的前個4詞
var_dump($res);
對分詞進行自定義的擴展請閱讀:對php的pscws4中文分詞進行分詞和關鍵詞擴展 - wekyun - 博客園 (cnblogs.com)