背景
項目開發中三級地區需要根據名稱拼音首字母進行分組展示,但是地區表中名稱拼音首字母不全,因此需要根據地區名稱獲取其拼音首字母。
坑
搜索了一圈發現絕大部分的解決方案都是一樣的代碼,核心就是下面的這個函數
function getFirstCharter($str)
{
if (empty($str)) {
return '';
}
$fchar = ord($str{0});
if ($fchar >= ord('A') && $fchar <= ord('z')) return strtoupper($str{0});
$s1 = iconv('UTF-8', 'gb2312', $str);
$s2 = iconv('gb2312', 'UTF-8', $s1);
$s = $s2 == $str ? $s1 : $str;
$asc = ord($s{0}) * 256 + ord($s{1}) - 65536;
if ($asc >= -20319 && $asc <= -20284) return 'A';
if ($asc >= -20283 && $asc <= -19776) return 'B';
if ($asc >= -19775 && $asc <= -19219) return 'C';
if ($asc >= -19218 && $asc <= -18711) return 'D';
if ($asc >= -18710 && $asc <= -18527) return 'E';
if ($asc >= -18526 && $asc <= -18240) return 'F';
if ($asc >= -18239 && $asc <= -17923) return 'G';
if ($asc >= -17922 && $asc <= -17418) return 'H';
if ($asc >= -17417 && $asc <= -16475) return 'J';
if ($asc >= -16474 && $asc <= -16213) return 'K';
if ($asc >= -16212 && $asc <= -15641) return 'L';
if ($asc >= -15640 && $asc <= -15166) return 'M';
if ($asc >= -15165 && $asc <= -14923) return 'N';
if ($asc >= -14922 && $asc <= -14915) return 'O';
if ($asc >= -14914 && $asc <= -14631) return 'P';
if ($asc >= -14630 && $asc <= -14150) return 'Q';
if ($asc >= -14149 && $asc <= -14091) return 'R';
if ($asc >= -14090 && $asc <= -13319) return 'S';
if ($asc >= -13318 && $asc <= -12839) return 'T';
if ($asc >= -12838 && $asc <= -12557) return 'W';
if ($asc >= -12556 && $asc <= -11848) return 'X';
if ($asc >= -11847 && $asc <= -11056) return 'Y';
if ($asc >= -11055 && $asc <= -10247) return 'Z';
return null;
}
但是這種實現方式由於GB2312標准共收錄6763個漢字,很多字上面這種方式都無法正確獲取其拼音首字母。
正確的實現方式
使用overtrue/pinyin包實現。
安裝
composer require "overtrue/pinyin:~4.0"
使用
use Overtrue\Pinyin\Pinyin;
$areaName = '河南';
$pinyin = new Pinyin();
$s = mb_substr(areaName, 0, 1, 'utf-8');
$firstChar = strtoupper($pinyin->abbr($s));
var_dump(firstChar);
關於overtrue/pinyin
上面獲取地區拼音首字母的代碼只是其很小的一部分應用,其還有很多用法,具體可以查看該項目的github:https://github.com/overtrue/pinyin
use Overtrue\Pinyin\Pinyin;
// 小內存型
$pinyin = new Pinyin(); // 默認
// 內存型
// $pinyin = new Pinyin('\\Overtrue\\Pinyin\\MemoryFileDictLoader');
// I/O型
// $pinyin = new Pinyin('\\Overtrue\\Pinyin\\GeneratorFileDictLoader');
$pinyin->convert('帶着希望去旅行,比到達終點更美好');
// ["dai", "zhe", "xi", "wang", "qu", "lyu", "xing", "bi", "dao", "da", "zhong", "dian", "geng", "mei", "hao"]
// PINYIN_TONE: UNICODE 式音調
$pinyin->convert('帶着希望去旅行,比到達終點更美好', PINYIN_TONE);
// ["dài","zhe","xī","wàng","qù","lǚ","xíng","bǐ","dào","dá","zhōng","diǎn","gèng","měi","hǎo"]
//PINYIN_ASCII_TONE 帶數字式音調
$pinyin->convert('帶着希望去旅行,比到達終點更美好', PINYIN_ASCII_TONE);
//["dai4","zhe","xi1","wang4","qu4","lyu3","xing2","bi3","dao4","da2","zhong1","dian3","geng4","mei3","hao3"]