function sub_title($t){ $len = 50; $text = $t; return strlen($text)<=$len ? $text : (substr($text,0,$len).chr(0)."..."); }
chr(0)不是null
null是什么都沒有,而chr(0)的值是0。表示成16進制是0x00,表示成二進制是00000000
雖然chr(0)不會顯示出什么,但是他是一個字符。
當漢字被截斷時,根據編碼規則他總是要把后邊的其他字符拉過來一起作為漢字解釋,這就是出現亂碼的原因。而值為0x81到0xff與0x00組合始終都顯示為“空”
根據這一特點,在substr的結果后面補上一個chr(0),就可以防止出現亂碼了
注:
編碼 第一字節 第二字節
gb2312 0xa1-0xf7 0xa1-0xfe
gbk 0x81-0xfe 0x81-0xfe 0x40-0x7e
big5 0xa1-0xf7 0x81-0xfe 0x40-0x7e
支持utf-8編碼,原作者不詳:
function subString_UTF8($str, $start, $lenth) { $len = strlen($str); $r = array(); $n = 0; $m = 0; for($i = 0; $i < $len; $i++) { $x = substr($str, $i, 1); $a = base_convert(ord($x), 10, 2); $a = substr('00000000'.$a, -8); if ($n < $start){ if (substr($a, 0, 1) == 0) { }elseif (substr($a, 0, 3) == 110) { $i += 1; }elseif (substr($a, 0, 4) == 1110) { $i += 2; } $n++; }else{ if (substr($a, 0, 1) == 0) { $r[ ] = substr($str, $i, 1); }elseif (substr($a, 0, 3) == 110) { $r[ ] = substr($str, $i, 2); $i += 1; }elseif (substr($a, 0, 4) == 1110) { $r[ ] = substr($str, $i, 3); $i += 2; }else{ $r[ ] = ''; } if (++$m >= $lenth){ break; } } } return $r; } // End subString_UTF8; }// End String
#由於此函數返回的是一個數組,因此要配合join函數來顯示字符串:
#join('',subString_UTF8($str, $start, $lenth));
#在頁面顯示的時候還可以在此語句后面連一個"..."