2020-3-30因工作需要進行字符串截取,特寫下所注意事項
delphi程序本身中的字符串截取函數:LeftStr,MidStr,RightStr ,使用時需引用單元 StrUtils;
如為不想增加程序文件的大小的話,可把這個三個函數重寫:
function RightStr(Const Str: String; Size: Word): String; begin if Size > Length(Str) then Size := Length(Str) ; RightStr := Copy(Str, Length(Str)-Size+1, Size) end; function MidStr(Const Str: String; From, Size: Word): String; begin MidStr := Copy(Str, From, Size) end; function LeftStr(Const Str: String; Size: Word): String; begin LeftStr := Copy(Str, 1, Size) end;
並結合pos,copy,length函數使用;
但問題是中用Length來取字符長度時,會將漢字當成兩個字節來計算,Copy把漢字當成兩個來處理,可能截取半個漢字,那我們如何知道是否取的是漢字呢?是否把一個漢字取完整?
在delphi中自帶ByteType函數對取出來的字符進行判斷是一個單字符還是漢字的一部分!
mbLeadByte: 漢字的第一個字節
mbTrailByte: 漢字的第二個字節
mbSingleByte: 單個的字符,不是中文字符。
如果Copy出來的是漢字的第一個字節,就再多(或少)Copy一個,湊成完整的漢字。
以下的代碼為轉自https://www.cnblogs.com/pilybird/archive/2007/12/07/986711.html
function LeftStrEx(const AText: string; ACount: Integer): string; var I,ChrLen, BreakLen:Integer; IsMBCS:Boolean; begin I := 1; BreakLen := 0; IsMBCS := False; if Length(AText)>ACount then begin while I<=ACount do begin if AText[I] in LeadBytes then begin ChrLen := CharLength(AText,I)-1; I:= I + ChrLen; //說明AText[ACount]不是一個中文字符的末尾 if I>ACount then begin IsMBCS := True; BreakLen := I - ChrLen - 1; Break; end; end; //.. Inc(I); end; end; //AText[ACount]不是半個中文字符 if not IsMBCS then Result := LeftStr(AText,ACount) else Result := LeftStr(AText,BreakLen); end;