原文:Lua string.sub截取UTF8 中英混合字符

在使用Lua的過程中,經常會遇到需要截取字符串或者獲得字符串真實長度的情況,而Lua自帶的string.sub 對於中文字符會當作 個字符來處理,截取時會造成亂碼。所以需要自己改造下,下面的SubStringUTF 方法是我改編的SubString方法,經測試可以識別中英混合的字符串,不管是英文字符還是中文字符都當作一個字符來計算index,並且可以像系統的string.sub 一樣使用負數來從末 ...

2017-01-18 20:26 0 4028 推薦指數:

查看詳情

[Lua]string(二):string.sub處理中文

參考鏈接: https://baike.baidu.com/item/UTF-8/481798?fr=aladdin 1.utf-8 當字節數為1時,首字節范圍:0000 0000-0111 1111,即0-127 當字節數為2時,首字節范圍:1100 0000-1101 1111 ...

Sun Feb 23 00:21:00 CST 2020 0 3133
Lua截取utf-8編碼的中英混合字符

參考博客:UTF8字符串在lua截取和字數統計【轉載】 需求 按字面個數來截取字符串 錯誤方法 網上找了一些算法, 都不太正確; 要么就是亂碼, 要么就是只考慮了4 byte 中文的情況, 不夠全面 1. string.sub(s,1,截取長度*4)   網上很多直接 ...

Fri Nov 25 02:36:00 CST 2016 0 3332
Java 截取中英混合字符

編寫一個截取字符串的函數,輸入為一個字符串和字節數,輸出為按字節截取字符串。 但是要保證漢字不被截半個,如“我ABC”4,應該截為“我AB”,輸入“我ABC漢DEF”,6,應該輸出為“我ABC”而不是“我ABC+漢的半個”。GB2312、GBK、GB18030,CP936以及CNS11643 ...

Tue Jul 02 16:50:00 CST 2019 0 928
中英混合字符截取java

頁面中很多情況下會遇到要截取字符串的情況,但是中文和英文所占的長度不同會造成,中英混合截取效果較好 摘自博客http://happysoul.iteye.com/blog/1786408 ...

Sun May 10 06:14:00 CST 2015 0 3785
c++讀取utf-8格式中英混合string

最近項目中用到需要給出每一個字在string中的索引,但是又因為中文字符跟英文字符長度不一樣,得分開處理, 在這里記錄一下。 想要達到的效果如下: 將 “測試3.1415engEng”分割開 代碼: 參考: https://blog.csdn.net ...

Tue Jul 02 01:43:00 CST 2019 0 613
Lua 截取字符串(截取utf-8格式字符串)

首先要知道string.substring.byte 的用法。 基本思路: 之所以要自己寫一個截取函數,是因為lua的庫函數string.sub實際是字節的截取函數。 uft-8編碼格式中,大部分中文是3個字節表示的,數字和字母等是一個字節的,還有某些國家的語言是2字節的,直接 ...

Sun Aug 16 09:46:00 CST 2020 0 1802
 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM