【文章推薦】Lua string.sub截取UTF8 中英混合字符

原文：Lua string.sub截取UTF8 中英混合字符

在使用Lua的過程中，經常會遇到需要截取字符串或者獲得字符串真實長度的情況，而Lua自帶的string.sub 對於中文字符會當作個字符來處理，截取時會造成亂碼。所以需要自己改造下，下面的SubStringUTF 方法是我改編的SubString方法，經測試可以識別中英混合的字符串，不管是英文字符還是中文字符都當作一個字符來計算index，並且可以像系統的string.sub 一樣使用負數來從末 ...

2017-01-18 20:26 0 4028 推薦指數：

查看詳情

[Lua]string(二)：string.sub處理中文

參考鏈接： https://baike.baidu.com/item/UTF-8/481798?fr=aladdin 1.utf-8 當字節數為1時，首字節范圍：0000 0000-0111 1111，即0-127 當字節數為2時，首字節范圍：1100 0000-1101 1111 ...

lua中 string.find(查找獲取字符串) string.gsub(查找替換字符串) string.sub(截取字符串)

> aaa='/p/v2/api/winapi/adapter/lgj'> print(string.find(aaa, "^/.+/adapter/(.*)"))1 28 lgj> aaa='/p/v2/api/winapi/adapter/lgj/zy/l'> ...

Lua截取utf-8編碼的中英文混合字符串

參考博客：UTF8字符串在lua的截取和字數統計【轉載】需求按字面個數來截取子字符串錯誤方法網上找了一些算法, 都不太正確; 要么就是亂碼, 要么就是只考慮了4 byte 中文的情況, 不夠全面 1. string.sub(s,1,截取長度*4) 　　網上很多直接 ...

PHP截取中英文混合字符

...

Java 截取中英文混合字符串

編寫一個截取字符串的函數，輸入為一個字符串和字節數，輸出為按字節截取的字符串。但是要保證漢字不被截半個，如“我ABC”4，應該截為“我AB”，輸入“我ABC漢DEF”，6，應該輸出為“我ABC”而不是“我ABC+漢的半個”。GB2312、GBK、GB18030，CP936以及CNS11643 ...

中英文混合字符串截取java

頁面中很多情況下會遇到要截取字符串的情況，但是中文和英文所占的長度不同會造成，中英文混合截取效果較好摘自博客http://happysoul.iteye.com/blog/1786408 ...

c++讀取utf-8格式中英文混合string

最近項目中用到需要給出每一個字在string中的索引，但是又因為中文字符跟英文字符長度不一樣，得分開處理，在這里記錄一下。想要達到的效果如下：將 “測試3.1415engEng”分割開代碼：參考： https://blog.csdn.net ...

Lua 截取字符串（截取utf-8格式字符串）

首先要知道string.sub 和 string.byte 的用法。基本思路：之所以要自己寫一個截取函數，是因為lua的庫函數string.sub實際是字節的截取函數。 uft-8編碼格式中，大部分中文是3個字節表示的，數字和字母等是一個字節的，還有某些國家的語言是2字節的，直接 ...

原文：Lua string.sub截取UTF8 中英混合字符

相關推薦

相關標簽