原文:Lua string.sub截取UTF8 中英混合字符

在使用Lua的过程中,经常会遇到需要截取字符串或者获得字符串真实长度的情况,而Lua自带的string.sub 对于中文字符会当作 个字符来处理,截取时会造成乱码。所以需要自己改造下,下面的SubStringUTF 方法是我改编的SubString方法,经测试可以识别中英混合的字符串,不管是英文字符还是中文字符都当作一个字符来计算index,并且可以像系统的string.sub 一样使用负数来从末 ...

2017-01-18 20:26 0 4028 推荐指数:

查看详情

[Lua]string(二):string.sub处理中文

参考链接: https://baike.baidu.com/item/UTF-8/481798?fr=aladdin 1.utf-8 当字节数为1时,首字节范围:0000 0000-0111 1111,即0-127 当字节数为2时,首字节范围:1100 0000-1101 1111 ...

Sun Feb 23 00:21:00 CST 2020 0 3133
Lua截取utf-8编码的中英混合字符

参考博客:UTF8字符串在lua截取和字数统计【转载】 需求 按字面个数来截取字符串 错误方法 网上找了一些算法, 都不太正确; 要么就是乱码, 要么就是只考虑了4 byte 中文的情况, 不够全面 1. string.sub(s,1,截取长度*4)   网上很多直接 ...

Fri Nov 25 02:36:00 CST 2016 0 3332
Java 截取中英混合字符

编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取字符串。 但是要保证汉字不被截半个,如“我ABC”4,应该截为“我AB”,输入“我ABC汉DEF”,6,应该输出为“我ABC”而不是“我ABC+汉的半个”。GB2312、GBK、GB18030,CP936以及CNS11643 ...

Tue Jul 02 16:50:00 CST 2019 0 928
中英混合字符截取java

页面中很多情况下会遇到要截取字符串的情况,但是中文和英文所占的长度不同会造成,中英混合截取效果较好 摘自博客http://happysoul.iteye.com/blog/1786408 ...

Sun May 10 06:14:00 CST 2015 0 3785
c++读取utf-8格式中英混合string

最近项目中用到需要给出每一个字在string中的索引,但是又因为中文字符跟英文字符长度不一样,得分开处理, 在这里记录一下。 想要达到的效果如下: 将 “测试3.1415engEng”分割开 代码: 参考: https://blog.csdn.net ...

Tue Jul 02 01:43:00 CST 2019 0 613
Lua 截取字符串(截取utf-8格式字符串)

首先要知道string.substring.byte 的用法。 基本思路: 之所以要自己写一个截取函数,是因为lua的库函数string.sub实际是字节的截取函数。 uft-8编码格式中,大部分中文是3个字节表示的,数字和字母等是一个字节的,还有某些国家的语言是2字节的,直接 ...

Sun Aug 16 09:46:00 CST 2020 0 1802
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM