Lua字符串庫小集
1. 基礎字符串函數:
字符串庫中有一些函數非常簡單,如:
1). string.len(s) 返回字符串s的長度;
2). string.rep(s,n) 返回字符串s重復n次的結果;
3). string.lower(s) 返回s的副本,其中所有的大寫都被轉換為了小寫形式,其他字符不變;
4). string.upper(s) 和lower相反,將小寫轉換為大寫;
5). string.sub(s,i,j) 提取字符串s的第i個到第j個字符。Lua中,第一個字符的索引值為1,最后一個為-1,以此類推,如:
print(string.sub("[hello world]",2,-2)) --輸出hello world
6). string.format(s,...) 返回格式化后的字符串,其格式化規則等同於C語言中printf函數,如:
print(string.format("pi = %.4f",math.pi)) --輸出pi = 3.1416
7). string.char(...) 參數為0到多個整數,並將每個整數轉換為對應的字符。然后返回一個由這些字符連接而成的字符串,如:
print(string.char(97,98,99)) --輸出abc
8). string.byte(s,i) 返回字符串s的第i個字符的Ascii值,如果沒有第二個參數,缺省返回第一個字符的Ascii值。
print(string.byte("abc")) --輸出97
print(string.byte("abc",-1)) --輸出99
由於字符串類型的變量都是不可變類型的變量,因此在所有和string相關的函數中,都無法改變參數中的字符串值,而是生成一個新值返回。
2. 模式匹配函數:
Lua的字符串庫提供了一組強大的模式匹配函數,如find、match、gsub和gmatch。
1). string.find函數:
在目標字符串中搜索一個模式,如果找到,則返回匹配的起始索引和結束索引,否則返回nil。如:
1 s = "hello world" 2 i, j = string.find(s,"hello") 3 print(i, j) --輸出1 5 4 i, j = string.find(s,"l") 5 print(i, j) --輸出3 3 6 print(string.find(s,"lll")) --輸出nil
string.find函數還有一個可選參數,它是一個索引,用於告訴函數從目標字符串的哪個位置開始搜索。主要用於搜索目標字符串中所有匹配的子字符串,且每次搜索都從上一次找到的位置開始。如:
local t = {} local i = 0 while true do i = string.find(s,"\n",i+1) if i == nil then break end t[#t + 1] = i end
2). string.match函數:
該函數返回目標字符串中和模式字符串匹配的部分。如:
1 date = "Today is 2012-01-01" 2 d = string.match(date,"%d+\-%d+\-%d+") 3 print(d) --輸出2012-01-01
3). string.gsub函數:
該函數有3個參數,目標字符串、模式和替換字符串。基本用法是將目標字符串中所有出現模式的地方替換為替換字符串。如:
print(string.gsub("Lua is cute","cute","great")) --輸出Lua is great
該函數還有可選的第4個參數,即實際替換的次數。
print(string.gsub("all lii","l","x",1)) --輸出axl lii
print(string.gsub("all lii","l","x",2)) --輸出axx lii
函數string.gsub 返回還有另一個結果,即實際替換的次數。
count = select(2, string.gsub(str," "," ")) --輸出str中空格的數量
還能根據這個函數來實現一些其他的功能,譬如 split string:
string.split = function(s, p) local rt= {} string.gsub(s, '[^'..p..']+', function(w) table.insert(rt, w) end ) return rt end -- 測試代碼如下: local str = "abc,123,hello,ok" local list = string.split(str, ',') for _, s in ipairs(list) do print(tostring(s)) end
-- 輸出結果如下 :
abc
123
hello
ok
另外觀看 雲風的這篇文章,發現string.gsub函數 還可以這樣用:
local str = "#qwe&qwe&qwe&##qwe&qwe&qwe&##qwe&qwe&qwe&##qwe&qwe&qwe&#" str = str.rep(str , 1000) str = string.gsub(str , '&', '&') str = string.gsub(str , '#', '@@@') str = string.gsub(str , 'q', 'Q') str = string.gsub(str , '#', 'B-B') print(str)
上述的實現也可寫成這樣 來寫~如下:
local escapeAttrib = { ['&'] = '&'; ['#'] = '@@@'; ['q'] = 'Q'; ['e'] = 'B-B'; } local str = "#qwe&qwe&qwe&##qwe&qwe&qwe&##qwe&qwe&qwe&##qwe&qwe&qwe&#" str = str.rep(str , 1000) str = string.gsub(str , '[&#qe]', escapeAttrib) print(str)
使用lua自帶的SciTe 跑了多次,目測 前者表現會稍好一點;
4). string.gmatch函數:
返回一個函數,通過這個返回的函數可以遍歷到一個字符串中所有出現指定模式的地方。如:
words = {} s = "hello world" for w in string.gmatch(s,"%a+") do print("----") print(w) words[#words + 1] = w end --輸出結果為:
----
hello ----world
3. 模式:
下面的列表給出了Lua目前支持的模式元字符;
模式元字符 | 描述 |
. | 所有字符 |
%a | 字母 |
%c | 控制字符 |
%d | 數字 |
%l | 小寫字母 |
%p | 標點符號 |
%s | 空白字符 |
%u | 大寫字母 |
%w | 字母和數字字符 |
%x | 十六進制數字 |
%z | 內部表示為0的字符 |
這些元字符的大寫形式表示它們的補集,如%A,表示所有非字母字符。
print(string.gsub("hello, up-down!","%S",".")) --輸出hello..up.down. 4
上例中的4表示替換的次數。
除了上述元字符之外,Lua還提供了另外幾個關鍵字符。如:( ) . % + - * ? [ ] ^ $
其中%表示轉義字符,如%.表示點(.),%%表示百分號(%)。
方括號[]表示將不同的字符分類,即可創建出屬於自己的字符分類,如[%w_]表示匹配字符、數字和下划線。
橫線(-)表示連接一個范圍,比如[0-9A-Z]
如果^字符在方括號內 ,如[^\n],表示除\n之外的所有字符,即表示方括號中的分類的補集。如果^不在方括號內,則表示以后面的字符開頭,$和它正好相反,表示以前面的字符結束。如:^Hello%d$,匹配的字符串可能為Hello1、Hello2等。
在Lua中還提供了4種用來修飾模式中的重復部分,如:+(重復1次或多次)、*(重復0次或多次)、-(重復0次或多次)和?(出現0或1次)。如:
print(string.gsub("one, and two; and three","%a+","word")) --輸出word, word word; word word
print(string.match("the number 1298 is even","%d+")) --輸出1298
星號(*)和橫線(-)的主要差別是,星號總是試圖匹配更多的字符,而橫線則總是試圖匹配最少的字符。
格式字符串可能包含以下的轉義碼:
%c - 接受一個數字, 並將其轉化為ASCII碼表中對應的字符
%d, %i - 接受一個數字並將其轉化為有符號的整數格式
%o - 接受一個數字並將其轉化為八進制數格式
%u - 接受一個數字並將其轉化為無符號整數格式
%x - 接受一個數字並將其轉化為十六進制數格式, 使用小寫字母
%X - 接受一個數字並將其轉化為十六進制數格式, 使用大寫字母
%e - 接受一個數字並將其轉化為科學記數法格式, 使用小寫字母e
%E - 接受一個數字並將其轉化為科學記數法格式, 使用大寫字母E
%f - 接受一個數字並將其轉化為浮點數格式
%g(%G) - 接受一個數字並將其轉化為%e(%E, 對應%G)及%f中較短的一種格式
%q - 接受一個字符串並將其轉化為可安全被Lua編譯器讀入的格式(即將該string添加了"")
%s - 接受一個字符串並按照給定的參數格式化該字符串
為進一步細化格式, 可以在%號后添加參數. 參數將以如下的順序讀入:
(1) 符號: 一個+號表示其后的數字轉義符將讓正數顯示正號. 默認情況下只有負數顯示符號.
(2) 占位符: 一個0, 在后面指定了字串寬度時占位用. 不填時的默認占位符是空格.
(3) 對齊標識: 在指定了字串寬度時, 默認為右對齊, 增加-號可以改為左對齊.
(4) 寬度數值
(5) 小數位數/字串裁切: 在寬度數值后增加的小數部分n, 若后接f(浮點數轉義符, 如%6.3f)則設定該浮點數的小數只保留n位, 若后接s(字符串轉義符, 如%5.3s)則設定該字符串只顯示前n位.
4. 捕獲(capture):
捕獲功能可根據一個模式從目標字符串中抽出匹配於該模式的內容。在指定捕獲是,應將模式中需要捕獲的部分寫到一對圓括號內。對於具有捕獲的模式,函數string.match會將所有捕獲到的值作為單獨的結果返回。即它會將目標字符串切成多個捕獲到的部分。如:
pair = "name = Anna" key,value = string.match(pair,"(%a+)%s*=%s*(%a+)") print(key,value) --輸出name anna date = "Today is 2012-01-02" y,m,d = string.match(date,"(%d+)\-(%d+)\-(%d+)") print(y,m,d) --輸出2012 01 02
還可以對模式本身使用捕獲。即%1表示第一個捕獲,以此類推,%0表示整個匹配,如:
1 print(string.gsub("hello Lua","(.)(.)","%2%1")) --將相鄰的兩個字符對調,輸出為ehll ouLa 2 print(string.gsub("hello Lua!","%a","%0-%0")) --輸出為h-he-el-ll-lo-o L-Lu-ua-a!
5. 替換:
string.gsub函數的第三個參數不僅可以是字符串,也可以是函數或table,如果是函數,string.gsub會在每次找到匹配時調用該函 數,調用時的參數就是捕獲到的內容,而該函數的返回值則作為要替換的字符串。當用一個table來調用時,string.gsub會用每次捕獲到的內容作 為key,在table中查找,並將對應的value作為要替換的字符串。如果table中不包含這個key,那么string.gsub不改變這個匹 配。如:
function expand(s) return (string.gsub(s,"$(%w+)",_G)) end name = "Lua"; status = "great" print(expand("$name is $status, isn't it?")) --輸出 Lua is great, isn't it? print(expand("$othername is $status, isn't it?")) --輸出 $othername is great, isn't it? function expand2(s) return (string.gsub(s,"$(%w+)",function(n) return tostring(_G[n]) end)) end print(expand2("print = $print; a = $a")) --輸出 print = function: 002B77C0; a = nil
另外:附上網路上關於Lua的table和String相互轉化的方法如下:
-- 序列化tablle表--將表轉化成string function serialize(obj) local lua = "" local t = type(obj) if t == "number" then lua = lua .. obj elseif t == "boolean" then lua = lua .. tostring(obj) elseif t == "string" then lua = lua .. string.format("%q", obj) elseif t == "table" then lua = lua .. "{\n" for k, v in pairs(obj) do lua = lua .. "[" .. serialize(k) .. "]=" .. serialize(v) .. ",\n" end local metatable = getmetatable(obj) if metatable ~= nil and type(metatable.__index) == "table" then for k, v in pairs(metatable.__index) do lua = lua .. "[" .. serialize(k) .. "]=" .. serialize(v) .. ",\n" end end lua = lua .. "}" elseif t == "nil" then return nil else return "-nil-" --error("can not serialize a " .. t .. " type.") end return lua end -- 反序列化tablle表--將string轉化成table function unserialize(lua) local t = type(lua) if t == "nil" or lua == "" then return nil elseif t == "number" or t == "string" or t == "boolean" then lua = tostring(lua) else error("can not unserialize a " .. t .. " type.") end lua = "return " .. lua local func = loadstring(lua) if func == nil then return nil end return func() end
未完帶整理;閱參考文章 請Click :Here