sscanf函數用法詳解
首先應該注意的是 sscanf()只能對字符數組進行操作,但是不能對string字符串操作
sscanf() - 從一個字符串中讀進與指定格式相符的數據.
函數原型:
Int sscanf( string str, string fmt, mixed var1, mixed var2 ... );
int scanf( const char *format [,argument]... );
說明:
sscanf與scanf類似,都是用於輸入的,只是后者以屏幕(stdin)為輸入源,前者以固定字符串為輸入源。
其中的format可以是一個或多個 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符號}
注:
1、 * 亦可用於格式中, (即 %*d 和 %*s) 加了星號 (*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中)
2、{a|b|c}表示a,b,c中選一,[d],表示可以有d也可以沒有d。
3、width表示讀取寬度。
4、{h | l | I64 | L}:參數的size,通常h表示單字節size,I表示2字節 size,L表示4字節size(double例外),l64表示8字節size。
5、type :這就很多了,就是%s,%d之類。
6、特別的:%*[width] [{h | l | I64 | L}]type 表示滿足該條件的被過濾掉,不會向目標參數中寫入值
支持集合操作:
%[a-z] 表示匹配a到z中任意字符,貪婪性(盡可能多的匹配)
%[aB'] 匹配a、B、'中一員,貪婪性
%[^a] 匹配非a的任意字符,貪婪性
例子:
1. 常見用法。
char buf[512] = ;
sscanf("123456 ", "%s", buf);
printf("%s\n", buf);
結果為:123456
2. 取指定長度的字符串。如在下例中,取最大長度為4字節的字符串。
sscanf("123456 ", "%4s", buf);
printf("%s\n", buf);
結果為:1234
3. 取到指定字符為止的字符串。如在下例中,取遇到空格為止字符串。
sscanf("123456 abcdedf", "%[^ ]", buf);
printf("%s\n", buf);
結果為:123456
4. 取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。
sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);
printf("%s\n", buf);
結果為:123456abcdedf
5. 取到指定字符集為止的字符串。如在下例中,取遇到大寫字母為止的字符串。
sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);
printf("%s\n", buf);
結果為:123456abcdedf
6、給定一個字符串iios/12DDWDFF@122,獲取 / 和 @ 之間的字符串,先將 "iios/"過濾掉,再將非'@'的一串內容送到buf中
sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
printf("%s\n", buf);
結果為:12DDWDFF
7、給定一個字符串““hello, world”,僅保留world。(注意:“,”之后有一空格)
sscanf(“hello, world”, "%*s%s", buf);
printf("%s\n", buf);
結果為:world
%*s表示第一個匹配到的%s被過濾掉,即hello被過濾了
如果沒有空格則結果為NULL。
sscanf的功能很類似於正則表達式, 但卻沒有正則表達式強大,所以如果對於比較復雜的字符串處理,建議使用正則表達式.
//-------------------------------------------------------
sscanf,表示從字符串中格式化輸入
上面表示從str中,輸入數字給x,就是32700
久以前,我以為c沒有自己的split string函數,后來我發現了sscanf;一直以來,我以為sscanf只能以空格來界定字符串,現在我發現我錯了。
sscanf是一個運行時函數,原形很簡單:
int sscanf(
const char *buffer,
const char *format [,
argument ] ...
);
它強大的功能體現在對format的支持上。
我以前用它來分隔類似這樣的字符串2006:03:18:
int a, b, c;
sscanf("2006:03:18", "%d:%d:%d", a, b, c);
以及2006:03:18 - 2006:04:18:
char sztime1[16] = "", sztime2[16] = "";
sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2); (此種用法結合網址:)
但是后來,我需要處理2006:03:18-2006:04:18
僅僅是取消了‘-’兩邊的空格,卻打破了%s對字符串的界定。
我需要重新設計一個函數來處理這樣的情況?這並不復雜,但是,為了使所有的代碼都有統一的風格,我需要改動很多地方,把已有的sscanf替換成我自己的分割函數。我以為我肯定需要這樣做,並伴隨着對sscanf的強烈不滿而入睡;一覺醒來,發現其實不必。
format-type中有%[]這樣的type field。如果讀取的字符串,不是以空格來分隔的話,就可以使用%[]。
%[]類似於一個正則表達式。[a-z]表示讀取a-z的所有字符,[^a-z]表示讀取除a-z以外的所有字符。
所以那個問題也就迎刃而解了:
sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2)
本文轉自:http://kmplayer.iteye.com/blog/556293
此文所有的實驗都是基於下面的程序:
char str[10];
for (int i = 0; i < 10; i++) str[i] = '!';
執行完后str的值為
str = "!!!!!!!!!!"
我們把str的每個字符都初始化為驚嘆號,當str的值發生變化時,使用printf打印str的值,對比先前的驚嘆號,這樣就可以方便的觀察str發生了怎樣的變化。下面我們做幾個小實驗,看看使用sscanf和正則表達式格式化輸入后,str有什么變化。
實驗1:
sscanf("123456","%s",str); ---------str的值為 "123456\0!!!"
這個實驗很簡單,把源字符串"123456"拷貝到str的前6個字符,並且把str的第7個字符設為null字符,也就是\0
實驗2:
sscanf("123456","%3s",str); ---------str的值為 "123\0!!!!!!"
看到沒有,正則表達式的百分號后面多了一個3,這告訴sscanf只拷貝3個字符給str,然后把第4個字符設為null字符。
實驗3:
sscanf("aaaAAA","%[a-z]",str); ---------str的值為 "aaa\0!!!!!!"
從這個實驗開始我們會使用正則表達式,括號里面的a-z就是一個正則表達式,它可以表示從a到z的任意字符,
在繼續討論之前,我們先來看看百分號表示什么意思,%表示選擇,%后面的是條件,比如實驗1的"%s",s是一個條件,表示任意字符,"%s"的意思是:只要輸入的東西是一個字符,就把它拷貝給str。實驗2的"%3s"又多了一個條件:只拷貝3個字符。實驗3的“%[a-z]”的條件稍微嚴格一些,輸入的東西不但是字符,還得是一個小寫字母的字符,所以實驗3只拷貝了小寫字母"aaa"給str,別忘了加上null字符。
實驗4:
sscanf("AAAaaaBBB","%[^a-z]",str); ---------str的值為 "AAA\0!!!!!!"
對於所有字符,只要不是小寫字母,都滿足"^a-z"正則表達式,符號^表示邏輯非。前3個字符都不是小寫字符,所以將其拷貝給str,但最后3個字符也不是小寫字母,為什么不拷貝給str呢?這是因為當碰到不滿足條件的字符后,sscanf就會停止執行,不再掃描之后的字符。
實驗5:
sscanf("AAAaaaBBB","%[A-Z]%[a-z]",str); ---------段錯誤
這個實驗的本意是:先把大寫字母拷貝給str,然后把小寫字母拷貝給str,但很不幸,程序運行的時候會發生段錯誤,因為當sscanf掃描到字符a時,違反了條件"%[A-Z]",sscanf就停止執行,不再掃描之后的字符,所以第二個條件也就沒有任何意義,這個實驗說明:不能使用%號兩次或兩次以上
實驗6:
sscanf("AAAaaaBBB","%*[A-Z]%[a-z]",str); ---------str的值為 "aaa\0!!!!!!"
這個實驗出現了一個新的符號:%*,與%相反,%*表示過濾滿足條件的字符,在這個實驗中,%*[A-Z]過濾了所有大寫字母,然后再使用%[a-z]把之后的小寫字母拷貝給str。如果只有%*,沒有%的話,sscanf不會拷貝任何字符到str,這時sscanf的作用僅僅是過濾字符串。
實驗7:
sscanf("AAAaaaBBB","%[a-z]",str); ---------str的值為 "!!!!!!!!!!"
做完前面幾個實驗后,我們都知道sscanf拷貝完成后,還會在str的后面加上一個null字符,但如果沒有一個字符滿足條件,sscanf不會在str 的后面加null字符,str的值依然是10個驚嘆號。這個實驗也說明了,如果不使用%*過濾掉前面不需要的字符,你永遠別想取得中間的字符。
實驗8:
sscanf("AAAaaaBC=","%*[A-Z]%*[a-z]%[^a-z=]",str); ---------str的值為 "BC\0!!!!!!!"
這是一個綜合實驗,但這個實驗的目的不是幫我們復習前面所學的知識,而是展示兩個值得注意的地方:
注意1:%只能使用一次,但%*可以使用多次,比如在這個實驗里面,先用%*[A-Z]過濾大寫字母,然后用%*[a-z]過濾小寫字母。
注意2:^后面可以帶多個條件,且這些條件都受^的作用,比如^a-z=表示^a-z且^=(既不是小寫字母,也不是等於號)。
實驗9:
int k;
sscanf("AAA123BBB456", "%*[^0-9]%i", &k); ---------k的值為123
首先,%*[^0-9]過濾前面非數字的字符,然后用%i把數字字符轉換成int型的整數,拷貝到變量k,注意參數必須使用k的地址。
