C語言中sscanf()函數(shù)的字符串格式化用法
介紹
sscanf()為C語言標(biāo)準(zhǔn)庫函數(shù),用于從指定字符串中讀入與指定格式相符的數(shù)據(jù)。函數(shù)原型聲明在stdio.h頭文件中:
int sscanf(const char *str, const char *format, ...);
該函數(shù)根據(jù)參數(shù)format
(格式化字符串)來轉(zhuǎn)換參數(shù)str指向的字符串,轉(zhuǎn)換后的結(jié)果存于對(duì)應(yīng)的可變參數(shù)內(nèi)。其返回值為按照指定格式轉(zhuǎn)換符成功讀入且賦值的可變參數(shù)數(shù)目(若發(fā)生匹配錯(cuò)誤而部分成功,該數(shù)目會(huì)小于指定的參數(shù)數(shù)目,甚至為0)。若首次成功轉(zhuǎn)換或錯(cuò)誤匹配發(fā)生前輸入已結(jié)束(如str為空字符串),則返回EOF。發(fā)生讀取錯(cuò)誤時(shí)也返回EOF,且設(shè)置錯(cuò)誤碼errno(如format
為空指針時(shí)返回EOF并設(shè)置errno為EINVAL)。可見,通過比較該函數(shù)的返回值與指定的可變參數(shù)數(shù)目,可判斷格式轉(zhuǎn)換是否成功。
format
可為一個(gè)或多個(gè){%[*] [width] [{h | l | L}]type | ' ' | '\t' | '\n' | 非%符號(hào)}
格式轉(zhuǎn)換符。集合中{a|b|c}
表示格式符a、b、c任選其一。以中括號(hào)括起來的格式符可選。%與type為必選,所有格式符必須以%開頭。
以下簡(jiǎn)要說明各格式符的含義:
1) 賦值抑制符'*'表明按照隨后的轉(zhuǎn)換符指示來讀取輸入,但將其丟棄不予賦值(“跳過”)。抑制符無需相應(yīng)的指針可變參數(shù),該轉(zhuǎn)換也不計(jì)入函數(shù)返回的成功賦值次數(shù)。%*[width] [{h | l | L}]type
表示滿足該條件的字符被過濾掉,不會(huì)向目標(biāo)參數(shù)中賦值。
2) width
表示最大讀取寬度。當(dāng)讀入字符數(shù)超過該值,或遇到不匹配的字符時(shí),停止讀取。多數(shù)轉(zhuǎn)換丟棄起始的空白字符。這些被丟棄的字符及轉(zhuǎn)換結(jié)果添加的空結(jié)束符('\0')均不計(jì)入最大讀取寬度。
3) {h | l | L}
為類型修飾符。h指示輸入的數(shù)字?jǐn)?shù)值以short int
或unsigned short int
類型存儲(chǔ);hh
指示輸入以signed char
或unsigned char
類型存儲(chǔ)。l(小寫L)指示輸入以long int
、unsigned long int
或double
類型存儲(chǔ),若與%c或%s結(jié)合則指示輸入以寬字符或?qū)捵址鎯?chǔ);ll等同L。L指示輸入以long long
類型存儲(chǔ)。
4) type
為類型轉(zhuǎn)換符,如%s、%d。
此外,還有兩種特殊的格式符:
1) []:字符集合。[]表示指定的字符集合匹配非空的字符序列;^則表示過濾。該操作不會(huì)跳過空白字符(空格、制表或換行符),因此可用于目標(biāo)字符串不以空白字符分隔時(shí)。[]內(nèi)可有一到多個(gè)非^字符(含連字符'-'),且無順序要求。%[a-z]表示匹配a到z之間的任意字符,%[aB-]匹配a、B、-中的任一字符;%[^a]則匹配非a的任意字符,即獲取第一個(gè)a之前的(不為a的)所有字符。^可作用于多個(gè)條件,如^a-z=表示^a-z且^=(既非小寫字母亦非等號(hào))??兆址?[]和%[^]會(huì)導(dǎo)致不可預(yù)知的結(jié)果。
使用[]時(shí)接收輸入的參數(shù)必須是有足夠存儲(chǔ)空間的char、signed char
或unsigned char
數(shù)組。[]也是轉(zhuǎn)換符,故%[]后無s。
%[^]的含義和用法與正則表達(dá)式相同,故sscanf
函數(shù)某種程度上提供了簡(jiǎn)單的正則表達(dá)式功能。
2) n:至此已讀入值(未必賦值)的等價(jià)字符數(shù),該數(shù)目必須以int類型存儲(chǔ)。如"10,22"經(jīng)過"%d%*[^0-9]%n"格式轉(zhuǎn)換后,%n對(duì)應(yīng)的參數(shù)值為3(雖然','未參與賦值)。
'n'并非轉(zhuǎn)換符,盡管它可用'*'抑制。C標(biāo)準(zhǔn)聲稱,執(zhí)行%n指令并不增加函數(shù)返回的賦值次數(shù);但其勘誤表中的描述與之矛盾。建議不要假設(shè)%n對(duì)返回值的影響。
下表列舉sscanf函數(shù)常見的格式化用法:
此外,還有如下幾種用法:
【例1】讀入一行字符串
因字符串可能含空白字符,故不能直接使用%s;而gets
函數(shù)存在溢出風(fēng)險(xiǎn),不推薦使用。此時(shí),可使用sscanf
函數(shù),格式化字符串設(shè)為"%[^\n]%*c"。%*c用于跳過換行符\n,以便再次讀入下一行。
【例2】提取"Name = Yuan"中的"Name"
若行首有空白字符,可用"%*[ \t]%[^= \t]"
格式串;
若不確定行首有無空白字符,可先跳過空白字符:
char szName[] = "Name = Yuan"; char szResBuf[32] = {0}; sscanf(szName+strspn(szName," \t"), "%[^= \t]", szResBuf);
【例3】分解URL
普通實(shí)現(xiàn)如下所示:
/***************************************************************************** * 函數(shù)名稱:OaSplitPwFarEndIpInfo * 功能描述:將遠(yuǎn)端IP信息分解為目的IP地址和端口號(hào) * 注意事項(xiàng):遠(yuǎn)端IP信息應(yīng)形如'udp://192.168.100.221:5000' *****************************************************************************/ static FUNC_STATUS OaSplitPwFarEndIpInfo(INT8U *pucFarEndIpInfo, INT32U *dwDstUdpPort, INT8U *pucDstIpAddr) { FUNC_STATUS retCode = S_OK; INT8U strUdpHead[] = "udp://"; INT8U ucUdpUrlLen = strlen(strUdpHead); INT8U ucIndex = 0; CHECK_TRIPLE_POINTER(pucFarEndIpInfo, dwDstUdpPort, pucDstIpAddr, S_NULL_POINTER); if(strncasecmp(pucFarEndIpInfo, strUdpHead, ucUdpUrlLen) != 0) { OmciLog(LOG_CES,"[%s]Cannot Parse FarEndIpInfo(%s)!\n\r", __FUNCTION__, pucFarEndIpInfo); return S_ERROR; } INT8U ucMaxUrlLen = ucUdpUrlLen + STR_IPV4_MAX_LEN; //避免未配置端口時(shí)陷入死循環(huán)(infinite loop) for(ucIndex = 0; (pucFarEndIpInfo[ucUdpUrlLen] != ':') && (ucUdpUrlLen < ucMaxUrlLen); ucIndex++) { pucDstIpAddr[ucIndex] = pucFarEndIpInfo[ucUdpUrlLen++]; } pucDstIpAddr[ucIndex] = '\0'; *dwDstUdpPort = strtoul(&pucFarEndIpInfo[ucUdpUrlLen+1], NULL, 10); return retCode; }
使用sscanf格式化則更為簡(jiǎn)單:
char szUrl[] = "udp://192.168.100.221:5000"; char szProt[4] = {0}, szIp[32] = {0}; unsigned int dwPort = 0; sscanf(szUrl, "%[^://]%*c%*c%*c%[^:]%*c%d", szProt, szIp, &dwPort); printf("szProt=%s, szIp=%s, dwPort=%d\n", szProt, szIp, dwPort);
【例4】提取數(shù)字
char szDig[]="10,22m,Z86,,880;555:666."; int dwIdx = 0, dwVal = 0, dwSize = 0; while(1 == sscanf(szDig+dwIdx, "%d%*[^0-9]%n", &dwVal, &dwSize)) { dwIdx += dwSize; printf("dwIdx=%d, dwSize=%d, dwVal=%d\n", dwIdx, dwSize, dwVal); }
上述實(shí)現(xiàn)稍加改造,即可用于處理某種字符分隔的數(shù)字串。
總結(jié)
綜上,對(duì)于簡(jiǎn)單的字符串分析,采用sscanf函數(shù)處理比較簡(jiǎn)潔。若字符串比較復(fù)雜,則可借助相應(yīng)的正則表達(dá)式庫。需要注意,sscanf格式化的目的是“截取”,而正則表達(dá)式的目的是“匹配”,不能完全等同。
以上就是本文的全部?jī)?nèi)容改了,希望對(duì)大家的學(xué)習(xí)能有所幫助,如果疑問的話歡迎大家留言討論。
相關(guān)文章
C++實(shí)現(xiàn)掃雷小游戲(控制臺(tái))
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)掃雷小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-05-05Qt使用QCamera實(shí)現(xiàn)切換相機(jī),分辨率和圖像捕獲功能
這篇文章主要為大家介紹了如何利用Qt中的相機(jī)類QCamera,取景器類QCameraViewfinder,圖像捕獲類QCameraImageCapture實(shí)現(xiàn)切換相機(jī)、分辨率和圖像捕獲功能,需要的可以了解一下2023-04-04實(shí)戰(zhàn)開發(fā)為單片機(jī)的按鍵加一個(gè)鎖防止多次觸發(fā)的細(xì)節(jié)
今天小編就為大家分享一篇關(guān)于實(shí)戰(zhàn)開發(fā)為單片機(jī)的按鍵加一個(gè)鎖防止多次觸發(fā)的細(xì)節(jié),小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2018-12-12C++實(shí)現(xiàn)LeetCode(63.不同的路徑之二)
這篇文章主要介紹了C++實(shí)現(xiàn)LeetCode(63.不同的路徑之二),本篇文章通過簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-07-07