C語(yǔ)言進(jìn)階之字符串查找?guī)旌瘮?shù)詳解
strstr
查找strstr的文檔,可知它的原型為:
char *strstr( const char *string, const char *strCharSet );
它的返回值,根據(jù)文檔是這樣的:
Return Value
Each of these functions returns a pointer to the first occurrence of strCharSet in string, or NULL if strCharSet does not appear in string. If strCharSet points to a string of zero length, the function returns string.
可知會(huì)返回一個(gè)指針,指向目標(biāo)字符串在strCharSet中第一次出現(xiàn)的位置。如果沒有,就返回一個(gè)空指針。
簡(jiǎn)單地說,就是查找子字符串。
由于返回值是指針,那么接收返回值就要用指針類型來接收。
#include <stdio.h> #include <string.h> int main() { char arr1[] = "abbbcdbbcef"; char arr2[] = "bbc"; char* ret = strstr(arr1, arr2); if (ret == NULL) { printf("找不到\n"); } else { printf("%s\n", ret); } return 0; }
輸出結(jié)果如下:
如果我把a(bǔ)rr2改成bbcq,那么在arr1中找不到arr2,就會(huì)返回空指針:
現(xiàn)在來模擬實(shí)現(xiàn)strstr。
分為兩種情況。
情況1:
這種情況較為簡(jiǎn)單,arr1首先指向a,arr2指向b,a和b不相等,那么arr1指向下一個(gè)字符,此時(shí)arr2仍指向b,此時(shí)arr1和arr2指向的字符相等,那么arr2指向下一個(gè)字符,arr1也指向下一個(gè)字符,發(fā)現(xiàn)arr1和arr2指向的字符相等,那么arr2指向下一個(gè)字符,這時(shí)指向了\0,就停止了查找。
情況2:
arr1最開始指向a,arr2最開始指向b。
arr1和arr2所指向的字符不相等,那么arr1就指向下一個(gè)字符,arr2仍指向第一個(gè)b,此時(shí)arr1和arr2指向的字符相等,那么arr2指向下一個(gè)字符,arr1也指向下一個(gè)字符,發(fā)現(xiàn)arr1和arr2指向的字符相等,那么arr1和arr2繼續(xù)指向下一個(gè)字符,此時(shí)arr1和arr2分別所指向的字符不相等,而此時(shí)arr2也不能向前指了,那么就停止了查找。
顯而易見,這是有問題的!問題就在于第一個(gè)字符串里明明有第二個(gè)字符串的存在,卻沒有查找到。
正確的做法是,arr1指向出現(xiàn)的第二個(gè)b,arr2指向第一個(gè)字符,然后重新查找。
那么此時(shí)就需要有一些臨時(shí)變量,不要用arr1和arr2親自查找。
可以這樣來實(shí)現(xiàn)模擬strstr:
#include <string.h> #include <assert.h> char* my_strstr(const char* str1, const char* str2) { assert(str1 && str2); if (*str2 == '\0')//用于判斷srr2是不是空字符串 { return (char*)str1; } const char* s1 = NULL; const char* s2 = NULL; const char* cp = str1; while (*cp)//當(dāng)*cp為0時(shí)終止循環(huán) { s1 = cp; s2 = str2;//內(nèi)循環(huán)每次開始前s2都指向要查找的字符串首元素,s1指向被查找的字符串里下一個(gè)字符 while (*s1 !='\0' && *s2!='\0' && *s1 == *s2) { s1++; s2++;//只要字符串不結(jié)束并且指向的字符相等就循環(huán) } if (*s2 == '\0')//如果條件成立,說明找到了子字符串 { return (char*)cp; } cp++; } return NULL; }
strtok
這個(gè)函數(shù)不管是使用還是原理,都相當(dāng)獨(dú)特。其原型如下:
char *strtok( char *strToken, const char *strDelimit );
sep參數(shù)是個(gè)字符串,定義了用作分隔符的字符集合。
第一個(gè)參數(shù)指定一個(gè)字符串,它包含了0個(gè)或者多個(gè)由sep字符串中一個(gè)或者多個(gè)分隔符分割的標(biāo)
記。
strtok函數(shù)找到str中的下一個(gè)標(biāo)記,并將其用 \0 結(jié)尾,返回一個(gè)指向這個(gè)標(biāo)記的指針。(注:strtok函數(shù)會(huì)改變被其操作的字符串,所以在使用strtok函數(shù)切分的字符串一般都是臨時(shí)拷貝的內(nèi)容并且可修改。)
strtok函數(shù)的第一個(gè)參數(shù)不為 NULL ,函數(shù)將找到str中第一個(gè)標(biāo)記,strtok函數(shù)將保存它在字符串
中的位置。
strtok函數(shù)的第一個(gè)參數(shù)為 NULL ,函數(shù)將在同一個(gè)字符串中被保存的位置開始,查找下一個(gè)標(biāo)
記。
如果字符串中不存在更多的標(biāo)記,則返回 NULL 指針。
字符串superverybest@outlooks.net是由@和.切開的,@和.其實(shí)就是分隔符。那么要將superverybest、outlooks、net分隔開,可以這樣:
#include <stdio.h> #include <string.h> int main() { char arr[] = "superverybest@outlooks.net"; char* p = "@."; char buf[50] = { 0 }; strcpy(buf, arr); char* ret = NULL; for (ret = strtok(buf, p); ret != NULL; ret=strtok(NULL, p)) { printf("%s\n", ret); } return 0; }
輸出結(jié)果為:
總結(jié)
到此這篇關(guān)于C語(yǔ)言進(jìn)階之字符串查找?guī)旌瘮?shù)的文章就介紹到這了,更多相關(guān)C語(yǔ)言字符串查找?guī)旌瘮?shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++處理輸入字符串并轉(zhuǎn)為數(shù)組的操作
這篇文章主要介紹了C++處理輸入字符串并轉(zhuǎn)為數(shù)組的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-01-01C++中對(duì)象的動(dòng)態(tài)建立與釋放詳解及其作用介紹
這篇文章主要介紹了C++中對(duì)象的動(dòng)態(tài)建立與釋放詳解及其作用介紹,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-09-09詳解C語(yǔ)言內(nèi)核字符串轉(zhuǎn)換方法
在內(nèi)核開發(fā)模式下,初始化字符串也需要調(diào)用專用的初始化函數(shù),如下分別初始化ANSI和UNCODE字符串,本文我們就來看看代碼是如何實(shí)現(xiàn)的2022-09-09用C++實(shí)現(xiàn)SLR語(yǔ)法分析程序
大家好,本篇文章主要講的是用C++實(shí)現(xiàn)SLR語(yǔ)法分析程序,感興趣的同學(xué)趕緊來看一看吧,對(duì)你有幫助的話記得收藏一下2022-02-02