詳解Java中KMP算法的圖解與實現(xiàn)
圖解
kmp算法跟之前講的bm算法思想有一定的相似性。之前提到過,bm算法中有個好后綴的概念,而在kmp中有個好前綴的概念,什么是好前綴,我們先來看下面這個例子。
觀察上面這個例子,已經(jīng)匹配的abcde稱為好前綴,a與之后的bcde都不匹配,所以沒有必要再比一次,直接滑動到e之后即可。
那如果好前綴中有互相匹配的字符呢?
觀察上面這個例子,這個時候如果我們直接滑到好前綴之后,則會過度滑動,錯失匹配子串。那我們?nèi)绾胃鶕?jù)好前綴來進行合理滑動?
其實就是看當(dāng)前的好前綴的前綴和后綴是否有匹配的,找到最長匹配長度,直接滑動。鑒于不止一次找最長匹配長度,我們完全可以先初始化一個數(shù)組,保存在當(dāng)前好前綴情況下,最長匹配長度是多少,這時候我們的next數(shù)組就出來了。
我們定義一個next數(shù)組,表示在當(dāng)前好前綴下,好前綴的前綴和后綴的最長匹配子串長度,這個最長匹配長度表示這個子串之前已經(jīng)匹配過匹配了,不需要再次進行匹配,直接從子串的下一個字符開始匹配。
我們是否每次算next[i]時都需要每一個字符進行匹配,是否可以根據(jù)next[i - 1]進行推導(dǎo)以便減少不必要的比較。
帶著這個思路我們來看看下面的步驟:
假設(shè)next[i - 1] = k - 1;
如果modelStr[k] = modelStr[i] 則next[i]=k
如果modelStr[k] != modelStr[i],我們是否可以直接認(rèn)定next[i] = next[i - 1]?
通過上面這個例子,我們可以很清晰的看到,next[i]!=next[i-1],那當(dāng)modelStr[k]!=modelStr[i]時候,我們已知next[0],next[1]…next[i-1],如何推倒出next[i]呢?
假設(shè)modelStr[x…i]是前綴后綴能匹配的最長后綴子串,那么最長匹配前綴子串為modelStr[0…i-x]
我們在求這個最長匹配串的時候,他的前面的次長匹配串(不包含當(dāng)前i的),也就是modelStr[x…i-1]在之前應(yīng)該是已經(jīng)求解出來了的,因此我們只需要找到這個某一個已經(jīng)求解的匹配串,假設(shè)前綴子串為modelStr[0…i-x-1],后綴子串為modelStr[x…i-1],且modelStr[i-x] == modelStr[i],這個前綴后綴子串即為次前綴子串,加上當(dāng)前字符即為最長匹配前綴后綴子串。
代碼實現(xiàn)
首先在kmp算法中最主要的next數(shù)組,這個數(shù)組標(biāo)志著截止到當(dāng)前下標(biāo)的最長前綴后綴匹配子串字符個數(shù),kmp算法里面,如果某個前綴是好前綴,即與模式串前綴匹配,我們就可以利用一定的技巧不止向前滑動一個字符,具體看前面的講解。我們提前不知道哪些是好前綴,并且匹配過程不止一次,因此我們在最開始調(diào)用一個初始化方法,初始化next數(shù)組。
1.如果上一個字符的最長前綴子串的下一個字符==當(dāng)前字符,上一個字符的最長前綴子串直接加上當(dāng)前字符即可
2.如果不等于,需要找到之前存在的最長前綴子串的下一個字符等于當(dāng)前子串的,然后設(shè)置當(dāng)前字符子串的最長前綴后綴子串
int[] next ; /** * 初始化next數(shù)組 * @param modelStr */ public void init(char[] modelStr) { //首先計算next數(shù)組 //遍歷modelStr,遍歷到的字符與之前字符組成一個串 next = new int[modelStr.length]; int start = 0; while (start < modelStr.length) { next[start] = this.recursion(start, modelStr); ++ start; } } /** * * @param i 當(dāng)前遍歷到的字符 * @return */ private int recursion(int i, char[] modelStr) { //next記錄的是個數(shù),不是下標(biāo) if (0 == i) { return 0; } int last = next[i -1]; //沒有匹配的,直接判斷第一個是否匹配 if (0 == last) { if (modelStr[last] == modelStr[i]) { return 1; } return 0; } //如果last不為0,有值,可以作為最長匹配的前綴 if (modelStr[last] == modelStr[i]) { return next[i - 1] + 1; } //當(dāng)next[i-1]對應(yīng)的子串的下一個值與modelStr不匹配時,需要找到當(dāng)前要找的最長匹配子串的次長子串 //依據(jù)就是次長子串對應(yīng)的子串的下一個字符==modelStr[i]; int tempIndex = i; while (tempIndex > 0) { last = next[tempIndex - 1]; //找到第一個下一個字符是當(dāng)前字符的匹配子串 if (modelStr[last] == modelStr[i]) { return last + 1; } -- tempIndex; } return 0; }
然后開始利用next數(shù)組進行匹配,從第一個字符開始匹配進行匹配,找到第一個不匹配的字符,這時候之前的都是匹配的,接下來先判斷是否已經(jīng)是完全匹配,是直接返回,不是,判斷是否第一個就不匹配,是直接往后面匹配。如果有好前綴,這時候就利用到了next數(shù)組,通過next數(shù)組知道當(dāng)前可以從哪個開始匹配,之前的都不用進行匹配。
public int kmp(char[] mainStr, char[] modelStr) { //開始進行匹配 int i = 0, j = 0; while (i + modelStr.length <= mainStr.length) { while (j < modelStr.length) { //找到第一個不匹配的位置 if (modelStr[j] != mainStr[i]) { break; } ++ i; ++ j; } if (j == modelStr.length) { //證明完全匹配 return i - j; } //走到這里找到的是第一個不匹配的位置 if (j == 0) { ++ i; continue; } //從好前綴后一個匹配 j = next[j - 1]; } return -1; }
到此這篇關(guān)于詳解Java中KMP算法的圖解與實現(xiàn)的文章就介紹到這了,更多相關(guān)Java KMP算法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Go?Java算法之為運算表達式設(shè)計優(yōu)先級實例
這篇文章主要為大家介紹了Go?Java算法之為運算表達式設(shè)計優(yōu)先級實例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-08-08Java 8中Stream API的這些奇技淫巧!你Get了嗎?
這篇文章主要介紹了Java 8中Stream API的這些奇技淫巧!你Get了嗎?文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08關(guān)于synchronized的參數(shù)及其含義
這篇文章主要介紹了synchronized的參數(shù)及其含義詳解,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-10-10Java使用黑盒方式模擬實現(xiàn)內(nèi)網(wǎng)穿透
這篇文章主要介紹了Java使用黑盒方式模擬實現(xiàn)內(nèi)網(wǎng)穿透,內(nèi)網(wǎng)穿透,也即 NAT 穿透,進行 NAT 穿透是為了使具有某一個特定源 IP 地址和源端口號的數(shù)據(jù)包不被 NAT 設(shè)備屏蔽而正確路由到內(nèi)網(wǎng)主機,需要的朋友可以參考下2023-05-05關(guān)于@ComponentScan注解的用法及作用說明
這篇文章主要介紹了關(guān)于@ComponentScan注解的用法及作用說明,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-09-09