欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解KMP算法以及python如何實現(xiàn)

 更新時間:2020年09月18日 16:11:20   作者:MrDoghead  
這篇文章主要介紹了KMP算法的相關(guān)知識以及python如何實現(xiàn),幫助大家更好的進行數(shù)據(jù)分析,感興趣的朋友可以了解下

算法思路

Knuth-Morris-Pratt(KMP)算法是解決字符串匹配問題的經(jīng)典算法,下面通過一個例子來演示一下:

給定字符串"BBC ABCDAB ABCDABCDABDE",檢查里面是否包含另一個字符串"ABCDABD"。

1.從頭開始依次匹配字符,如果不匹配就跳到下一個字符

2.直到發(fā)現(xiàn)匹配字符,然后經(jīng)過一個內(nèi)循環(huán)嚴查字符串是否匹配

 

3.發(fā)現(xiàn)最后一個D不匹配,下面就該思考應(yīng)該把字符串向右移動多少個位置呢?傳統(tǒng)做法可能是移動一格,KMP算法就創(chuàng)新在這里。KMP算法通過查詢一個Partial Match Table(表內(nèi)存有字符串信息),然后計算出需要移動的步數(shù),這個表后面會介紹怎么來的。

這里我們看到D前面是B,查表得到第二個B對應(yīng)的是2,所以 移動數(shù) = 已匹配字符數(shù) - 查表所得數(shù) 也就是 6 - 2 = 4, 需要向右移動四格。

下面也是重復(fù)這個步驟

直到發(fā)現(xiàn)匹配或者字符長度超出(未發(fā)現(xiàn)匹配)。

Partial Match Table

那么這個查詢的表是怎么來的呢?仍然以"ABCDABD"為例

- "A"的前綴和后綴都為空集,共有元素的長度為0;

- "AB"的前綴為[A],后綴為[B],共有元素的長度為0;

- "ABC"的前綴為[A, AB],后綴為[BC, C],共有元素的長度0;

- "ABCD"的前綴為[A, AB, ABC],后綴為[BCD, CD, D],共有元素的長度為0;

- "ABCDA"的前綴為[A, AB, ABC, ABCD],后綴為[BCDA, CDA, DA, A],共有元素為"A",長度為1;

- "ABCDAB"的前綴為[A, AB, ABC, ABCD, ABCDA],后綴為[BCDAB, CDAB, DAB, AB, B],共有元素為"AB",長度為2;

- "ABCDABD"的前綴為[A, AB, ABC, ABCD, ABCDA, ABCDAB],后綴為[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的長度為0。

python實現(xiàn)

def partial_table(p):
  '''''partial_table("ABCDABD") -> [0, 0, 0, 0, 1, 2, 0]'''
  prefix = set()
  res = [0]
  for i in range(1, len(p)):
    prefix.add(p[:i])
    postfix = {p[j:i + 1] for j in range(1, i + 1)}
    #print(p[:i+1],prefix,postfix,prefix & postfix or {''})
    res.append(len((prefix & postfix or {''}).pop()))
  return res

def kmp_match(s, p):
  m = len(s);
  n = len(p)
  cur = 0 # 起始指針cur
  table = partial_table(p)
  while cur <= m - n:   #只去匹配前m-n個
    for i in range(n):
      if s[i + cur] != p[i]:
        cur += max(i - table[i - 1], 1) # 有了部分匹配表,我們不只是單純的1位1位往右移,可以一次移動多位
        break
    else:    
      return True # loop從 break 中退出時,else 部分不執(zhí)行。
  return False

print partial_table1("ABCDABD")
print kmp_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD")

以上就是詳解KMP算法以及python如何實現(xiàn)的詳細內(nèi)容,更多關(guān)于python實現(xiàn)KMP算法的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • python 循環(huán)while和for in簡單實例

    python 循環(huán)while和for in簡單實例

    下面小編就為大家?guī)硪黄猵ython 循環(huán)while和for in簡單實例。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-08-08
  • Python實現(xiàn)bilibili時間長度查詢的示例代碼

    Python實現(xiàn)bilibili時間長度查詢的示例代碼

    這篇文章主要介紹了Python實現(xiàn)bilibili時間長度查詢的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-01-01
  • pytest-fixture簡介及其用法講解

    pytest-fixture簡介及其用法講解

    這篇文章主要介紹了pytest-fixture及其用法,最基本的用法就是一個fixture作為一個測試用例的參數(shù)傳入,然后就可以在該測試用例中使用該fixture,需要的朋友可以參考下
    2023-01-01
  • Pandas讀取excel合并單元格的正確方式(openpyxl合并單元格拆分并填充內(nèi)容)

    Pandas讀取excel合并單元格的正確方式(openpyxl合并單元格拆分并填充內(nèi)容)

    Excel文件中可能包含合并單元格的數(shù)據(jù),下面這篇文章主要給大家介紹了關(guān)于Pandas讀取excel合并單元格的正確方式,主要介紹的openpyxl合并單元格拆分并填充內(nèi)容,需要的朋友可以參考下
    2023-06-06
  • python實現(xiàn)指定ip端口掃描方式

    python實現(xiàn)指定ip端口掃描方式

    今天小編就為大家分享一篇python實現(xiàn)指定ip端口掃描方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • numpy 數(shù)組拷貝地址所引起的同步替換問題

    numpy 數(shù)組拷貝地址所引起的同步替換問題

    本文主要介紹了numpy 數(shù)組拷貝地址所引起的同步替換問題,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • python?遠程執(zhí)行命令的詳細代碼

    python?遠程執(zhí)行命令的詳細代碼

    有時會需要在遠程的機器上執(zhí)行一個命令,并獲得其返回結(jié)果。對于這種情況,python 可以很容易的實現(xiàn)。今天通過實例代碼介紹下python?遠程執(zhí)行命令的相關(guān)知識,感興趣的朋友一起看看吧
    2022-02-02
  • Python max函數(shù)中key的用法及原理解析

    Python max函數(shù)中key的用法及原理解析

    最近有童鞋向小編求助怎么樣找到字符串中出現(xiàn)字數(shù)最多的字符呢,其實最簡單的處理方法是使用max函數(shù),max()函數(shù)用于獲得給定的可迭代對象中的最大值,關(guān)于Python max函數(shù)key用法跟隨小編一起通過本文學(xué)習(xí)下吧
    2021-06-06
  • Python和Anaconda的版本對應(yīng)關(guān)系

    Python和Anaconda的版本對應(yīng)關(guān)系

    這篇文章主要為大家介紹了Python和Anaconda,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-06-06
  • Pandas常用的讀取和保存數(shù)據(jù)的函數(shù)使用(csv,mysql,json,excel)

    Pandas常用的讀取和保存數(shù)據(jù)的函數(shù)使用(csv,mysql,json,excel)

    本文主要介紹了Pandas常用的讀取和保存數(shù)據(jù)的函數(shù)使用,主要包括csv,mysql,json,excel這幾種方式,具有一定的參考價值,感興趣的可以了解一下
    2022-01-01

最新評論