最長(zhǎng)公共子字符串的使用分析
最長(zhǎng)公共子字符串共有兩種解決方法,下面具體說(shuō)說(shuō)我的思路
方法一:
Longest Common Substring和Longest Common Subsequence是有區(qū)別的
X = <a, b, c, f, b, c>
Y = <a, b, f, c, a, b>
X和Y的Longest Common Sequence為<a, b, c, b>,長(zhǎng)度為4
X和Y的Longest Common Substring為 <a, b>長(zhǎng)度為2
其實(shí)Substring問(wèn)題是Subsequence問(wèn)題的特殊情況,也是要找兩個(gè)遞增的下標(biāo)序列
<i1, i2, ...ik> 和 <j1, j2, ..., jk>使
xi1 == yj1
xi2 == yj2
......
xik == yjk
與Subsequence問(wèn)題不同的是,Substring問(wèn)題不光要求下標(biāo)序列是遞增的,還要求每次
遞增的增量為1, 即兩個(gè)下標(biāo)序列為:
<i, i+1, i+2, ..., i+k-1> 和 <j, j+1, j+2, ..., j+k-1>
類比Subquence問(wèn)題的動(dòng)態(tài)規(guī)劃解法,Substring也可以用動(dòng)態(tài)規(guī)劃解決,令
c[i][j]表示Xi和Yi的最大Substring的長(zhǎng)度,比如
X = <y, e, d, f>
Y = <y, e, k, f>
c[1][1] = 1
c[2][2] = 2
c[3][3] = 0
c[4][4] = 1
動(dòng)態(tài)轉(zhuǎn)移方程為:
如果xi == yj, 則 c[i][j] = c[i-1][j-1]+1
如果xi ! = yj, 那么c[i][j] = 0
最后求Longest Common Substring的長(zhǎng)度等于
max{ c[i][j], 1<=i<=n, 1<=j<=m}
完整的代碼如下:
/**
找出兩個(gè)字符串的最長(zhǎng)公共連續(xù)子串的長(zhǎng)度
** author :liuzhiwei
** data:2011-08-16
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
int longest_common_substring(char *str1, char *str2)
{
int i,j,k,len1,len2,max,x,y;
len1 = strlen(str1);
len2 = strlen(str2);
int **c = new int*[len1+1];
for(i = 0; i < len1+1; i++)
c[i] = new int[len2+1];
for(i = 0; i < len1+1; i++)
c[i][0]=0;//第0列都初始化為0
for(j = 0; j < len2+1; j++)
c[0][j]=0;//第0行都初始化為0
max = -1;
for(i = 1 ; i < len1+1 ; i++)
{
for(j = 1; j < len2+1; j++)
{
if(str1[i-1]==str2[j-1])//只需要跟左上方的c[i-1][j-1]比較就可以了
c[i][j]=c[i-1][j-1]+1;
else//不連續(xù)的時(shí)候還要跟左邊的c[i][j-1]、上邊的c[i-1][j]值比較,這里不需要
c[i][j]=0;
if(c[i][j]>max)
{
max=c[i][j];
x=i;
y=j;
}
}
}
//輸出公共子串
char s[1000];
k=max;
i=x-1,j=y-1;
s[k--]='\0';
while(i>=0 && j>=0)
{
if(str1[i]==str2[j])
{
s[k--]=str1[i];
i--;
j--;
}
else //只要有一個(gè)不相等,就說(shuō)明相等的公共字符斷了,不連續(xù)了
break;
}
printf("最長(zhǎng)公共子串為:");
puts(s);
for(i = 0; i < len1+1; i++)//釋放動(dòng)態(tài)申請(qǐng)的二維數(shù)組
delete[] c[i];
delete[] c;
return max;
}
int main(void)
{
char str1[1000],str2[1000];
printf("請(qǐng)輸入第一個(gè)字符串:");
gets(str1);
printf("請(qǐng)輸入第二個(gè)字符串:");
gets(str2);
int len = longest_common_substring(str1, str2);
printf("最長(zhǎng)公共連續(xù)子串的長(zhǎng)度為:%d\n",len);
system("pause");
return 0;
}
效果圖如下:
將字符串s1和s2分別寫在兩把直尺上面(我依然用s1,s2來(lái)表示這兩把直尺),然后將s1固定,s2的頭部和s1的尾部對(duì)齊,然后逐漸移動(dòng)直尺s2,比較重疊部分的字符串中的公共子串的長(zhǎng)度,直到直尺s2移動(dòng)到s1的頭部。在這個(gè)過(guò)程中求得的最大長(zhǎng)度就是s1、s2最大子串的長(zhǎng)度。
下圖是求解過(guò)程的圖示(下圖有點(diǎn)錯(cuò)誤,應(yīng)該是將s2從右往左移動(dòng)),藍(lán)色部分表示重疊的字符串,紅色的部分表示重疊部分相同的子串
其中s1="shaohui",s2="ahui",最后求得的結(jié)果為3
/**
找出兩個(gè)字符串的最長(zhǎng)公共連續(xù)子串的長(zhǎng)度
** author :liuzhiwei
** data :2011-08-16
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
int longest_common_substring(char *str1, char *str2)
{
int i,len1,len2,len,s1_start,s2_start,idx,curmax,max;
len1 = strlen(str1);
len2 = strlen(str2);
len = len1 + len2;
max = 0;
for(i = 0 ; i < len ; i++)
{
s1_start = s2_start = 0;
if(i < len1)
s1_start = len1 - i; //每次開(kāi)始匹配的起始位置
else
s2_start = i - len1;
curmax = 0;
for(idx = 0 ; ( s1_start + idx < len1 ) && ( s2_start + idx < len2 ); idx++ )
{
if(str1[s1_start+idx]==str2[s2_start+idx])
curmax++;
else //只要有一個(gè)不相等,就說(shuō)明相等的公共字符斷了,不連續(xù)了,要保存curmax與max中的最大值,并將curmax重置為0
{
max = curmax > max ? curmax : max;
curmax = 0;
}
}
max = curmax > max ? curmax : max;
}
return max;
}
int main(void)
{
char str1[1000],str2[1000];
printf("請(qǐng)輸入第一個(gè)字符串:");
gets(str1);
printf("請(qǐng)輸入第二個(gè)字符串:");
gets(str2);
int len = longest_common_substring(str1, str2);
printf("最長(zhǎng)公共連續(xù)子串的長(zhǎng)度為:%d\n",len);
system("pause");
return 0;
}
效果圖如下:
/**
找出兩個(gè)字符串的最長(zhǎng)公共連續(xù)子串的長(zhǎng)度
** author :liuzhiwei
** data :2011-08-16
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
int longest_common_substring(char *str1, char *str2)
{
int i,k,len1,len2,len,s1_start,s2_start,idx,curmax,max;
len1 = strlen(str1);
len2 = strlen(str2);
len = len1 + len2;
max = 0;
for(i = 0 ; i < len ; i++)
{
s1_start = s2_start = 0;
if(i < len1)
s1_start = len1 - i; //每次開(kāi)始匹配的起始位置
else
s2_start = i - len1;
curmax = 0;
for(idx = 0 ; ( s1_start + idx < len1 ) && ( s2_start + idx < len2 ); idx++ )
{
if(str1[s1_start+idx]==str2[s2_start+idx])
curmax++;
else //只要有一個(gè)不相等,就說(shuō)明相等的公共字符斷了,不連續(xù)了,要保存curmax與max中的最大值,并將curmax重置為0
{
//max = curmax > max ? curmax : max;
if(curmax > max)
{
max = curmax;
k = s1_start+idx-1; //保存連續(xù)子串長(zhǎng)度增加時(shí)連續(xù)子串最后一個(gè)字符在str1字符串中的下標(biāo)位置,便于輸出公共連續(xù)子串
}
curmax = 0;
}
}
//max = curmax > max ? curmax : max;
if(curmax > max)
{
max = curmax;
k = s1_start+idx-1;
}
}
//輸出公共子串
char s[1000];
for(i=0;i<max;i++)
s[i]=str1[k-max+1+i]; //公共字串在str1中的下標(biāo)起始位置為k-max+1,結(jié)束位置為k
s[i]='\0';
printf("最長(zhǎng)公共子串為:");
puts(s);
return max;
}
int main(void)
{
char str1[1000],str2[1000];
printf("請(qǐng)輸入第一個(gè)字符串:");
gets(str1);
printf("請(qǐng)輸入第二個(gè)字符串:");
gets(str2);
int len = longest_common_substring(str1, str2);
printf("最長(zhǎng)公共連續(xù)子串的長(zhǎng)度為:%d\n",len);
system("pause");
return 0;
}
效果圖如下:
題目意思是要搜索最長(zhǎng)的子串
給出一系列字符串,幾個(gè)子串可以是反串
rose
orchid
這里最長(zhǎng)的子串是 ro 跟or 長(zhǎng)度為2。
如果窮舉搜索的話,肯定過(guò)不了。
所以可以找出所有字符串中最短的串,枚舉最短的字符串的子串
判斷是否都是別的字符串的子串,求出最大長(zhǎng)度即可。。
/**
找出兩個(gè)字符串的最長(zhǎng)公共連續(xù)子串的長(zhǎng)度
** author :liuzhiwei
** data :2011-08-16
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
char str[100][100];
int k;
int match(int start,int end,int n) //最短字符串中的起點(diǎn)下標(biāo)、終點(diǎn)下標(biāo),字符串總數(shù)
{
int i,j,len,p,h;
for(i=0;i<n;i++)
{
if(i==k)
continue;
len=strlen(str[i]);
for(j=0;j<=len-1-end+start;j++) //str[i]字符串可以組成len-1-end+start個(gè)長(zhǎng)度為end-start的連續(xù)子串
{
for(p=start,h=j;p<=end;p++,h++) //順序判斷子串
{
if(str[k][p]!=str[i][h]) //不等即跳出
break;
}
if(p>end) //如果全部相等,則匹配成功,終止
break;
for(p=end,h=j;p>=start;p--,h++) //逆序判斷子串
{
if(str[k][p]!=str[i][h]) //不等即跳出
break;
}
if(p<start) //如果全部相等,則匹配成功,終止
break;
}
if(j>len-1-end+start) //如果搜索完畢都沒(méi)終止,即無(wú)匹配
return 0;
}
return 1;
}
int main(void)
{
int t,i,j,n,len,minlen,flag;
scanf("%d",&t);
while(t--)
{
minlen=1000,flag=0;
scanf("%d",&n);
for(i=0;i<n;i++)
{
scanf("%s",str[i]);
len = strlen(str[i]);
if(len<minlen)
{
minlen=len; //保存最短字符串的長(zhǎng)度
k=i; //保存最短字符串的序號(hào)
}
}
for(i=0;i<minlen;i++) //對(duì)最短字符串的連續(xù)字串進(jìn)行匹配查找
{
for(j=0;j<=i;j++)
{
if(match(j,j+minlen-1-i,n)) //子串是否匹配
{
flag=1;
break;
}
}
if(flag==1)
break;
}
printf("%d\n",minlen-i);
}
system("pause");
return 0;
}
相關(guān)文章
C語(yǔ)言實(shí)現(xiàn)直角坐標(biāo)轉(zhuǎn)換為極坐標(biāo)的方法
這篇文章主要介紹了C語(yǔ)言實(shí)現(xiàn)直角坐標(biāo)轉(zhuǎn)換為極坐標(biāo)的方法,涉及C語(yǔ)言進(jìn)行三角函數(shù)與數(shù)值運(yùn)算相關(guān)操作技巧,需要的朋友可以參考下2017-09-09C++?opencv圖像處理實(shí)現(xiàn)圖像腐蝕和膨脹示例
這篇文章主要為大家介紹了C++?opencv圖像處理實(shí)現(xiàn)圖像腐蝕和圖像膨脹示例代碼,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05c語(yǔ)言通過(guò)opencv實(shí)現(xiàn)輪廓處理與切割
這篇文章主要介紹了c語(yǔ)言通過(guò)opencv實(shí)現(xiàn)輪廓處理與切割,具有一定借鑒價(jià)值,需要的朋友可以參考下2018-01-01C語(yǔ)言使用mciSendString實(shí)現(xiàn)播放音樂(lè)功能
mciSendString?支持?mp3、wma、wav、mid?等多種媒體格式,使用非常簡(jiǎn)單。這篇文章就來(lái)為大家介紹一下C語(yǔ)言如何使用mciSendString實(shí)現(xiàn)播放音樂(lè)功能,需要的可以參考一下2023-02-02C++實(shí)現(xiàn)四則運(yùn)算器(無(wú)括號(hào))
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)四則運(yùn)算器,無(wú)括號(hào)的計(jì)算器,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-11-11使用C++和Crypto++庫(kù)實(shí)現(xiàn)AES加密與解密
在這篇博客中,我們將深入探討如何利用C++和Crypto++庫(kù)實(shí)現(xiàn)高效且安全的AES加密與解密機(jī)制,Crypto++是一款高度認(rèn)可的免費(fèi)C++類庫(kù),文中通過(guò)代碼示例介紹的非常詳細(xì),具有一定的參考價(jià)值,需要的朋友可以參考下2024-01-01C語(yǔ)言實(shí)現(xiàn)猜數(shù)字大小的游戲
這篇文章主要為大家詳細(xì)介紹了C語(yǔ)言實(shí)現(xiàn)猜數(shù)字大小的游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-01-01C++事件處理中__event與__raise關(guān)鍵字的用法講解
這篇文章主要介紹了C++事件處理中__event與__raise關(guān)鍵字的用法,是C++入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2016-01-01