PHP levenshtein() 函數(shù)
定義和用法
levenshtein() 函數(shù)返回兩個字符串之間的 Levenshtein 距離。
Levenshtein 距離,又稱編輯距離,指的是兩個字符串之間,由一個轉(zhuǎn)換成另一個所需的最少編輯操作次數(shù)。許可的編輯操作包括將一個字符替換成另一個字符,插入一個字符,刪除一個字符。
例如把 kitten 轉(zhuǎn)換為 sitting:
- sitten (k→s)
- sittin (e→i)
- sitting (→g)
levenshtein() 函數(shù)給每個操作(替換、插入和刪除)相同的權(quán)重。不過,您可以通過設(shè)置可選的 insert、replace、delete 參數(shù),來定義每個操作的代價。
語法
levenshtein(string1,string2,insert,replace,delete)
參數(shù) | 描述 |
---|---|
string1 | 必需。要對比的第一個字符串。 |
string2 | 必需。要對比的第二個字符串。 |
insert | 可選。插入一個字符的代價。默認(rèn)是 1。 |
replace | 可選。替換一個字符的代價。默認(rèn)是 1。 |
delete | 可選。刪除一個字符的代價。默認(rèn)是 1。 |
提示和注釋
注釋:如果其中一個字符串超過 255 個字符,levenshtein() 函數(shù)返回 -1。
注釋:levenshtein() 函數(shù)對大小寫不敏感。
注釋:levenshtein() 函數(shù)比 similar_text() 函數(shù)更快。不過,similar_text() 函數(shù)提供需要更少修改的更精確的結(jié)果。
例子
<?php echo levenshtein("Hello World","ello World"); echo "<br />"; echo levenshtein("Hello World","ello World",10,20,30); ?>
輸出:
1 30