Java?String源碼contains題解重復疊加字符串匹配
原題
解題思路
解題思路已經(jīng)寫在代碼中了;
class Solution { public: bool contain(string &a, string &b, long long hash_b) { for (int i = 0; i <= a.size() - b.size(); i++) { int k = 0; long long hash_a = 0; while (k < b.size()) { hash_a = (hash_a * 26 + a[i + k] - 'a') % INT32_MAX; k++; } if (hash_b == hash_a) return true; } return false; } int repeatedStringMatch(string a, string b) { // 1、統(tǒng)計a每個字符出現(xiàn)次數(shù)、b每個字符出現(xiàn)次數(shù),如果b有某字符而a沒有,返回-1 vector<int> rec_a(30, 0); vector<int> rec_b(30, 0); for (char c : a) { rec_a[c - 'a']++; } long long hash_b = 0; int i = 0; for (char c : b) { hash_b = (hash_b * 26 + c - 'a') % INT32_MAX; rec_b[c - 'a']++; } for (int i = 0; i < 30; i++) { if (rec_b[i] > 0 && rec_a[i] == 0) { return -1; } } // 2.1 本身b就是a的字串,用hash if (a.size() >= b.size() && contain(a, b, hash_b)) { return 1; } // 2.2 最大重疊不超過Bsize/Asize + 2 string aa = a; for (int i = 2; i <= b.size() / a.size() + 2; i++) { aa += a; if (aa.size() < b.size()) continue; if (contain(aa, b, hash_b)) { return i; } } return -1; } };
但是C++畢竟沒有類似Java的contains函數(shù),所以檢查a字符串是否包含b就沒有那么方便,我這里自己實現(xiàn)的是利用hash來檢測,其實可以優(yōu)化一下:
- 先計算前面b.size()個字符的hash值;
- 比較是否等于目標hash值
- 如果不等于,
(當前hash值-(當前窗口首字符-'a')*26^k)*26 + 窗口右移新加進來的字符-'a'
; - 這樣只用完整的遍歷一遍 字符串a(chǎn) 就能夠知道它 有沒有包含 子串b,復雜度為 O(n);但是涉及到之前的取余操作,又要額外考慮下,當前窗口的hash值是不是取過余;
- 而如果每次都一個個字符比,那么復雜度達到O(nm);
Java String contains 函數(shù)
于是對 Java String 里面的 contains 函數(shù)很好奇,它內(nèi)部怎么實現(xiàn)的,就翻了下源碼,如下:
// String.contails(String s): // 返回this字符串是否包含 子串s public boolean contains(CharSequence s) { return this.indexOf(s.toString()) >= 0; }
// String.indexOf(String s) // 返回this字符串中子串s的首字符索引 ........ // 中間的幾個函數(shù)就省略了,都是一些特殊情況(比如this字符串的長度小于s字符串的長度,直接返回-1這種), // 最后實現(xiàn)是在這個函數(shù)里 public static int indexOfLatin1Unsafe(byte[] src, int srcCount, byte[] tgt, int tgtCount, int fromIndex) { assert fromIndex >= 0; assert tgtCount > 0; assert tgtCount <= tgt.length; assert srcCount >= tgtCount; // 目標字符串的第一個字符 char first = (char)(tgt[0] & 255); // 最多找max次 int max = srcCount - tgtCount; // 從fromIndex處開始找 for(int i = fromIndex; i <= max; ++i) { // 如果該字符不等于first,接著i++,直到找到與first字符相等 if (getChar(src, i) != first) { do { ++i; } while(i <= max && getChar(src, i) != first); } if (i <= max) { int j = i + 1; int end = j + tgtCount - 1; // 一個個字符逐個比較 for(int k = 1; j < end && getChar(src, j) == (tgt[k] & 255); ++k) { ++j; } // 如果j==end 說明全部遍歷完都符合條件,返回首字符位置i if (j == end) { return i; } } } return -1; }
可以看出 Java String 的 contains 方法 原理還是用的逐個字符比較,沒有用別的效果稍微高但很復雜的方法;
以上就是Java String源碼contains題解重復疊加字符串匹配的詳細內(nèi)容,更多關(guān)于Java String源碼contains的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
使用java web 在jsp文件及Class中連接MySQL和SQLserver 的驅(qū)動方法
這篇文章主要介紹了使用java web 在jsp文件及Class中連接MySQL和SQLserver的驅(qū)動方法的相關(guān)資料,本文介紹的非常詳細,具有參考借鑒價值,需要的朋友可以參考下2016-10-10Java使用modbus-master-tcp實現(xiàn)modbus tcp通訊
這篇文章主要為大家詳細介紹了另外一種Java語言的modbux tcp通訊方案,那就是modbus-master-tcp,文中的示例代碼講解詳細,需要的可以了解下2023-12-12SpringBoot項目使用slf4j的MDC日志打點功能(最新推薦)
這篇文章主要介紹了SpringBoot項目使用slf4j的MDC日志打點功能,本文通過示例代碼給大家介紹非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-06-06SpringBoot3使用?自定義注解+Jackson實現(xiàn)接口數(shù)據(jù)脫敏的步驟
本文介紹了一種以優(yōu)雅的方式實現(xiàn)對接口返回的敏感數(shù)據(jù),如手機號、郵箱、身份證等信息的脫敏處理,這種方法也是企業(yè)常用方法,話不多說我們一起來看一下吧2024-03-03