C++ string字符串的使用和簡單模擬實現(xiàn)
前言
本文講解string串的使用和一些簡單的模擬實現(xiàn),內(nèi)容豐富,干貨多多!
1. string簡介
C語言中,字符串是以'\0'結(jié)尾的一些字符的集合,為了操作方便,C標準庫中提供了一些str系列的庫函數(shù),但是這些庫函數(shù)和字符串是分離的。不符合面向?qū)ο蟪绦蛟O(shè)計的思想,而且底層空間需要用戶自己管理,如果不細心,容易訪問越界。
所以C++標準庫以string類來表示字符串,更加簡單,方便。
- 字符串是表示字符序列的對象。
- 標準string類通過類似于標準字節(jié)容器的接口提供了對此類對象的支持,但添加了專門設(shè)計用于操作單字節(jié)字符串的特性。
- string類是basic_string類模板的實例化,該模板使用char(即字節(jié))作為其字符類型,具有默認的char_traits和allocator類型(有關(guān)模板的更多信息,請參閱basic_string)。
- 請注意,該類處理字節(jié)獨立于所使用的編碼:如果用于處理多字節(jié)或變長字符序列(如UTF-8),則該類的所有成員(如length或size)及其迭代器仍將以字節(jié)(而不是實際編碼的字符)進行操作。
2. string的使用和簡單模擬實現(xiàn)
2.1 string類的定義
string類是本賈尼C++之父實現(xiàn)的,但是初次實現(xiàn)難免有許多不足,如接口函數(shù)過多,接口函數(shù)重載過多,導致string類十分復雜。我們對string類進行簡單的模擬實現(xiàn),不過是實現(xiàn)一些常用的接口函數(shù),主要是粗淺地了解其中的原理。
- 因為string這個容器專門針對字符,沒有使用類模版,所以定義和聲明需要分離,準備兩個文件string.h和string.cpp。string.h存放類的聲明,string.cpp各種類成員函數(shù)和變量的定義。
- 為了不跟C++標準庫里面的string發(fā)生命名沖突,可以將類放在命名空間中,并且這兩個文件可以使用同一個命名空間,編譯的過程中就會合并。
- 因為string物理存儲空間本質(zhì)上是連續(xù)的,不是鏈表那種隨機存儲的。迭代器使用char*原生的字符指針就可以模擬,不過實際的string的迭代器基本是用類封裝實現(xiàn)。
#define _CRT_SECURE_NO_WARNINGS
#pragma once
#include <iostream>
#include <assert.h>
using namespace std;
namespace Rustle
{
class string
{
public:
typedef char* iterator;
typedef const char* const_iterator;
iterator begin();
iterator end();
const_iterator begin() const;
const_iterator end() const;
//構(gòu)造函數(shù)
//string();
string(const char* str = "");
//拷貝構(gòu)造函數(shù)
string(const string& s);
//賦值拷貝函數(shù)
//string& operator=(const string& s);
string& operator=(string tmp);
//析構(gòu)函數(shù)
~string();
void swap(string& s);
const char* c_str() const;
size_t size() const;
char& operator[](size_t pos);
const char& operator[](size_t pos) const;
void reserve(size_t n);
void push_back(char ch);
void append(const char* str);
string& operator+=(char ch);
string& operator+=(const char* str);
void insert(size_t pos, char ch);
void insert(size_t pos, const char* str);
void erase(size_t pos, size_t len = npos);
size_t find(char ch, size_t pos = 0);
size_t find(const char* str, size_t pos = 0);
string substr(size_t pos = 0, size_t len = npos);
bool operator<(const string& s)const;
bool operator>(const string& s)const;
bool operator<=(const string& s)const;
bool operator>=(const string& s)const;
bool operator==(const string& s)const;
bool operator!=(const string& s)const;
void clear();
private:
char* _str = nullptr;//置空
size_t _size = 0;
size_t _capacity = 0;
const static size_t npos;
};
istream& operator>>(istream& is, string& str);
ostream& operator<<(ostream& os, const string& str);
}
2.2 string(),~string()和c_str()
- 構(gòu)造函數(shù)如果使用第一種寫法,將所有成員變量使用初始化列表進行初始化。一般來說是可以的,但是每一次都需要調(diào)用strlen這個庫函數(shù),會消耗時間。
- 可能有的人會用第二種寫法,交換一下初始化列表中的順序,先將_size初始化,之后的成員變量直接使用_size就行。但是初始化列表初始化的順序跟函數(shù)中初始化列表順序無關(guān),只跟成員變量聲明的順序有關(guān)。
- 最好的解決方案就是第三種構(gòu)造函數(shù)的寫法,先使用初始化列表進行初始化,然后在函數(shù)內(nèi)部進行動態(tài)開辟一塊與str相同大小的空間,使用strcpy拷貝str字符串的內(nèi)容,strcpy還會自動在字符串末尾加上斜杠0。
- 需要注意的是,_size指的是字符串的大小,_capacity指的是斜杠0之前的字符個數(shù),不包含斜杠0。所以之前_str中空間大小事_size+1,給斜杠0預留一個空間。
- 析構(gòu)函數(shù)先釋放_str指向的空間,然后_str置為空指針,其他兩個成員變量置為0。
- 有些時候需要像C語言一樣訪問字符串,而string是一個類無法直接訪問,c_str函數(shù)就是解決這種問題,這個函數(shù)可以獲取_str指針,即第一個字符的地址。
namespace Greg
{
//1.
string::string(const char* str)
:_str(new char[strlen(str) + 1])
,_size(strlen(str))
,_capacity(strlen(str))
{
assert(str);
strcpy(_str, str);
}
//2.
string::string(const char* str)
:_size(strlen(str))
,_str(new char[_size + 1])
,_capacity(_size)
{
assert(str);
strcpy(_str, str);
}
//全缺省構(gòu)造函數(shù)
string::string(const char* str)
:_size(strlen(str))
{
assert(str);
//初始化列表和函數(shù)內(nèi)部初始化混合著用
_str = new char[_size + 1];
_capacity = _size;
strcpy(_str, str);
}
string::~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
const char* string::c_str() const
{
return _str;
}
}寫一個測試函數(shù),也放在Rustle命名空間中,這樣就string前面不用加域名限制符。
namespace Rustle
{
void test_string1()
{
string s1("hello world");
cout << s1.c_str() << endl;
}
}運行結(jié)果如下:

2.2 size,重載符號[ ],begin和end函數(shù)
- size是獲取字符個數(shù)的函數(shù),直接返回_size就好。
- [ ]下標訪問符,跟vector容器作用相似,訪問pos下標的元素,需要先斷言檢查pos是不是在合理的范圍,然后直接返回_str[pos]即可。不過返回類型是字符類型的引用,這樣可以對該字符進行修改
- begin函數(shù)是返回字符串的第一個字符的地址,還有一個const修飾函數(shù),算是函數(shù)重載。因為string類對象可能也被const修飾。
- end函數(shù)返回的是字符串最后一字符的下一個位置,由于下標是從0開始的,直接返回_str+_size即可。
string::iterator string::begin()
{
return _str;
}
string::iterator string::end()
{
return _str + _size;
}
string::const_iterator string::begin() const
{
return _str;
}
string::const_iterator string::end() const
{
return _str+ _size;
}
size_t string::size() const
{
return _size;
}
char& string::operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
const char& string::operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
}寫一個測試函數(shù),用下標訪問,迭代器訪問,還有范圍for循環(huán)訪問。范圍for的底層就是需要識別有沒有begin和end函數(shù)。
void test_string1()
{
string s1("hello world");
cout << s1.c_str() << endl;
for (size_t i = 0; i < s1.size(); i++)
{
cout << s1[i] << " ";
}
cout << endl;
for (auto e : s1)
{
cout << e << " ";
}
cout << endl;
string::iterator it1 = s1.begin();
while (it1 != s1.end())
{
cout << *it1 << " ";
++it1;
}
cout << endl;
const string s3("xxxxxx");
string::const_iterator it2 = s3.begin();
while (it2 != s3.end())
{
cout << *it2 << " ";
++it2;
}
cout << endl;
}運行結(jié)果如下:

2.3 push_back,reserve,append,+=運算符重載
接口函數(shù)聲明如下,其中+=運算符重載函數(shù)有兩個重載,針對的是字符和字符串的。
void reserve(size_t n); void push_back(char ch); void append(const char* str); string& operator+=(char ch); string& operator+=(const char* str);
- reserve就是調(diào)整容量的函數(shù)。我們需要手動擴容。先開辟一個新容量大小的空間,然后使用strcpy庫函數(shù)將原字符串內(nèi)容拷貝到tmp指針指向的空間上,再釋放_str指向的空間。讓_str指針指向tmp指向的空間,修改_capacity的大小。
- push_back函數(shù)是在字符串的末尾加上一個字符。首先,我們要判斷字符串的容量是否足夠。當_size和_capacity相等時,說明字符串容量已滿,需要擴容。我們定義一個newcapacity變量,如果_capacity等于0,說明還沒有開空間,先給四個字符大小的容量大小,如果不等于0,按兩倍擴容。擴容之后,在_size下標位置添加ch字符,并且需要單獨處理斜杠0,加在新字符的后一個位置。修改_size。
- append函數(shù)在原字符串上追加新字符串,會覆蓋原字符串。先定義len表示新字符串字符的個數(shù),再判斷加上新字符串后是否超過容量,超過容量要擴容。然后使用strcpy拷貝新字符串,再修改_size。
- +=運算符重載針對字符和字符串的兩個函數(shù),分別復用push_back和append函數(shù)即可。需要返回*this。
void string::reserve(size_t n)
{
if (n > _capacity)
{ //給斜杠0預留一個位置
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void string::push_back(char ch)
{
if (_size == _capacity)
{
size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
reserve(newcapacity);
}
_str[_size] = ch;
_str[_size + 1] = '\0';//單獨處理斜杠0
++_size;
}
void string::append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
strcpy(_str + _size, str);
_size += len;
}
//復用push_back和append函數(shù)
string& string::operator+=(char ch)
{
push_back(ch);
return *this;
}
string& string::operator+=(const char* str)
{
append(str);
return *this;
}寫個測試函數(shù),測試剛剛是模擬實現(xiàn)的函數(shù)。
void test_string2()
{
string s1("hello world");
cout << s1.c_str() << endl;
s1.push_back('x');
cout << s1.c_str() << endl;
s1.append("aaaaaa");
cout << s1.c_str() << endl;
s1 += 'y';
cout << s1.c_str() << endl;
s1 += "dfsdf";
cout << s1.c_str() << endl;
}運行結(jié)果如下:

2.4 insert和erase函數(shù)
- 上面是insert和erase函數(shù)的定義。insert函數(shù)從pos位置開始插入字符或者字符串,erase函數(shù)從pos位置開始,刪除len個字符,其中l(wèi)en變量給了缺省值npos。
- npos是無符號整數(shù),現(xiàn)在令npos = -1。如果
size_t是 32 位的,那么npos等于2^32 - 1,即4294967295。如果size_t是 64 位的,那么npos等于2^64 - 1,即18446744073709551615。總之是一個非常大的數(shù)字,表示直接到末尾。
class string
{
public:
void insert(size_t pos, char ch);
void insert(size_t pos, const char* str);
void erase(size_t pos, size_t len = npos);
private:
const static size_t npos;
}
- npos是一個靜態(tài)變量需要定義和聲明分離。
- 實現(xiàn)針對字符插入的insert函數(shù)。先判斷是否需要擴容,然后需要挪動元素,當你定義一個無符號整型end變量時,盡量不要讓無符號整數(shù)遇到大于等于或者小于等于符號,會有坑。
- 因為如果你while循環(huán)繼續(xù)的條件是end >= pos,并且此時pos等于0的情況下,你不斷讓end減1,當end減到0時,再次減去1會變成-1,如上面所說相當于
2^32 - 1,會造成無限循環(huán)。 - 有兩種解決方法,第一種就是不要出現(xiàn)等于符號,控制好end的位置。第二種是強轉(zhuǎn)pos為int,這樣使用等于判斷就不會出現(xiàn)無限循環(huán)的情況。
- 針對字符串插入的insert函數(shù),使用上面第一種方法挪動元素,while循環(huán)繼續(xù)的條件比較難寫出來,需要畫圖理解。
- 實現(xiàn)erase函數(shù),先判斷刪除的字符個數(shù)和從pos位置的字符到結(jié)尾字符個數(shù)的大小關(guān)系。如果大于原字符的個數(shù),直接將斜杠0放在pos位置的字符即可,在修改_size的大小。如果小于,需要挪動元素,可以使用strcpy將刪除字符的最后一個位置拷貝到pos位置,就完成了刪除和挪動的操作。
const size_t string::npos = -1;
//1.
void string::insert(size_t pos, char ch)
{
assert(pos <= _size);
if (_size == _capacity)
{
size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
reserve(newcapacity);
}
//size_t無符號整數(shù)遇到大于等于有坑
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = ch;
++_size;
}
//2.
void string::insert(size_t pos, char ch)
{
assert(pos <= _size);
if (_size == _capacity)
{
size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
reserve(newcapacity);
}
int end = _size;
while (end >= (int)pos)
{
_str[end + 1] = _str[end];
--end;
}
_str[pos] = ch;
++_size;
}
//1.
void string::insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
size_t end = _size + len;
while (end > pos + len - 1)//!(pos + len - 1)
{
_str[end] = _str[end - len];
--end;
}
memcpy(_str + pos, str, len);
_size += len;
}
//2.
void string::insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
int end = _size;
while (end >= (int)pos)
{
_str[end + len] = _str[end];
--end;
}
memcpy(_str + pos, str, len);
_size += len;
}
void string::erase(size_t pos, size_t len)
{
assert(pos < _size);
if (pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
strcpy(_str + pos, _str + pos + len);
_size -= len;
}
}寫個測試函數(shù)。測試一下模擬實現(xiàn)的函數(shù)。
void test_string3()
{
string s1("hello world");
cout << s1.c_str() << endl;
s1.insert(0, 'x');
cout << s1.c_str() << endl;
string s2("helloworld");
s2.insert(5, "xxxx");
cout << s2.c_str() << endl;
s2.erase(5, 4);
cout << s2.c_str() << endl;
}運行結(jié)果如下:

2.5 find和substr函數(shù)
函數(shù)原型如下,find函數(shù)是查找某個字符或者字符串的位置,查找到返回該字符的下標位置或者該字符串第一個字符的位置。如果沒有找到返回-1,是一個極大的數(shù)。substr函數(shù)是從pos位置開始,取下原字符串的子串,返回一個string類的對象。
size_t find(char ch, size_t pos = 0); size_t find(const char* str, size_t pos = 0); string substr(size_t pos = 0, size_t len = npos);
- 查找字符,直接遍歷整個字符串查找,找到返回下標,沒找到返回-1。
- 查找字符串,可以直接使用strstr庫函數(shù),或者使用其他查找子串的算法。
- 實現(xiàn)substr函數(shù),先判斷子串字符個數(shù)是否小于從pos位置開始的字符個數(shù)。如果大于,直接拷貝pos位置的字符串。如果小于,創(chuàng)建一個string類的臨時對象,先調(diào)整容量為len個,這樣就不會在頻繁擴容。然后使用for循環(huán)一個個加等。
size_t string::find(char ch, size_t pos)
{
for (size_t i = 0; i < _size; i++)
{
if (_str[i] == ch)
return i;
}
return npos;
}
size_t string::find(const char* str, size_t pos)
{
const char* end = strstr(_str, str);
return end - _str;
}
string string::substr(size_t pos, size_t len)
{
//子串長度大于從原字符串給定位置開始到結(jié)束的長度,直接拷貝返回
if (len > _size - pos)
{
string sub(_str + pos);
return sub;
}
else
{
string sub;
sub.reserve(len);
for (size_t i = 0; i < len; i++)
{
sub += _str[pos + i];
}
return sub;
}
}寫一個測試用例,用于分割網(wǎng)址。
void test_string4()
{
string s1("helloworld");
cout << s1.find('o') << endl;
cout << s1.find("orl") << endl;
string url("https://legacy.cplusplus.com/reference");
size_t pos1 = url.find(":");
string url1 = url.substr(0, pos1);
cout << url1 << endl;
size_t pos2 = url.find('/', pos1 + 3);
string url2 = url.substr(pos1 + 3, pos2 - (pos1 + 3));
cout << url2 << endl;
string url3 = url.substr(pos2 + 1);
cout << url3 << endl;
}運行結(jié)果如下:

2.6 比較運算符的重載
bool operator<(const string& s)const;
bool operator>(const string& s)const;
bool operator<=(const string& s)const;
bool operator>=(const string& s)const;
bool operator==(const string& s)const;
bool operator!=(const string& s)const;比較運算符,是比較字符的ASCii碼值,可以寫完<和==的邏輯,然后其他進行復用。
bool string::operator<(const string& s)const
{
return strcmp(_str, s._str) < 0;
}
bool string::operator>(const string& s)const
{
return !(*this < s) && !(*this == s);
}
bool string::operator<=(const string& s)const
{
return *this < s || *this == s;
}
bool string::operator>=(const string& s)const
{
return *this < s || *this == s;
}
bool string::operator==(const string& s)const
{
return strcmp(_str, s._str) == 0;
}
bool string::operator!=(const string& s)const
{
return !(*this == s);
}2.7 cout<<和cin>>運算符重載
重載流插入<<和流提取>>這兩個操作符,是為了方便打印和輸入。并且這是放在全局的函數(shù)。
istream& operator>>(istream& is, string& str); ostream& operator<<(ostream& os, const string& str);
- 流插入<<函數(shù)容易實現(xiàn),直接for循環(huán)遍歷打印每個字符即可,不過你可以按照你的意愿打印任何形式。
- 流提取<<函數(shù)比較難實現(xiàn)。首先寫一個clear函數(shù),清理掉之前的字符串里的字符,可以直接將斜杠0放在下標為0的位置,再修改_size就好了。
- 首先,我們不能直接使用is >> ch來提取字符,因為一遇到空格或者換行就表示分割??梢允褂胕s.get()函數(shù)完成輸入操作。然后,我們先創(chuàng)建一個字符數(shù)組,輸入的字符填到字符數(shù)組先,滿了在加載字符串中,可以防止頻繁擴容,帶來的消耗。
ostream& operator<<(ostream& os, const string& str)
{
for (size_t i = 0; i < str.size(); i++)
{
os << str[i];
}
return os;
}
void string::clear()
{
_str[0] = '\0';
_size = 0;
}
istream& operator>>(istream& is, string& str)
{
//空格和換行表示多個值的分割
//is >> ch; //scanf("%c", &ch);
str.clear();
int i = 0;
char buff[128];
char ch = is.get();
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
//0~126的位置放字符了,留一個位置給斜杠0
//減少頻繁擴容
if (i == 127)
{
buff[i] = '\0';
str += buff;
i = 0;
}
ch = is.get();
}
if (i != 0)
{
buff[i] = '\0';
str += buff;
}
return is;
}寫個測試函數(shù)。
void test_string7()
{
//string s1("hello world");
string s1;
cout << s1 << endl;
cin >> s1;
cout << s1 << endl;
}運行結(jié)果如下:

總結(jié)
以上就是C++ string字符串的使用和簡單模擬實現(xiàn)的詳細內(nèi)容,更多關(guān)于C++ string使用和實現(xiàn)的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
數(shù)據(jù)結(jié)構(gòu) C語言實現(xiàn)循環(huán)單鏈表的實例
這篇文章主要介紹了數(shù)據(jù)結(jié)構(gòu) C語言實現(xiàn)循環(huán)單鏈表的實例的相關(guān)資料,需要的朋友可以參考下2017-05-05
c++基礎(chǔ)語法:構(gòu)造函數(shù)與析構(gòu)函數(shù)
構(gòu)造函數(shù)用來構(gòu)造一個對象,主要完成一些初始化工作,如果類中不提供構(gòu)造函數(shù),編譯器會默認的提供一個默認構(gòu)造函數(shù)(參數(shù)為空的構(gòu)造函數(shù)就是默認構(gòu)造函數(shù)) ;析構(gòu)函數(shù)是隱式調(diào)用的,delete對象時候會自動調(diào)用完成對象的清理工作2013-09-09
解決Visual?Studio?Code錯誤Cannot?build?and?debug?because?
這篇文章主要為大家介紹了解決Visual?Studio?Code錯誤Cannot?build?and?debug?because?the及分析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-07-07
VS2022永久配置OpenCV開發(fā)環(huán)境的實現(xiàn)
本文主要介紹了VS2022永久配置OpenCV開發(fā)環(huán)境的實現(xiàn),文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-02-02
解析C++中的for循環(huán)以及基于范圍的for語句使用
這篇文章主要介紹了解析C++中的for循環(huán)以及基于范圍的for語句使用,是C++入門學習中的基礎(chǔ)知識,需要的朋友可以參考下2016-01-01

