C++數(shù)組去重十種方法
在C++中,數(shù)組去重是一個(gè)常見的操作,以下是一些常見的數(shù)組去重方法:
一、使用std::sort和std::unique(STL方法)
原理
首先,
std::sort
函數(shù)用于對(duì)數(shù)組進(jìn)行排序。它基于比較操作將數(shù)組元素按特定順序(默認(rèn)是升序)排列。例如,對(duì)于一個(gè)整數(shù)數(shù)組int arr[] = {5, 3, 4, 3, 2, 5};
,std::sort
會(huì)將其重新排列為有序的序列,如{2, 3, 3, 4, 5, 5}
。然后,
std::unique
函數(shù)用于去除相鄰的重復(fù)元素。它通過將不重復(fù)的元素移動(dòng)到數(shù)組的前面部分來(lái)實(shí)現(xiàn)去重。在上面排序后的數(shù)組中,std::unique
會(huì)將不重復(fù)的元素2, 3, 4, 5
移動(dòng)到數(shù)組的前面,返回一個(gè)指向去重后數(shù)組末尾的迭代器(實(shí)際上是一個(gè)指針,在數(shù)組場(chǎng)景下)。
示例代碼:
#include <iostream> #include <algorithm> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); std::sort(arr, arr + n); int new_end = std::unique(arr, arr + n)-arr; for (int i = 0; i < new_end; i++) { std::cout << arr[i] << " "; } return 0; }
在這個(gè)示例中,首先計(jì)算數(shù)組的大小,然后對(duì)數(shù)組進(jìn)行排序,接著使用std::unique
去重,最后遍歷去重后的數(shù)組部分并輸出。
注意事項(xiàng)
std::unique
只能去除相鄰的重復(fù)元素,所以在使用之前通常需要先對(duì)數(shù)組進(jìn)行排序。它不會(huì)改變數(shù)組的大小,只是將重復(fù)的元素移到數(shù)組的末尾部分,返回的是去重后有效元素的末尾位置。
二、使用std::set容器
原理
std::set
是C++ STL中的關(guān)聯(lián)容器,它的特性是元素唯一。當(dāng)向std::set
中插入元素時(shí),它會(huì)自動(dòng)檢查元素是否已經(jīng)存在,如果不存在則插入,否則忽略。
示例代碼:
#include <iostream> #include <set> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); std::set<int> s; for (int i = 0; i < n; i++) { s.insert(arr[i]); } for (auto it = s.begin(); it!= s.end(); it++) { std::cout << *it << " "; } return 0; }
這里首先創(chuàng)建一個(gè)std::set
,然后遍歷數(shù)組將元素插入到std::set
中,最后遍歷std::set
輸出去重后的元素。
注意事項(xiàng)
std::set
中的元素是按照特定順序存儲(chǔ)的(默認(rèn)是升序),如果不需要這種順序,可以考慮使用std::unordered_set
,它在插入和查找操作上可能會(huì)更高效。使用
std::set
去重會(huì)改變?cè)氐拇鎯?chǔ)結(jié)構(gòu),并且如果需要將去重后的結(jié)果再轉(zhuǎn)換回?cái)?shù)組,需要額外的操作。
三、手動(dòng)比較法(雙循環(huán)法)
原理
這種方法使用兩層循環(huán)。外層循環(huán)遍歷數(shù)組的每個(gè)元素,內(nèi)層循環(huán)用于比較當(dāng)前元素與之前已經(jīng)處理過的元素是否相同。如果找到相同的元素,則說明當(dāng)前元素是重復(fù)的,可以跳過或者進(jìn)行相應(yīng)的處理。
示例代碼:
#include <iostream> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); int new_size = 0; for (int i = 0; i < n; i++) { bool is_duplicate = false; for (int j = 0; j < new_size; j++) { if (arr[i] == arr[j]) { is_duplicate = true; break; } } if (!is_duplicate) { arr[new_size] = arr[i]; new_size++; } } for (int i = 0; i < new_size; i++) { std::cout << arr[i] << " "; } return 0; }
在這個(gè)示例中,new_size
用于記錄去重后的數(shù)組大小。外層循環(huán)每次取一個(gè)元素,內(nèi)層循環(huán)檢查該元素是否已經(jīng)在前面出現(xiàn)過,如果沒有則將其放入去重后的數(shù)組部分。
注意事項(xiàng)
這種方法的時(shí)間復(fù)雜度較高,為O(n^2)O(n2),其中
n
是數(shù)組的大小。當(dāng)數(shù)組規(guī)模較大時(shí),性能可能會(huì)比較差。它不需要額外的容器,但代碼相對(duì)復(fù)雜一些。
四、利用std::map記錄元素出現(xiàn)次數(shù)
原理
std::map
是C++ STL中的關(guān)聯(lián)容器,它以鍵 - 值對(duì)的形式存儲(chǔ)數(shù)據(jù)。在這里,可以將數(shù)組元素作為鍵,元素出現(xiàn)的次數(shù)作為值。在遍歷數(shù)組時(shí),如果元素第一次出現(xiàn),則將其插入std::map
中,值設(shè)為1;如果元素已經(jīng)存在,則將對(duì)應(yīng)的值加1。最后,只遍歷值為1的鍵,即為去重后的元素。
示例代碼:
#include <iostream> #include <map> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); std::map<int, int> m; for (int i = 0; i < n; i++) { if (m.find(arr[i])!= m.end()) { m[arr[i]]++; } else { m[arr[i]] = 1; } } for (auto it = m.begin(); it!= m.end(); it++) { if (it->second == 1) { std::cout << it->first << " "; } } return 0; }
首先創(chuàng)建std::map
,然后遍歷數(shù)組更新元素的出現(xiàn)次數(shù),最后遍歷std::map
輸出只出現(xiàn)一次的元素。
注意事項(xiàng)
這種方法使用了額外的
std::map
容器來(lái)存儲(chǔ)元素的出現(xiàn)次數(shù)信息,會(huì)占用一定的額外空間。相比于直接比較的方法,雖然時(shí)間復(fù)雜度在平均情況下可能較好,但對(duì)于一些特殊情況可能會(huì)有一定的性能開銷。
五、使用std::unordered_set(哈希表去重)
原理
std::unordered_set
是基于哈希表實(shí)現(xiàn)的關(guān)聯(lián)容器。它的插入和查找操作平均時(shí)間復(fù)雜度接近常數(shù)時(shí)間O(1)O(1)。當(dāng)向std::unordered_set
中插入元素時(shí),它會(huì)根據(jù)元素的哈希值快速判斷元素是否已經(jīng)存在,如果不存在則插入,從而實(shí)現(xiàn)去重。
示例代碼:
#include <iostream> #include <unordered_set> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); std::unordered_set<int> s; for (int i = 0; i < n; i++) { s.insert(arr[i]); } for (auto it = s.begin(); it!= s.end(); it++) { std::cout << *it << " "; } return 0; }
與使用std::set
類似,只是這里使用的是std::unordered_set
,它在性能上可能更適合一些不需要排序且元素?cái)?shù)量較多的情況。
注意事項(xiàng)
std::unordered_set
的哈希函數(shù)可能會(huì)導(dǎo)致哈希沖突,在極端情況下可能會(huì)影響性能。不過在大多數(shù)情況下,它的性能表現(xiàn)較好。同樣,將去重后的結(jié)果轉(zhuǎn)換回?cái)?shù)組可能需要額外的操作。
六、標(biāo)記法
原理
可以創(chuàng)建一個(gè)額外的布爾類型數(shù)組來(lái)標(biāo)記已經(jīng)出現(xiàn)過的元素。遍歷原始數(shù)組時(shí),對(duì)于每個(gè)元素,檢查其在標(biāo)記數(shù)組中的對(duì)應(yīng)位置是否已經(jīng)被標(biāo)記。如果沒有被標(biāo)記,則說明該元素是第一次出現(xiàn),將其加入去重后的結(jié)果中,并在標(biāo)記數(shù)組中標(biāo)記該元素;如果已經(jīng)被標(biāo)記,則說明是重復(fù)元素,跳過。
示例代碼:
#include <iostream> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); bool marked[n]; for (int i = 0; i < n; i++) { marked[i] = false; } int new_size = 0; for (int i = 0; i < n; i++) { if (!marked[i]) { arr[new_size] = arr[i]; new_size++; for (int j = i + 1; j < n; j++) { if (arr[i] == arr[j]) { marked[j] = true; } } } } for (int i = 0; i < new_size; i++) { std::cout << arr[i] << " "; } return 0; }
這里首先初始化標(biāo)記數(shù)組,然后在遍歷原始數(shù)組時(shí),根據(jù)標(biāo)記數(shù)組判斷元素是否重復(fù),并更新標(biāo)記數(shù)組和去重后的數(shù)組。
注意事項(xiàng)
這種方法需要額外創(chuàng)建一個(gè)與原始數(shù)組大小相同的布爾類型數(shù)組來(lái)進(jìn)行標(biāo)記,會(huì)占用一定的額外空間。
它的時(shí)間復(fù)雜度取決于原始數(shù)組中重復(fù)元素的分布情況,但在最壞情況下也是O(n^2)O(n2)。
七、排序后單循環(huán)比較(優(yōu)化雙循環(huán)法)
原理
先對(duì)數(shù)組進(jìn)行排序,這樣相同的元素就會(huì)相鄰。然后只需要一次循環(huán)遍歷數(shù)組,比較當(dāng)前元素和下一個(gè)元素是否相同。如果不同,則說明當(dāng)前元素是不重復(fù)的,可以進(jìn)行相應(yīng)處理;如果相同,則說明是重復(fù)元素,可以跳過。
示例代碼:
#include <iostream> #include <algorithm> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); std::sort(arr, arr + n); int new_size = 0; for (int i = 0; i < n - 1; i++) { if (arr[i]!= arr[i + 1]) { arr[new_size] = arr[i]; new_size++; } } arr[new_size] = arr[n - 1]; new_size++; for (int i = 0; i < new_size; i++) { std::cout << arr[i] << " "; } return 0; }
先對(duì)數(shù)組排序,然后在循環(huán)中比較相鄰元素,最后將最后一個(gè)元素處理并輸出去重后的數(shù)組。
注意事項(xiàng)
相比于普通的雙循環(huán)法,這種方法利用了排序后相同元素相鄰的特性,減少了比較的次數(shù),時(shí)間復(fù)雜度為O(nlogn + n)O(nlogn+n),其中nlognnlogn是排序的時(shí)間復(fù)雜度,
n
是遍歷數(shù)組的時(shí)間復(fù)雜度。不過它需要先對(duì)數(shù)組進(jìn)行排序,如果不需要排序后的結(jié)果,這可能會(huì)是一個(gè)額外的開銷。
八、利用數(shù)組指針和動(dòng)態(tài)內(nèi)存分配
原理
可以創(chuàng)建一個(gè)動(dòng)態(tài)分配內(nèi)存的新數(shù)組,然后通過指針遍歷原始數(shù)組。對(duì)于原始數(shù)組中的每個(gè)元素,檢查它是否已經(jīng)存在于新數(shù)組中。如果不存在,則將其添加到新數(shù)組中。這種方法可以避免使用一些復(fù)雜的STL容器,但需要手動(dòng)管理內(nèi)存。
示例代碼:
#include <iostream> int main() { int arr[] = {5, 3, 4, 3, 2, 5}; int n = sizeof(arr)/sizeof(arr[0]); int* new_arr = new int[n]; int new_size = 0; for (int i = 0; i < n; i++) { bool is_duplicate = false; for (int j = 0; j < new_size; j++) { if (arr[i] == new_arr[j]) { is_duplicate = true; break; } } if (!is_duplicate) { new_arr[new_size] = arr[i]; new_size++; } } for (int i = 0; i < new_size; i++) { std::cout << new_arr[i] << " "; } delete[] new_arr; return 0; }
這里動(dòng)態(tài)分配了一個(gè)新數(shù)組,然后通過雙循環(huán)比較將不重復(fù)的元素放入新數(shù)組,最后輸出并釋放內(nèi)存。
注意事項(xiàng)
這種方法需要手動(dòng)管理動(dòng)態(tài)分配的內(nèi)存,如果忘記釋放內(nèi)存會(huì)導(dǎo)致內(nèi)存泄漏。
雙循環(huán)比較導(dǎo)致時(shí)間復(fù)雜度為O(n^2)O(n2),性能在數(shù)組較大時(shí)可能較差。
九、使用std::vector和std::erase - std::remove組合(針對(duì)std::vector類型數(shù)組)
原理
在C++中,std::vector
是一個(gè)動(dòng)態(tài)數(shù)組容器。std::remove
函數(shù)實(shí)際上并不會(huì)真正刪除元素,而是將不想要的元素移到容器的末尾,并返回一個(gè)指向新的邏輯末尾的迭代器。然后std::erase
函數(shù)根據(jù)這個(gè)迭代器真正地從std::vector
中刪除元素。
示例代碼:
#include <iostream> #include <vector> #include <algorithm> int main() { std::vector<int> v = {5, 3, 4, 3, 2, 5}; v.erase(std::remove(v.begin(), v.end(), 3), v.end()); v.erase(std::remove(v.begin(), v.end(), 5), v.end()); for (auto it : v) { std::cout << it << " "; } return 0; }
這里先使用std::remove
將指定元素(這里是3和5)移到std::vector
的末尾,然后使用std::erase
刪除這些元素。需要注意的是,如果要去重所有元素,可能需要多次調(diào)用std::remove
和std::erase
或者采用更復(fù)雜的邏輯。
注意事項(xiàng)
這種方法主要針對(duì)
std::vector
類型的數(shù)組,如果是普通數(shù)組需要先轉(zhuǎn)換為std::vector
。std::remove
的使用可能會(huì)比較復(fù)雜,尤其是對(duì)于多種元素去重或者完全去重的情況。
十、自定義哈希函數(shù)去重(針對(duì)自定義類型數(shù)組)
原理
當(dāng)數(shù)組中的元素是自定義類型時(shí),可以定義一個(gè)哈希函數(shù)來(lái)計(jì)算元素的哈希值。然后可以使用類似于std::unordered_set
的原理,創(chuàng)建一個(gè)基于自定義哈希函數(shù)的容器或者數(shù)據(jù)結(jié)構(gòu),通過比較哈希值來(lái)判斷元素是否重復(fù)。
示例代碼(假設(shè)自定義類型為MyType
):
#include <iostream> #include <unordered_set> struct MyType { int a; int b; // 假設(shè)根據(jù)a和b計(jì)算哈希值 size_t operator()(const MyType& obj) const { return std::hash<int>()(obj.a)^ std::hash<int>()(obj.b); } }; int main() { MyType arr[] = { {1, 2}, {3, 4}, {1, 2}, {5, 6} }; int n = sizeof(arr)/sizeof(arr[0]); std::unordered_set<MyType, MyType> s; for (int i = 0; i < n; i++) { s.insert(arr[i]); } for (auto it = s.begin(); it!= s.end(); it++) { std::cout << "(" << it->a << ", " << it->b << ") "; } return 0; }
這里定義了MyType
結(jié)構(gòu)體,并為其定義了一個(gè)哈希函數(shù)。然后使用std::unordered_set
結(jié)合自定義哈希函數(shù)對(duì)MyType
類型的數(shù)組進(jìn)行去重。
到此這篇關(guān)于C++數(shù)組去重十種方法的文章就介紹到這了,更多相關(guān)C++數(shù)組去重內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++用函數(shù)對(duì)算法性能進(jìn)行測(cè)試
算法無(wú)處不在,算法是程序的靈魂,而數(shù)據(jù)結(jié)構(gòu)則是程序的骨架,二者共同構(gòu)成了程序,那么如何評(píng)估算法的性能呢?理論上可以通過計(jì)算時(shí)間復(fù)雜度的方法來(lái)評(píng)估,但這是理性的認(rèn)識(shí),我們還有一種直觀的評(píng)估方法,那就是程序執(zhí)行的時(shí)間2022-08-08C++實(shí)現(xiàn)圖片jpg格式變成16位565bmp格式
這篇文章主要為大家詳細(xì)介紹了C++如何實(shí)現(xiàn)圖片jpg格式變成16位565bmp格式,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2025-03-03C語(yǔ)言預(yù)編譯#define(預(yù)處理)
這篇文章主要介紹了C語(yǔ)言預(yù)編譯#define(預(yù)處理),#define 機(jī)制包括了一個(gè)機(jī)制,允許把參數(shù)替換到文本中,這種實(shí)現(xiàn)通常稱為宏或者宏定義,下文更多的相關(guān)資料介紹需要的小伙伴可以參考一下2022-04-04判斷一個(gè)數(shù)是不是素?cái)?shù)的方法
判斷一個(gè)數(shù)是不是素?cái)?shù)的方法,需要的朋友可以參考一下2013-03-03VC++進(jìn)度條process Bar的用法實(shí)例
這篇文章主要介紹了VC++進(jìn)度條process Bar的用法,是進(jìn)行VC++應(yīng)用程序開發(fā)中非常常見的實(shí)用技巧,需要的朋友可以參考下2014-10-10淺析C語(yǔ)言中對(duì)于char*和char[]的理解
char * s 只是一個(gè)保存字符串首地址的指針變量,char a[]是許多連續(xù)的內(nèi)存單元,單元中的元素是char型,char * 和 char a[]具有相同的效果,源于字符串的本質(zhì),這篇文章主要介紹了C語(yǔ)言中對(duì)于char*和char[]的理解,需要的朋友可以參考下2023-02-02