C++實(shí)現(xiàn)LeetCode(692.前K個(gè)高頻詞)
[LeetCode] 692.Top K Frequent Words 前K個(gè)高頻詞
Given a non-empty list of words, return the k most frequent elements.
Your answer should be sorted by frequency from highest to lowest. If two words have the same frequency, then the word with the lower alphabetical order comes first.
Example 1:
Input: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
Output: ["i", "love"]
Explanation: "i" and "love" are the two most frequent words.
Note that "i" comes before "love" due to a lower alphabetical order.
Example 2:
Input: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
Output: ["the", "is", "sunny", "day"]
Explanation: "the", "is", "sunny" and "day" are the four most frequent words,
with the number of occurrence being 4, 3, 2 and 1 respectively.
Note:
- You may assume k is always valid, 1 ≤ k ≤ number of unique elements.
- Input words contain only lowercase letters.
Follow up:
- Try to solve it in O(n log k) time and O(n) extra space.
- Can you solve it in O(n) time with only O(k) extra space?
這道題讓我們求前K個(gè)高頻詞,跟之前那道題 Top K Frequent Elements 極其類似,換了個(gè)數(shù)據(jù)類型就又是一道新題。唯一的不同就是之前那道題對(duì)于出現(xiàn)頻率相同的數(shù)字,沒有順序要求。而這道題對(duì)于出現(xiàn)頻率相同的單詞,需要按照字母順序來(lái)排。但是解法都一樣,還是用最小堆和桶排序的方法。首先來(lái)看最小堆的方法,思路是先建立每個(gè)單詞和其出現(xiàn)次數(shù)之間的映射,然后把單詞和頻率的pair放進(jìn)最小堆,如果沒有相同頻率的單詞排序要求,我們完全可以讓頻率當(dāng)作pair的第一項(xiàng),這樣priority_queue默認(rèn)是以pair的第一項(xiàng)為key進(jìn)行從大到小的排序,而當(dāng)?shù)谝豁?xiàng)相等時(shí),又會(huì)以第二項(xiàng)由大到小進(jìn)行排序,這樣第一項(xiàng)的排序方式就與題目要求的相同頻率的單詞要按字母順序排列不相符,當(dāng)然我們可以在存入結(jié)果res時(shí)對(duì)相同頻率的詞進(jìn)行重新排序處理,也可以對(duì)priority_queue的排序機(jī)制進(jìn)行自定義,這里我們采用第二種方法,我們自定義排序機(jī)制,我們讓a.second > b.second,讓小頻率的詞在第一位,然后當(dāng)a.second == b.second時(shí),我們讓a.first < b.first,這是讓字母順序大的排在前面(這里博主需要強(qiáng)調(diào)一點(diǎn)的是,priority_queue的排序機(jī)制的寫法和vector的sort的排序機(jī)制的寫法正好順序相反,同樣的寫法,用在sort里面就是頻率小的在前面,不信的話可以自己試一下)。定義好最小堆后,我們首先統(tǒng)計(jì)單詞的出現(xiàn)頻率,然后組成pair排序最小堆之中,我們只保存k個(gè)pair,超過了就把隊(duì)首的pair移除隊(duì)列,最后我們把單詞放入結(jié)果res中即可,參見代碼如下:
解法一:
class Solution { public: vector<string> topKFrequent(vector<string>& words, int k) { vector<string> res(k); unordered_map<string, int> freq; auto cmp = [](pair<string, int>& a, pair<string, int>& b) { return a.second > b.second || (a.second == b.second && a.first < b.first); }; priority_queue<pair<string, int>, vector<pair<string, int>>, decltype(cmp) > q(cmp); for (auto word : words) ++freq[word]; for (auto f : freq) { q.push(f); if (q.size() > k) q.pop(); } for (int i = res.size() - 1; i >= 0; --i) { res[i] = q.top().first; q.pop(); } return res; } };
下面這種解法還是一種堆排序的思路,這里我們用map,來(lái)建立次數(shù)和出現(xiàn)該次數(shù)所有單詞的集合set之間的映射,這里也利用了set能自動(dòng)排序的特性,當(dāng)然我們還是需要首先建立每個(gè)單詞和其出現(xiàn)次數(shù)的映射,然后將其組成pair放入map種,map是從小到大排序的,這樣我們從最后面取pair,就是次數(shù)最大的,每次取出一層中所有的單詞,如果此時(shí)的k大于該層的單詞個(gè)數(shù),就將整層的單詞加入結(jié)果res中,否則就取前K個(gè)就行了,取完要更更新K值,如果K小于等于0了,就break掉,返回結(jié)果res即可,參見代碼如下:
解法二:
class Solution { public: vector<string> topKFrequent(vector<string>& words, int k) { vector<string> res; unordered_map<string, int> freq; map<int, set<string>> m; for (string word : words) ++freq[word]; for (auto a : freq) { m[a.second].insert(a.first); } for (auto it = m.rbegin(); it != m.rend(); ++it) { if (k <= 0) break; auto t = it->second; vector<string> v(t.begin(), t.end()); if (k >= t.size()) { res.insert(res.end(), v.begin(), v.end()); } else { res.insert(res.end(), v.begin(), v.begin() + k); } k -= t.size(); } return res; } };
下面這種解法是一種桶排序的思路,我們根據(jù)出現(xiàn)次數(shù)建立多個(gè)bucket,桶的個(gè)數(shù)不會(huì)超過單詞的個(gè)數(shù),在每個(gè)桶中,我們對(duì)單詞按字符順序進(jìn)行排序。我們可以用個(gè)數(shù)組來(lái)表示桶,每一層中放一個(gè)集合,利用set的自動(dòng)排序的功能,使其能按字母順序排列。我們還是需要首先建立每個(gè)單詞和其出現(xiàn)次數(shù)的映射,然后將其組成pair放入map種,map是從小到大排序的,這樣我們倒序遍歷所有的桶,這樣取pair,就是次數(shù)最大的,每次取出一層中所有的單詞,如果此時(shí)的k大于該層的單詞個(gè)數(shù),就將整層的單詞加入結(jié)果res中,否則就取前K個(gè)就行了,取完要更更新K值,如果K小于等于0了,就break掉,返回結(jié)果res即可,參見代碼如下:
解法三:
class Solution { public: vector<string> topKFrequent(vector<string>& words, int k) { vector<string> res; unordered_map<string, int> freq; vector<set<string>> v(words.size() + 1, set<string>()); for (string word : words) ++freq[word]; for (auto a : freq) { v[a.second].insert(a.first); } for (int i = v.size() - 1; i >= 0; --i) { if (k <= 0) break; vector<string> t(v[i].begin(), v[i].end()); if (k >= t.size()) { res.insert(res.end(), t.begin(), t.end()); } else { res.insert(res.end(), t.begin(), t.begin() + k); } k -= t.size(); } return res; } };
類似題目:
Design Search Autocomplete System
參考資料:
https://discuss.leetcode.com/topic/106861/o-nlog-k-priority-queue-c-code
https://discuss.leetcode.com/topic/106868/clean-heap-based-solution-o-nlogk-time-and-o-n-space-16ms
到此這篇關(guān)于C++實(shí)現(xiàn)LeetCode(692.前K個(gè)高頻詞)的文章就介紹到這了,更多相關(guān)C++實(shí)現(xiàn)前K個(gè)高頻詞內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
cocos2dx-3.10 C++實(shí)現(xiàn)滾動(dòng)數(shù)字
這篇文章主要為大家詳細(xì)介紹了cocos2dx-3.10 C++實(shí)現(xiàn)滾動(dòng)數(shù)字效果,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-09-09C/C++實(shí)現(xiàn)數(shù)字與字符串互相轉(zhuǎn)換的多種方法
在C/C++程序中,會(huì)需要把數(shù)字與字符串做出互相轉(zhuǎn)換的操作,用于實(shí)現(xiàn)程序想要的效果,下面將介紹多種方法實(shí)現(xiàn)數(shù)字與字符串互相轉(zhuǎn)換,文中有詳細(xì)的代碼示例供大家參考,需要的朋友可以參考下2024-08-08C++?重載運(yùn)算符在HotSpot?VM中的應(yīng)用小結(jié)
C++支持運(yùn)算符重載,對(duì)于Java開發(fā)者來(lái)說,這個(gè)可能比較陌生一些,因?yàn)镴ava不支持運(yùn)算符重載,下面介紹一下HotSpot?VM中的運(yùn)算符重載,感興趣的朋友跟隨小編一起看看吧2023-09-09C語(yǔ)言動(dòng)態(tài)內(nèi)存分配和內(nèi)存操作函數(shù)使用詳解
但是在實(shí)際的編程中,往往會(huì)發(fā)生這種情況,即所需的內(nèi)存空間取決于實(shí)際輸入的數(shù)據(jù),而無(wú)法預(yù)先確定 。為了解決上述問題,C語(yǔ)言提供了一些內(nèi)存管理函數(shù),這些內(nèi)存管理函數(shù)可以按需要?jiǎng)討B(tài)的分配內(nèi)存空間,也可把不再使用的空間回收再次利用2022-12-12