MySQL 8.0數(shù)據(jù)字典緩存管理機(jī)制解析
背景介紹
MySQL的數(shù)據(jù)字典(Data Dictionary,簡稱DD),用于存儲數(shù)據(jù)庫的元數(shù)據(jù)信息,它在8.0版本中被重新設(shè)計(jì)和實(shí)現(xiàn),通過將所有DD數(shù)據(jù)唯一地持久化到InnoDB存儲引擎的DD tables,實(shí)現(xiàn)了DD的統(tǒng)一管理。為了避免每次訪問DD都去存儲中讀取數(shù)據(jù),使DD內(nèi)存對象能夠復(fù)用,DD實(shí)現(xiàn)了兩級緩存的架構(gòu),這樣在每個(gè)線程使用DD client訪問DD時(shí)可以通過兩級緩存來加速對DD的內(nèi)存訪問。
整體架構(gòu)
圖1 數(shù)據(jù)字典緩存架構(gòu)圖
需要訪問DD的數(shù)據(jù)庫工作線程通過建立一個(gè)DD client(DD系統(tǒng)提供的一套DD訪問框架)來訪問DD,具體流程為通過與線程THD綁定的類Dictionary_client,來依次訪問一級緩存和二級緩存,如果兩級緩存中都沒有要訪問的DD對象,則會直接去存儲在InnoDB的DD tables中去讀取。后文會詳細(xì)介紹這個(gè)過程。
DD的兩級緩存底層都是基于std::map,即鍵值對來實(shí)現(xiàn)的。
- 第一級緩存是本地緩存,由每個(gè)DD client線程獨(dú)享,核心數(shù)據(jù)結(jié)構(gòu)為Local_multi_map,用于加速當(dāng)前線程對于同一對象的重復(fù)訪問,以及在當(dāng)前線程執(zhí)行DDL語句修改DD對象時(shí)管理已提交、未提交、刪除狀態(tài)的對象。
- 第二級緩存是共享緩存,為所有線程共享的全局緩存,核心數(shù)據(jù)結(jié)構(gòu)為Shared_multi_map,保存著所有線程都可以訪問到的對象,因此其中包含一些并發(fā)控制的處理。
整個(gè)DD cache的相關(guān)類圖結(jié)構(gòu)如下:
圖2 數(shù)據(jù)字典緩存類圖
Element_map是對std::map的一個(gè)封裝,鍵是id、name等,值是Cache_element,它包含了DD cache object,以及對該對象的引用計(jì)數(shù)。DD cache object就是我們要獲取的DD信息。
Multi_map_base中包含了多個(gè)Element_map,可以讓用戶根據(jù)不同類型的key來獲取緩存對象。Local_multi_map和Shared_multi_map都是繼承于Multi_map_base。
兩級緩存
第一級緩存,即本地緩存,位于每個(gè)Dictionary_client內(nèi)部,由不同狀態(tài)(committed、uncommitted、dropped)的Object_registry組成。
class Dictionary_client { private: std::vector<Entity_object *> m_uncached_objects; // Objects to be deleted. Object_registry m_registry_committed; // Registry of committed objects. Object_registry m_registry_uncommitted; // Registry of uncommitted objects. Object_registry m_registry_dropped; // Registry of dropped objects. THD *m_thd; // Thread context, needed for cache misses. ... };
代碼段1
其中m_registry_committed,存放的是DD client訪問DD時(shí)已經(jīng)提交且可見的DD cache object。如果DD client所在的當(dāng)前線程執(zhí)行的是一條DDL語句,則會在執(zhí)行過程中將要drop的舊表對應(yīng)的DD cache object存放在m_registry_dropped中,將還未提交的新表定義對應(yīng)的DD cache object存放在m_registry_uncommitted中。在事務(wù)commit/rollback后,會把m_registry_uncommitted中的DD cache object更新到m_registry_committed中去,并把m_registry_uncommitted和m_registry_dropped清空。
每個(gè)Object_registry由不同元數(shù)據(jù)類型的Local_multi_map組成,通過模板的方式,實(shí)現(xiàn)對不同類型的對象(比如表、schema、tablespace、Event 等)緩存的管理。
第二級緩存,即共享緩存,是全局唯一的,使用單例Shared_dictionary_cache來實(shí)現(xiàn)。
Shared_dictionary_cache *Shared_dictionary_cache::instance() { static Shared_dictionary_cache s_cache; return &s_cache; }
代碼段2
與本地緩存中Object_registry相似,Shared_dictionary_cache也包含針對各種類型對象的緩存。與本地緩存的區(qū)別在于,本地緩存可以無鎖訪問,而共享緩存需要在獲取/釋放DD cache object時(shí)進(jìn)行加鎖來完成并發(fā)控制,并會通過Shared_multi_map中的條件變量來完成并發(fā)訪問中的線程同步與緩存未命中情況的處理。
緩存讀取過程
邏輯流程
DD對象主要有兩種訪問方式,即通過元數(shù)據(jù)的id,或者name來訪問。需要訪問DD的數(shù)據(jù)庫工作線程通過DD client,傳入元數(shù)據(jù)的id,name等key去緩存中讀取元數(shù)據(jù)對象。讀取的整體過程:一級本地緩存 -> 二級共享緩存 -> 存儲引擎。流程圖如下:
圖3 數(shù)據(jù)字典緩存讀取流程圖
由上圖所示,在DD cache object加入到一級緩存時(shí),已經(jīng)確保其在二級緩存中也備份了一份,以供其他線程使用。
代碼實(shí)現(xiàn)如下:
// Get a dictionary object. template <typename K, typename T> bool Dictionary_client::acquire(const K &key, const T **object, bool *local_committed, bool *local_uncommitted) { ... // Lookup in registry of uncommitted objects T *uncommitted_object = nullptr; bool dropped = false; acquire_uncommitted(key, &uncommitted_object, &dropped); ... // Lookup in the registry of committed objects. Cache_element<T> *element = NULL; m_registry_committed.get(key, &element); ... // Get the object from the shared cache. if (Shared_dictionary_cache::instance()->get(m_thd, key, &element)) { DBUG_ASSERT(m_thd->is_system_thread() || m_thd->killed || m_thd->is_error()); return true; } ... }
代碼段3
在一級本地緩存中讀取時(shí),會先去m_registry_uncommitted和m_registry_dropped中讀?。ň赼cquire_uncommitted()函數(shù)中實(shí)現(xiàn)),因?yàn)檫@兩個(gè)是最新的修改。之后再去m_registry_committed中讀取,如果讀取到就直接返回,否則去二級共享緩存中嘗試讀取。共享緩存的讀取過程在Shared_multi_map::get()中實(shí)現(xiàn)。就是加鎖后直接到對應(yīng)的Element_map中查找,存在則把其加入到一級緩存中并返回;不存在,則會進(jìn)入到緩存未命中的處理流程。
緩存未命中
當(dāng)本地緩存和共享緩存中都沒有讀取到元數(shù)據(jù)對象時(shí),就會調(diào)用DD cache的持久化存儲的接口Storage_adapter::get()直接從存儲在InnoDB中的DD tables中讀取,創(chuàng)建出DD cache object后,依次把其加入到共享緩存和本地緩存中。
DD client對并發(fā)訪問未命中緩存的情況做了并發(fā)控制,這樣做有以下幾個(gè)考量:
1.因?yàn)閮?nèi)存對象可以共用,所以只需要維護(hù)一個(gè)DD cache object在內(nèi)存即可。
2.訪問持久化存儲的調(diào)用棧較深,可能涉及IO,比較耗時(shí)。
3.不需要每個(gè)線程都去持久化存儲中讀取數(shù)據(jù),避免資源的浪費(fèi)。
并發(fā)控制的代碼如下:
// Get a wrapper element from the map handling the given key type. template <typename T> template <typename K> bool Shared_multi_map<T>::get(const K &key, Cache_element<T> **element) { Autolocker lock(this); *element = use_if_present(key); if (*element) return false; // Is the element already missed? if (m_map<K>()->is_missed(key)) { while (m_map<K>()->is_missed(key)) mysql_cond_wait(&m_miss_handled, &m_lock); *element = use_if_present(key); // Here, we return only if element is non-null. An absent element // does not mean that the object does not exist, it might have been // evicted after the thread handling the first cache miss added // it to the cache, before this waiting thread was alerted. Thus, // we need to handle this situation as a cache miss if the element // is absent. if (*element) return false; } // Mark the key as being missed. m_map<K>()->set_missed(key); return true; }
代碼段4
第一個(gè)訪問未命中緩存的DD client會將key加入到Shared_multi_map的m_missed集合中,這個(gè)集合包含著現(xiàn)在所有正在讀取DD table中元數(shù)據(jù)的對象key值。之后的client在訪問DD table之前會先判斷目標(biāo)key值是否在m_missed集合中,如在,就會進(jìn)入等待。當(dāng)?shù)谝粋€(gè)DD client構(gòu)建好DD cache object,并把其加入到共享緩存之后,移除m_missed集合中對應(yīng)的key,并通過條件變量通知所有等待的線程重新在共享緩存中獲取。這樣對于同一個(gè)DD cache object,就只會對DD table訪問一次了。時(shí)序圖如下:
圖4 數(shù)據(jù)字典緩存未命中時(shí)序圖
緩存修改過程
在一個(gè)數(shù)據(jù)庫工作線程對DD進(jìn)行修改時(shí),DD cache也會在事務(wù)commit階段通過remove_uncommitted_objects()函數(shù)進(jìn)行更新,更新的過程為先把DD舊數(shù)據(jù)從緩存中刪除,再把修改后的DD cache object更新到緩存中去,先更新二級緩存,再更新一級緩存,流程圖如下:
圖5 數(shù)據(jù)字典緩存更新流程圖
因?yàn)檫@個(gè)更新DD緩存的操作是在事務(wù)commit階段進(jìn)行,所以在更新一級緩存時(shí),會先把更新后的DD cache object放到一級緩存中的m_registry_committed里去,再把m_registry_uncommitted和m_registry_dropped清空。
緩存失效過程
當(dāng)Dictionary_client的drop方法被調(diào)用對元數(shù)據(jù)對象進(jìn)行清理時(shí),在元數(shù)據(jù)對象從DD tables中刪除后,會調(diào)用invalidate()函數(shù)使兩級緩存中的DD cache object失效。流程圖如下:
圖6 數(shù)據(jù)字典緩存失效流程圖
這里在判斷DD cache object在一級緩存中存在,并在一級緩存中刪除掉該對象后,可以直接在二級緩存中完成刪除操作。緩存失效的過程受到元數(shù)據(jù)鎖(Metadata lock, MDL)的保護(hù),因?yàn)樵獢?shù)據(jù)鎖的并發(fā)控制,保證了一個(gè)線程在刪除共享緩存時(shí),不會有其他線程也來刪除它。實(shí)際上本地緩存的數(shù)據(jù)有效,就是依賴于元數(shù)據(jù)鎖的保護(hù),否則共享緩存區(qū)域的信息,是可以被其他線程更改的。
緩存容量管理
一級本地緩存為DD client線程獨(dú)享,由RAII類Auto_releaser來負(fù)責(zé)管理其生命周期。其具體流程為:每次建立一個(gè)DD client時(shí),會定義一個(gè)對應(yīng)的Auto_releaser類,當(dāng)訪問DD時(shí),會把讀取到的DD cache object同時(shí)加到Auto_releaser里面的m_release_registry中去,當(dāng)Auto_releaser析構(gòu)時(shí),會調(diào)用Dictionary_client的release()函數(shù)把m_release_registry中的DD緩存全部釋放掉。
二級共享緩存會在Shared_dictionary_cache初始化時(shí),根據(jù)不同類型的對象設(shè)定好緩存的容量,代碼如下:
void Shared_dictionary_cache::init() { instance()->m_map<Collation>()->set_capacity(collation_capacity); instance()->m_map<Charset>()->set_capacity(charset_capacity); ... }
代碼段5
在二級緩存容量達(dá)到上限時(shí),會通過LRU的緩存淘汰策略來淘汰最近最少使用的DD cache對象。在一級緩存中存在的緩存對象不會被淘汰。
// Helper function to evict unused elements from the free list. template <typename T> void Shared_multi_map<T>::rectify_free_list(Autolocker *lock) { mysql_mutex_assert_owner(&m_lock); while (map_capacity_exceeded() && m_free_list.length() > 0) { Cache_element<T> *e = m_free_list.get_lru(); DBUG_ASSERT(e && e->object()); m_free_list.remove(e); // Mark the object as being used to allow it to be removed. e->use(); remove(e, lock); } }
代碼段6
總結(jié)
MySQL 8.0中的數(shù)據(jù)字典,通過對兩級緩存的逐級訪問,以及精妙的對緩存未命中情況的處理方式,有效的加速了在不同場景下數(shù)據(jù)庫對DD的訪問速度,顯著的提升了數(shù)據(jù)庫訪問元數(shù)據(jù)信息的效率。另外本文還提到了元數(shù)據(jù)鎖對數(shù)據(jù)字典緩存的保護(hù),關(guān)于元數(shù)據(jù)鎖的相關(guān)機(jī)制,會在后續(xù)文章陸續(xù)介紹。
到此這篇關(guān)于解讀MySQL 8.0數(shù)據(jù)字典緩存管理機(jī)制的文章就介紹到這了,更多相關(guān)MySQL數(shù)據(jù)字典內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
sql四大排名函數(shù)之ROW_NUMBER、RANK、DENSE_RANK、NTILE使用介紹
這篇文章主要介紹了sql四大排名函數(shù)之ROW_NUMBER、RANK、DENSE_RANK、NTILE使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Navicat導(dǎo)入mysql數(shù)據(jù)庫的圖文教程
本文主要介紹了Navicat導(dǎo)入mysql數(shù)據(jù)庫的圖文教程,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-07-07MySQL實(shí)現(xiàn)批量推送數(shù)據(jù)到Mongo
這篇文章主要為大家詳細(xì)介紹了MySQL如何實(shí)現(xiàn)批量推送數(shù)據(jù)到Mongo,文中的示例代碼講解詳細(xì),具有一定的學(xué)習(xí)價(jià)值,感興趣的可以了解一下2023-05-05You must SET PASSWORD before execut
今天在MySql5.6操作時(shí)報(bào)錯(cuò):You must SET PASSWORD before executing this statement解決方法,需要的朋友可以參考下2013-06-06MySQL之高可用集群部署及故障切換實(shí)現(xiàn)
這篇文章主要介紹了MySQL之高可用集群部署及故障切換實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04重新restore了mysql到另一臺機(jī)器上后mysql 編碼問題報(bào)錯(cuò)
重新restore了mysql到另一臺機(jī)器上,今天新寫了一個(gè)app,發(fā)現(xiàn)在admin界面下一添加漢字就會報(bào)錯(cuò)2011-12-12