淺談Java高并發(fā)解決方案以及高負(fù)載優(yōu)化方法
一個(gè)小型的網(wǎng)站,比如個(gè)人網(wǎng)站,可以使用最簡(jiǎn)單的html靜態(tài)頁(yè)面就實(shí)現(xiàn)了,配合一些圖片達(dá)到美化效果,所有的頁(yè)面均存放在一個(gè)目錄下,這樣的網(wǎng)站對(duì)系統(tǒng)架構(gòu)、性能的要求都很簡(jiǎn)單,隨著互聯(lián)網(wǎng)業(yè)務(wù)的不斷豐富,網(wǎng)站相關(guān)的技術(shù)經(jīng)過(guò)這些年的發(fā)展,已經(jīng)細(xì)分到很細(xì)的方方面面,尤其對(duì)于大型網(wǎng)站來(lái)說(shuō),所采用的技術(shù)更是涉及面非常廣,從硬件到軟件、編程語(yǔ)言、數(shù)據(jù)庫(kù)、WebServer、防火墻等各個(gè)領(lǐng)域都有了很高的要求,已經(jīng)不是原來(lái)簡(jiǎn)單的html靜態(tài)網(wǎng)站所能比擬的。
大型網(wǎng)站,比如門戶網(wǎng)站。在面對(duì)大量用戶訪問(wèn)、高并發(fā)請(qǐng)求方面,基本的解決方案集中在這樣幾個(gè)環(huán)節(jié):使用高性能的服務(wù)器、高性能的數(shù)據(jù)庫(kù)、高效率的編程語(yǔ)言、還有高性能的Web容器。但是除了這幾個(gè)方面,還沒法根本解決大型網(wǎng)站面臨的高負(fù)載和高并發(fā)問(wèn)題。
上面提供的幾個(gè)解決思路在一定程度上也意味著更大的投入,并且這樣的解決思路具備瓶頸,沒有很好的擴(kuò)展性,下面我從低成本、高性能和高擴(kuò)張性的角度來(lái)說(shuō)說(shuō)我的一些經(jīng)驗(yàn)。
1、HTML靜態(tài)化
其實(shí)大家都知道,效率最高、消耗最小的就是純靜態(tài)化的html頁(yè)面,所以我們盡可能使我們的網(wǎng)站上的頁(yè)面采用靜態(tài)頁(yè)面來(lái)實(shí)現(xiàn),這個(gè)最簡(jiǎn)單的方法其實(shí)也是最有效的方法。但是對(duì)于大量?jī)?nèi)容并且頻繁更新的網(wǎng)站,我們無(wú)法全部手動(dòng)去挨個(gè)實(shí)現(xiàn),于是出現(xiàn)了我們常見的信息發(fā)布系統(tǒng)CMS,像我們常訪問(wèn)的各個(gè)門戶站點(diǎn)的新聞?lì)l道,甚至他們的其他頻道,都是通過(guò)信息發(fā)布系統(tǒng)來(lái)管理和實(shí)現(xiàn)的,信息發(fā)布系統(tǒng)可以實(shí)現(xiàn)最簡(jiǎn)單的信息錄入自動(dòng)生成靜態(tài)頁(yè)面,還能具備頻道管理、權(quán)限管理、自動(dòng)抓取等功能,對(duì)于一個(gè)大型網(wǎng)站來(lái)說(shuō),擁有一套高效、可管理的CMS是必不可少的。
除了門戶和信息發(fā)布類型的網(wǎng)站,對(duì)于交互性要求很高的社區(qū)類型網(wǎng)站來(lái)說(shuō),盡可能的靜態(tài)化也是提高性能的必要手段,將社區(qū)內(nèi)的帖子、文章進(jìn)行實(shí)時(shí)的靜態(tài)化,有更新的時(shí)候再重新靜態(tài)化也是大量使用的策略,像Mop的大雜燴就是使用了這樣的策略,網(wǎng)易社區(qū)等也是如此。
同時(shí),html靜態(tài)化也是某些緩存策略使用的手段,對(duì)于系統(tǒng)中頻繁使用數(shù)據(jù)庫(kù)查詢但是內(nèi)容更新很小的應(yīng)用,可以考慮使用html靜態(tài)化來(lái)實(shí)現(xiàn),比如論壇中論壇的公用設(shè)置信息,這些信息目前的主流論壇都可以進(jìn)行后臺(tái)管理并且存儲(chǔ)再數(shù)據(jù)庫(kù)中,這些信息其實(shí)大量被前臺(tái)程序調(diào)用,但是更新頻率很小,可以考慮將這部分內(nèi)容進(jìn)行后臺(tái)更新的時(shí)候進(jìn)行靜態(tài)化,這樣避免了大量的數(shù)據(jù)庫(kù)訪問(wèn)請(qǐng)求。
2、圖片服務(wù)器分離
大家知道,對(duì)于Web服務(wù)器來(lái)說(shuō),不管是Apache、IIS還是其他容器,圖片是最消耗資源的,于是我們有必要將圖片與頁(yè)面進(jìn)行分離,這是基本上大型網(wǎng)站都會(huì)采用的策略,他們都有獨(dú)立的圖片服務(wù)器,甚至很多臺(tái)圖片服務(wù)器。這樣的架構(gòu)可以降低提供頁(yè)面訪問(wèn)請(qǐng)求的服務(wù)器系統(tǒng)壓力,并且可以保證系統(tǒng)不會(huì)因?yàn)閳D片問(wèn)題而崩潰,在應(yīng)用服務(wù)器和圖片服務(wù)器上,可以進(jìn)行不同的配置優(yōu)化,比如apache在配置ContentType的時(shí)候可以盡量少支持,盡可能少的LoadModule,保證更高的系統(tǒng)消耗和執(zhí)行效率。
3、數(shù)據(jù)庫(kù)集群和庫(kù)表散列
大型網(wǎng)站都有復(fù)雜的應(yīng)用,這些應(yīng)用必須使用數(shù)據(jù)庫(kù),那么在面對(duì)大量訪問(wèn)的時(shí)候,數(shù)據(jù)庫(kù)的瓶頸很快就能顯現(xiàn)出來(lái),這時(shí)一臺(tái)數(shù)據(jù)庫(kù)將很快無(wú)法滿足應(yīng)用,于是我們需要使用數(shù)據(jù)庫(kù)集群或者庫(kù)表散列。
在數(shù)據(jù)庫(kù)集群方面,很多數(shù)據(jù)庫(kù)都有自己的解決方案,Oracle、Sybase等都有很好的方案,常用的MySQL提供的Master/Slave也是類似的方案,您使用了什么樣的DB,就參考相應(yīng)的解決方案來(lái)實(shí)施即可。
上面提到的數(shù)據(jù)庫(kù)集群由于在架構(gòu)、成本、擴(kuò)張性方面都會(huì)受到所采用DB類型的限制,于是我們需要從應(yīng)用程序的角度來(lái)考慮改善系統(tǒng)架構(gòu),庫(kù)表散列是常用并且最有效的解決方案。我們?cè)趹?yīng)用程序中安裝業(yè)務(wù)和應(yīng)用或者功能模塊將數(shù)據(jù)庫(kù)進(jìn)行分離,不同的模塊對(duì)應(yīng)不同的數(shù)據(jù)庫(kù)或者表,再按照一定的策略對(duì)某個(gè)頁(yè)面或者功能進(jìn)行更小的數(shù)據(jù)庫(kù)散列,比如用戶表,按照用戶ID進(jìn)行表散列,這樣就能夠低成本的提升系統(tǒng)的性能并且有很好的擴(kuò)展性。sohu的論壇就是采用了這樣的架構(gòu),將論壇的用戶、設(shè)置、帖子等信息進(jìn)行數(shù)據(jù)庫(kù)分離,然后對(duì)帖子、用戶按照板塊和ID進(jìn)行散列數(shù)據(jù)庫(kù)和表,最終可以在配置文件中進(jìn)行簡(jiǎn)單的配置便能讓系統(tǒng)隨時(shí)增加一臺(tái)低成本的數(shù)據(jù)庫(kù)進(jìn)來(lái)補(bǔ)充系統(tǒng)性能。
4、緩存
緩存一詞搞技術(shù)的都接觸過(guò),很多地方用到緩存。網(wǎng)站架構(gòu)和網(wǎng)站開發(fā)中的緩存也是非常重要。這里先講述最基本的兩種緩存。高級(jí)和分布式的緩存在后面講述。
架構(gòu)方面的緩存,對(duì)Apache比較熟悉的人都能知道Apache提供了自己的緩存模塊,也可以使用外加的Squid模塊進(jìn)行緩存,這兩種方式均可以有效的提高Apache的訪問(wèn)響應(yīng)能力。
網(wǎng)站程序開發(fā)方面的緩存,Linux上提供的Memory Cache是常用的緩存接口,可以在web開發(fā)中使用,比如用Java開發(fā)的時(shí)候就可以調(diào)用MemoryCache對(duì)一些數(shù)據(jù)進(jìn)行緩存和通訊共享,一些大型社區(qū)使用了這樣的架構(gòu)。另外,在使用web語(yǔ)言開發(fā)的時(shí)候,各種語(yǔ)言基本都有自己的緩存模塊和方法,PHP有Pear的Cache模塊,Java就更多了,.net不是很熟悉,相信也肯定有。
5、鏡像
鏡像是大型網(wǎng)站常采用的提高性能和數(shù)據(jù)安全性的方式,鏡像的技術(shù)可以解決不同網(wǎng)絡(luò)接入商和地域帶來(lái)的用戶訪問(wèn)速度差異,比如ChinaNet和EduNet之間的差異就促使了很多網(wǎng)站在教育網(wǎng)內(nèi)搭建鏡像站點(diǎn),數(shù)據(jù)進(jìn)行定時(shí)更新或者實(shí)時(shí)更新。在鏡像的細(xì)節(jié)技術(shù)方面,這里不闡述太深,有很多專業(yè)的現(xiàn)成的解決架構(gòu)和產(chǎn)品可選。也有廉價(jià)的通過(guò)軟件實(shí)現(xiàn)的思路,比如Linux上的rsync等工具。
6、負(fù)載均衡
負(fù)載均衡將是大型網(wǎng)站解決高負(fù)荷訪問(wèn)和大量并發(fā)請(qǐng)求采用的終極解決辦法。
負(fù)載均衡技術(shù)發(fā)展了多年,有很多專業(yè)的服務(wù)提供商和產(chǎn)品可以選擇,我個(gè)人接觸過(guò)一些解決方法,其中有兩個(gè)架構(gòu)可以給大家做參考。
1)硬件四層交換
第四層交換使用第三層和第四層信息包的報(bào)頭信息,根據(jù)應(yīng)用區(qū)間識(shí)別業(yè)務(wù)流,將整個(gè)區(qū)間段的業(yè)務(wù)流分配到合適的應(yīng)用服務(wù)器進(jìn)行處理。 第四層交換功能就象是虛IP,指向物理服務(wù)器。它傳輸?shù)臉I(yè)務(wù)服從的協(xié)議多種多樣,有HTTP、FTP、NFS、Telnet或其他協(xié)議。這些業(yè)務(wù)在物理服務(wù)器基礎(chǔ)上,需要復(fù)雜的載量平衡算法。在IP世界,業(yè)務(wù)類型由終端TCP或UDP端口地址來(lái)決定,在第四層交換中的應(yīng)用區(qū)間則由源端和終端IP地址、TCP和UDP端口共同決定。
在硬件四層交換產(chǎn)品領(lǐng)域,有一些知名的產(chǎn)品可以選擇,比如Alteon、F5等,這些產(chǎn)品很昂貴,但是物有所值,能夠提供非常優(yōu)秀的性能和很靈活的管理能力。Yahoo中國(guó)當(dāng)初接近2000臺(tái)服務(wù)器使用了三四臺(tái)Alteon就搞定了。
2)軟件四層交換
大家知道了硬件四層交換機(jī)的原理后,基于OSI模型來(lái)實(shí)現(xiàn)的軟件四層交換也就應(yīng)運(yùn)而生,這樣的解決方案實(shí)現(xiàn)的原理一致,不過(guò)性能稍差。但是滿足一定量的壓力還是游刃有余的,有人說(shuō)軟件實(shí)現(xiàn)方式其實(shí)更靈活,處理能力完全看你配置的熟悉能力。
軟件四層交換我們可以使用Linux上常用的LVS來(lái)解決,LVS就是Linux Virtual Server,他提供了基于心跳線heartbeat的實(shí)時(shí)災(zāi)難應(yīng)對(duì)解決方案,提高系統(tǒng)的魯棒性,同時(shí)可供了靈活的虛擬VIP配置和管理功能,可以同時(shí)滿足多種應(yīng)用需求,這對(duì)于分布式的系統(tǒng)來(lái)說(shuō)必不可少。
一個(gè)典型的使用負(fù)載均衡的策略就是,在軟件或者硬件四層交換的基礎(chǔ)上搭建squid集群,這種思路在很多大型網(wǎng)站包括搜索引擎上被采用,這樣的架構(gòu)低成本、高性能還有很強(qiáng)的擴(kuò)張性,隨時(shí)往架構(gòu)里面增減節(jié)點(diǎn)都非常容易。這樣的架構(gòu)我準(zhǔn)備空了專門詳細(xì)整理一下和大家探討。
一、高并發(fā)高負(fù)載類網(wǎng)站關(guān)注點(diǎn)之?dāng)?shù)據(jù)庫(kù)
沒錯(cuò),首先是數(shù)據(jù)庫(kù),這是大多數(shù)應(yīng)用所面臨的首個(gè)SPOF。尤其是Web2.0的應(yīng)用,數(shù)據(jù)庫(kù)的響應(yīng)是首先要解決的。
一般來(lái)說(shuō)MySQL是最常用的,可能最初是一個(gè)mysql主機(jī),當(dāng)數(shù)據(jù)增加到100萬(wàn)以上,那么,MySQL的效能急劇下降。常用的優(yōu)化措施是M-S(主-從)方式進(jìn)行同步復(fù)制,將查詢和操作和分別在不同的服務(wù)器上進(jìn)行操作。我推薦的是M-M-Slaves方式,2個(gè)主Mysql,多個(gè)Slaves,需要注意的是,雖然有2個(gè)Master,但是同時(shí)只有1個(gè)是Active,我們可以在一定時(shí)候切換。之所以用2個(gè)M,是保證M不會(huì)又成為系統(tǒng)的SPOF。
Slaves可以進(jìn)一步負(fù)載均衡,可以結(jié)合LVS,從而將select操作適當(dāng)?shù)钠胶獾讲煌膕laves上。
以上架構(gòu)可以抗衡到一定量的負(fù)載,但是隨著用戶進(jìn)一步增加,你的用戶表數(shù)據(jù)超過(guò)1千萬(wàn),這時(shí)那個(gè)M變成了SPOF。你不能任意擴(kuò)充Slaves,否則復(fù)制同步的開銷將直線上升,怎么辦?我的方法是表分區(qū),從業(yè)務(wù)層面上進(jìn)行分區(qū)。最簡(jiǎn)單的,以用戶數(shù)據(jù)為例。根據(jù)一定的切分方式,比如id,切分到不同的數(shù)據(jù)庫(kù)集群去。
全局?jǐn)?shù)據(jù)庫(kù)用于meta數(shù)據(jù)的查詢。缺點(diǎn)是每次查詢,會(huì)增加一次,比如你要查一個(gè)用戶nightsailer,你首先要到全局?jǐn)?shù)據(jù)庫(kù)群找到nightsailer對(duì)應(yīng)的cluster id,然后再到指定的cluster找到nightsailer的實(shí)際數(shù)據(jù)。
每個(gè)cluster可以用m-m方式,或者m-m-slaves方式。這是一個(gè)可以擴(kuò)展的結(jié)構(gòu),隨著負(fù)載的增加,你可以簡(jiǎn)單的增加新的mysql cluster進(jìn)去。
需要注意的是:
- 禁用全部auto_increment的字段
- id需要采用通用的算法集中分配
- 要具有比較好的方法來(lái)監(jiān)控mysql主機(jī)的負(fù)載和服務(wù)的運(yùn)行狀態(tài)。如果你有30臺(tái)以上的mysql數(shù)據(jù)庫(kù)在跑就明白我的意思了。
- 不要使用持久性鏈接(不要用pconnect),相反,使用sqlrelay這種第三方的數(shù)據(jù)庫(kù)鏈接池,或者干脆自己做,因?yàn)閜hp4中mysql的鏈接池經(jīng)常出問(wèn)題。
二、高并發(fā)高負(fù)載網(wǎng)站的系統(tǒng)架構(gòu)之HTML靜態(tài)化
其實(shí)大家都知道,效率最高、消耗最小的就是純靜態(tài)化的html頁(yè)面,所以我們盡可能使我們的網(wǎng)站上的頁(yè)面采用靜態(tài)頁(yè)面來(lái)實(shí)現(xiàn),這個(gè)最簡(jiǎn)單的方法其實(shí)也是 最有效的方法。但是對(duì)于大量?jī)?nèi)容并且頻繁更新的網(wǎng)站,我們無(wú)法全部手動(dòng)去挨個(gè)實(shí)現(xiàn),于是出現(xiàn)了我們常見的信息發(fā)布系統(tǒng)CMS,像我們常訪問(wèn)的各個(gè)門戶站點(diǎn) 的新聞?lì)l道,甚至他們的其他頻道,都是通過(guò)信息發(fā)布系統(tǒng)來(lái)管理和實(shí)現(xiàn)的,信息發(fā)布系統(tǒng)可以實(shí)現(xiàn)最簡(jiǎn)單的信息錄入自動(dòng)生成靜態(tài)頁(yè)面,還能具備頻道管理、權(quán)限 管理、自動(dòng)抓取等功能,對(duì)于一個(gè)大型網(wǎng)站來(lái)說(shuō),擁有一套高效、可管理的CMS是必不可少的。
除了門戶和信息發(fā)布類型的網(wǎng)站,對(duì)于交互性要求很高的社區(qū)類型網(wǎng)站來(lái)說(shuō),盡可能的靜態(tài)化也是提高性能的必要手段,將社區(qū)內(nèi)的帖子、文章進(jìn)行實(shí)時(shí)的靜態(tài)化,有更新的時(shí)候再重新靜態(tài)化也是大量使用的策略,像Mop的大雜燴就是使用了這樣的策略,網(wǎng)易社區(qū)等也是如此。
同時(shí),html靜態(tài)化也是某些緩存策略使用的手段,對(duì)于系統(tǒng)中頻繁使用數(shù)據(jù)庫(kù)查詢但是內(nèi)容更新很小的應(yīng)用,可以考慮使用html靜態(tài)化來(lái)實(shí)現(xiàn),比如論壇 中論壇的公用設(shè)置信息,這些信息目前的主流論壇都可以進(jìn)行后臺(tái)管理并且存儲(chǔ)再數(shù)據(jù)庫(kù)中,這些信息其實(shí)大量被前臺(tái)程序調(diào)用,但是更新頻率很小,可以考慮將這 部分內(nèi)容進(jìn)行后臺(tái)更新的時(shí)候進(jìn)行靜態(tài)化,這樣避免了大量的數(shù)據(jù)庫(kù)訪問(wèn)請(qǐng)求高并發(fā)?! ?/p>
網(wǎng)站HTML靜態(tài)化解決方案 :
- 當(dāng)一個(gè)Servlet資源請(qǐng)求到達(dá)WEB服務(wù)器之后我們會(huì)填充指定的JSP頁(yè)面來(lái)響應(yīng)請(qǐng)求:
- HTTP請(qǐng)求→Web服務(wù)器→Servlet→業(yè)務(wù)邏輯處理→訪問(wèn)數(shù)據(jù)→填充JSP→響應(yīng)請(qǐng)求
- HTML靜態(tài)化之后:
- HTTP請(qǐng)求→Web服務(wù)器→Servlet→HTML→響應(yīng)請(qǐng)求
靜態(tài)訪求如下(Servlet):
public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { if(request.getParameter("chapterId") != null){ String chapterFileName = "bookChapterRead_"+request.getParameter("chapterId")+".html"; String chapterFilePath = getServletContext().getRealPath("/") + chapterFileName; File chapterFile = new File(chapterFilePath); if(chapterFile.exists()){response.sendRedirect(chapterFileName);return;}//如果有這個(gè)文件就告訴瀏覽器轉(zhuǎn)向 INovelChapterBiz novelChapterBiz = new NovelChapterBizImpl(); NovelChapter novelChapter = novelChapterBiz.searchNovelChapterById(Integer.parseInt(request.getParameter("chapterId")));//章節(jié)信息 int lastPageId = novelChapterBiz.searchLastCHapterId(novelChapter.getNovelId().getId(), novelChapter.getId()); int nextPageId = novelChapterBiz.searchNextChapterId(novelChapter.getNovelId().getId(), novelChapter.getId()); request.setAttribute("novelChapter", novelChapter); request.setAttribute("lastPageId", lastPageId); request.setAttribute("nextPageId", nextPageId); new CreateStaticHTMLPage().createStaticHTMLPage(request, response, getServletContext(), chapterFileName, chapterFilePath, "/bookRead.jsp"); } }
生成HTML靜態(tài)頁(yè)面的類:
package com.jb.y2t034.thefifth.web.servlet; import java.io.ByteArrayOutputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.OutputStreamWriter; import java.io.PrintWriter; import javax.servlet.RequestDispatcher; import javax.servlet.ServletContext; import javax.servlet.ServletException; import javax.servlet.ServletOutputStream; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import javax.servlet.http.HttpServletResponseWrapper; /** * 創(chuàng)建HTML靜態(tài)頁(yè)面 * 功能:創(chuàng)建HTML靜態(tài)頁(yè)面 * 時(shí)間:2009年1011日 * 地點(diǎn):home * @author mavk * */ public class CreateStaticHTMLPage { /** * 生成靜態(tài)HTML頁(yè)面的方法 * @param request 請(qǐng)求對(duì)象 * @param response 響應(yīng)對(duì)象 * @param servletContext Servlet上下文 * @param fileName 文件名稱 * @param fileFullPath 文件完整路徑 * @param jspPath 需要生成靜態(tài)文件的JSP路徑(相對(duì)即可) * @throws IOException * @throws ServletException */ public void createStaticHTMLPage(HttpServletRequest request, HttpServletResponse response,ServletContext servletContext,String fileName,String fileFullPath,String jspPath) throws ServletException, IOException{ response.setContentType("text/html;charset=gb2312");//設(shè)置HTML結(jié)果流編碼(即HTML文件編碼) RequestDispatcher rd = servletContext.getRequestDispatcher(jspPath);//得到JSP資源 final ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();//用于從ServletOutputStream中接收資源 final ServletOutputStream servletOuputStream = new ServletOutputStream(){//用于從HttpServletResponse中接收資源 public void write(byte[] b, int off,int len){ byteArrayOutputStream.write(b, off, len); } public void write(int b){ byteArrayOutputStream.write(b); } }; final PrintWriter printWriter = new PrintWriter(new OutputStreamWriter(byteArrayOutputStream));//把轉(zhuǎn)換字節(jié)流轉(zhuǎn)換成字符流 HttpServletResponse httpServletResponse = new HttpServletResponseWrapper(response){//用于從response獲取結(jié)果流資源(重寫了兩個(gè)方法) public ServletOutputStream getOutputStream(){ return servletOuputStream; } public PrintWriter getWriter(){ return printWriter; } }; rd.include(request, httpServletResponse);//發(fā)送結(jié)果流 printWriter.flush();//刷新緩沖區(qū),把緩沖區(qū)的數(shù)據(jù)輸出 FileOutputStream fileOutputStream = new FileOutputStream(fileFullPath); byteArrayOutputStream.writeTo(fileOutputStream);//把byteArrayOuputStream中的資源全部寫入到fileOuputStream中 fileOutputStream.close();//關(guān)閉輸出流,并釋放相關(guān)資源 response.sendRedirect(fileName);//發(fā)送指定文件流到客戶端 } }
三、高并發(fā)高負(fù)載類網(wǎng)站關(guān)注點(diǎn)之緩存、負(fù)載均衡、存儲(chǔ)
緩存是另一個(gè)大問(wèn)題,我一般用memcached來(lái)做緩存集群,一般來(lái)說(shuō)部署10臺(tái)左右就差不多(10g內(nèi)存池)。需要注意一點(diǎn),千萬(wàn)不能用使用swap,最好關(guān)閉linux的swap。
負(fù)載均衡/加速
可能上面說(shuō)緩存的時(shí)候,有人第一想的是頁(yè)面靜態(tài)化,所謂的靜態(tài)html,我認(rèn)為這是常識(shí),不屬于要點(diǎn)了。頁(yè)面的靜態(tài)化隨之帶來(lái)的是靜態(tài)服務(wù)的
負(fù)載均衡和加速。我認(rèn)為L(zhǎng)ighttped+Squid是最好的方式了。
LVS <------->lighttped====>squid(s) ====lighttpd
上面是我經(jīng)常用的。注意,我沒有用apache,除非特定的需求,否則我不部署apache,因?yàn)槲乙话阌胮hp-fastcgi配合lighttpd, 性能比apache+mod_php要強(qiáng)很多。
squid的使用可以解決文件的同步等等問(wèn)題,但是需要注意,你要很好的監(jiān)控緩存的命中率,盡可能的提高的90%以上。 squid和lighttped也有很多的話題要討論,這里不贅述。
存儲(chǔ)
存儲(chǔ)也是一個(gè)大問(wèn)題,一種是小文件的存儲(chǔ),比如圖片這類。另一種是大文件的存儲(chǔ),比如搜索引擎的索引,一般單文件都超過(guò)2g以上。
小文件的存儲(chǔ)最簡(jiǎn)單的方法是結(jié)合lighttpd來(lái)進(jìn)行分布?;蛘吒纱嗍褂肦edhat的GFS,優(yōu)點(diǎn)是應(yīng)用透明,缺點(diǎn)是費(fèi)用較高。我是指
你購(gòu)買盤陣的問(wèn)題。我的項(xiàng)目中,存儲(chǔ)量是2-10Tb,我采用了分布式存儲(chǔ)。這里要解決文件的復(fù)制和冗余。
這樣每個(gè)文件有不同的冗余,這方面可以參考google的gfs的論文。
大文件的存儲(chǔ),可以參考nutch的方案,現(xiàn)在已經(jīng)獨(dú)立為hadoop子項(xiàng)目。(你可以google it)
其他:此外,passport等也是考慮的,不過(guò)都屬于比較簡(jiǎn)單的了。
四、高并發(fā)高負(fù)載網(wǎng)站的系統(tǒng)架構(gòu)之圖片服務(wù)器分離
大家知道,對(duì)于Web 服務(wù)器來(lái)說(shuō),不管是Apache、IIS還是其他容器,圖片是最消耗資源的,于是我們有必要將圖片與頁(yè)面進(jìn)行分離,這是基本上大型網(wǎng)站都會(huì)采用的策略,他 們都有獨(dú)立的圖片服務(wù)器,甚至很多臺(tái)圖片服務(wù)器。這樣的架構(gòu)可以降低提供頁(yè)面訪問(wèn)請(qǐng)求的服務(wù)器系統(tǒng)壓力,并且可以保證系統(tǒng)不會(huì)因?yàn)閳D片問(wèn)題而崩潰,在應(yīng)用服務(wù)器和圖片服務(wù)器上,可以進(jìn)行不同的配置優(yōu)化,比如apache在配置ContentType的時(shí)候可以盡量少支持,盡可能少的LoadModule, 保證更高的系統(tǒng)消耗和執(zhí)行效率。
利用Apache實(shí)現(xiàn)圖片服務(wù)器的分離,緣由:
起步階段的應(yīng)用,都可能部署在一臺(tái)服務(wù)器上(費(fèi)用上的原因) :
- 第一個(gè)優(yōu)先分離的,肯定是數(shù)據(jù)庫(kù)和應(yīng)用服務(wù)器。
- 第二個(gè)分離的,會(huì)是什么呢?各有各的考慮,我所在的項(xiàng)目組重點(diǎn)考慮的節(jié)約帶寬,服務(wù)器性能再好,帶寬再高,并發(fā)來(lái)了,也容易撐不住。因此,我這篇文章的重點(diǎn)在這里。這里重點(diǎn)是介紹實(shí)踐,不一定符合所有情況,供看者參考吧,
環(huán)境介紹:
- WEB應(yīng)用服務(wù)器:4CPU雙核2G, 內(nèi)存4G
- 部署:Win2003/Apache Http Server 2.1/Tomcat6
- 數(shù)據(jù)庫(kù)服務(wù)器:4CPU雙核2G, 內(nèi)存4G
- 部署:Win2003/MSSQL2000
步驟:
步驟一:增加2臺(tái)配置為:2CPU雙核2G,內(nèi)存2G普通服務(wù)器,做資源服務(wù)器
部署:Tomcat6,跑了一個(gè)圖片上傳的簡(jiǎn)單應(yīng)用,(記得指定web.xml的<distributable/>),并指定域名為res1.***.com,res2.***.com,采用ajp協(xié)議
步驟二:修改Apache httpd.conf配置
原來(lái)應(yīng)用的文件上傳功能網(wǎng)址為:
1、/fileupload.html
2、/otherupload.html
在httpd.conf中增加如下配置
<VirtualHost *:80> ServerAdmin webmaster@***.com ProxyPass /fileupload.html balancer://rescluster/fileupload lbmethod=byrequests stickysession=JSESSIONID nofailover=Off timeout=5 maxattempts=3 ProxyPass /otherupload.html balancer://rescluster/otherupload.html lbmethod=byrequests stickysession=JSESSIONID nofailover=Off timeout=5 maxattempts=3 #<!--負(fù)載均衡--> <Proxy balancer://rescluster/> BalancerMember ajp://res1.***.com:8009 smax=5 max=500 ttl=120 retry=300 loadfactor=100 route=tomcat1 BalancerMember ajp://res2.***.com:8009 smax=5 max=500 ttl=120 retry=300 loadfactor=100 route=tomcat2 </Proxy> < /VirtualHost>
步驟三,修改業(yè)務(wù)邏輯:
所有上傳文件在數(shù)據(jù)庫(kù)中均采用全url的方式保存,例如產(chǎn)品圖片路徑存成:
http://res1.***.com/upload/20090101/product120302005.jpg
現(xiàn)在,你可以高枕無(wú)憂了,帶寬不夠時(shí),增加個(gè)幾十臺(tái)圖片服務(wù)器,只需要稍微修改一下apache的配置文件,即可。
五、高并發(fā)高負(fù)載網(wǎng)站的系統(tǒng)架構(gòu)之?dāng)?shù)據(jù)庫(kù)集群和庫(kù)表散列
大型網(wǎng)站都有復(fù)雜的應(yīng)用,這些應(yīng)用必須使用數(shù)據(jù)庫(kù),那么在面對(duì)大量訪問(wèn)的時(shí)候,數(shù)據(jù)庫(kù)的瓶頸很快就能顯現(xiàn)出來(lái),這時(shí)一臺(tái)數(shù)據(jù)庫(kù)將很快無(wú)法滿足應(yīng)用,于是我們需要使用數(shù)據(jù)庫(kù)集群或者庫(kù)表散列。
在數(shù)據(jù)庫(kù)集群方面,很多數(shù)據(jù)庫(kù)都有自己的解決方案,Oracle、Sybase等都有很好的方案,常用的MySQL提供的Master/Slave也是類似的方案,您使用了什么樣的DB,就參考相應(yīng)的解決方案來(lái)實(shí)施即可。
上面提到的數(shù)據(jù)庫(kù)集群由于在架構(gòu)、成本、擴(kuò)張性方面都會(huì)受到所采用DB類型的限制,于是我們需要從應(yīng)用程序的角度來(lái)考慮改善系統(tǒng)架構(gòu),庫(kù)表散列是常用并 且最有效的解決方案。我們?cè)趹?yīng)用程序中安裝業(yè)務(wù)和應(yīng)用或者功能模塊將數(shù)據(jù)庫(kù)進(jìn)行分離,不同的模塊對(duì)應(yīng)不同的數(shù)據(jù)庫(kù)或者表,再按照一定的策略對(duì)某個(gè)頁(yè)面或者 功能進(jìn)行更小的數(shù)據(jù)庫(kù)散列,比如用戶表,按照用戶ID進(jìn)行表散列,這樣就能夠低成本的提升系統(tǒng)的性能并且有很好的擴(kuò)展性。sohu的論壇就是采用了這樣的 架構(gòu),將論壇的用戶、設(shè)置、帖子等信息進(jìn)行數(shù)據(jù)庫(kù)分離,然后對(duì)帖子、用戶按照板塊和ID進(jìn)行散列數(shù)據(jù)庫(kù)和表,最終可以在配置文件中進(jìn)行簡(jiǎn)單的配置便能讓系 統(tǒng)隨時(shí)增加一臺(tái)低成本的數(shù)據(jù)庫(kù)進(jìn)來(lái)補(bǔ)充系統(tǒng)性能。
集群軟件的分類
一般來(lái)講,集群軟件根據(jù)側(cè)重的方向和試圖解決的問(wèn)題,分為三大類:高性能集群(High performance cluster,HPC)、負(fù)載均衡集群(Load balance cluster, LBC),高可用性集群(High availability cluster,HAC)。高性能集群(High performance cluster,HPC),它是利用一個(gè)集群中的多臺(tái)機(jī)器共同完成同一件任務(wù),使得完成任務(wù)的速度和可靠性都遠(yuǎn)遠(yuǎn)高于單機(jī)運(yùn)行的效果。彌補(bǔ)了單機(jī)性能上的不足。該集群在天氣預(yù)報(bào)、環(huán)境監(jiān)控等數(shù)據(jù)量大,計(jì)算復(fù)雜的環(huán)境中應(yīng)用比較多;
負(fù)載均衡集群(Load balance cluster, LBC),它是利用一個(gè)集群中的多臺(tái)單機(jī),完成許多并行的小的工作。一般情況下,如果一個(gè)應(yīng)用使用的人多了,那么用戶請(qǐng)求的響應(yīng)時(shí)間就會(huì)增大,機(jī)器的性能也會(huì)受到影響,如果使用負(fù)載均衡集群,那么集群中任意一臺(tái)機(jī)器都能響應(yīng)用戶的請(qǐng)求,這樣集群就會(huì)在用戶發(fā)出服務(wù)請(qǐng)求之后,選擇當(dāng)時(shí)負(fù)載最小,能夠提供最好的服務(wù)的這臺(tái)機(jī)器來(lái)接受請(qǐng)求并相應(yīng),這樣就可用用集群來(lái)增加系統(tǒng)的可用性和穩(wěn)定性。這類集群在網(wǎng)站中使用較多;
高可用性集群(High availability cluster,HAC),它是利用集群中系統(tǒng) 的冗余,當(dāng)系統(tǒng)中某臺(tái)機(jī)器發(fā)生損壞的時(shí)候,其他后備的機(jī)器可以迅速的接替它來(lái)啟動(dòng)服務(wù),等待故障機(jī)的維修和返回。最大限度的保證集群中服務(wù)的可用性。這類系統(tǒng)一般在銀行,電信服務(wù)這類對(duì)系統(tǒng)可靠性有高的要求的領(lǐng)域有著廣泛的應(yīng)用。
數(shù)據(jù)庫(kù)集群的現(xiàn)狀
數(shù)據(jù)庫(kù)集群是將計(jì)算機(jī)集群技術(shù)引入到數(shù)據(jù)庫(kù)中來(lái)實(shí)現(xiàn)的,盡管各廠商宣稱自己的架構(gòu)如何的完美,但是始終不能改變Oracle當(dāng)先,大家追逐的事實(shí),在集群的解決方案上Oracle RAC還是領(lǐng)先于包括微軟在內(nèi)的其它數(shù)據(jù)庫(kù)廠商,它能滿足客戶高可用性、高性能、數(shù)據(jù)庫(kù)負(fù)載均衡和方便擴(kuò)展的需求。
- Oracle's Real Application Cluster (RAC)
- Microsoft SQL Cluster Server (MSCS)
- IBM's DB2 UDB High Availability Cluster(UDB)
- Sybase ASE High Availability Cluster (ASE)
- MySQL High Availability Cluster (MySQL CS)
基于IO的第三方HA(高可用性)集群
當(dāng)前主要的數(shù)據(jù)庫(kù)集群技術(shù)有以上六大類,有數(shù)據(jù)庫(kù)廠商自己開發(fā)的;也有第三方的集群公司開發(fā)的;還有數(shù)據(jù)庫(kù)廠商與第三方集群公司合作開發(fā)的,各類集群實(shí)現(xiàn)的功能及架構(gòu)也不盡相同。
RAC(Real Application Cluster,真正應(yīng)用集群)是Oracle9i數(shù)據(jù)庫(kù)中采用的一項(xiàng)新技術(shù),也是Oracle數(shù)據(jù)庫(kù)支持網(wǎng)格計(jì)算環(huán)境的核心技術(shù)。它的出現(xiàn)解決了傳統(tǒng)數(shù)據(jù)庫(kù)應(yīng)用中面臨的一個(gè)重要問(wèn)題:高性能、高可伸縮性與低價(jià)格之間的矛盾。在很長(zhǎng)一段時(shí)間里,甲骨文都以其實(shí)時(shí)應(yīng)用集群技術(shù)(Real Application Cluster,RAC)統(tǒng)治著集群數(shù)據(jù)庫(kù)市場(chǎng)
六、高并發(fā)高負(fù)載網(wǎng)站的系統(tǒng)架構(gòu)之緩存
緩存一詞搞技術(shù)的都接觸過(guò),很多地方用到緩存。網(wǎng)站架構(gòu)和網(wǎng)站開發(fā)中的緩存也是非常重要。這里先講述最基本的兩種緩存。高級(jí)和分布式的緩存在后面講述。
架構(gòu)方面的緩存,對(duì)Apache比較熟悉的人都能知道Apache提供了自己的緩存模塊,也可以使用外加的Squid模塊進(jìn)行緩存,這兩種方式均可以有效的提高Apache的訪問(wèn)響應(yīng)能力。
網(wǎng)站程序開發(fā)方面的緩存,Linux上提供的Memory Cache是常用的緩存接口,可以在web開發(fā)中使用,比如用Java開發(fā)的時(shí)候就可以調(diào)用MemoryCache對(duì)一些數(shù)據(jù)進(jìn)行緩存和通訊共享,一些大 型社區(qū)使用了這樣的架構(gòu)。另外,在使用web語(yǔ)言開發(fā)的時(shí)候,各種語(yǔ)言基本都有自己的緩存模塊和方法,PHP有Pear的Cache模塊,Java就更多 了,.net不是很熟悉,相信也肯定有。
Java開源緩存框架 :
- JBossCache/TreeCache JBossCache 是一個(gè)復(fù)制的事務(wù)處理緩存,它允許你緩存企業(yè)級(jí)應(yīng)用數(shù)據(jù)來(lái)更好的改善性能。緩存數(shù)據(jù)被自動(dòng)復(fù)制,讓你輕松進(jìn)行Jboss服務(wù)器之間的集群工作。JBossCache能夠通過(guò)Jboss應(yīng)用服務(wù)或其他J2EE容器來(lái)運(yùn)行一個(gè)Mbean服務(wù),當(dāng)然,它也能獨(dú)立運(yùn)行。 JBossCache包括兩個(gè)模塊:TreeCache和TreeCacheAOP。 TreeCache --是一個(gè)樹形結(jié)構(gòu)復(fù)制的事務(wù)處理緩存。 TreeCacheAOP --是一個(gè)“面向?qū)ο蟆本彺?,它使用AOP來(lái)動(dòng)態(tài)管理POJO.
- OSCache OSCache標(biāo)記庫(kù)由OpenSymphony設(shè)計(jì),它是一種開創(chuàng)性的JSP定制標(biāo)記應(yīng)用,提供了在現(xiàn)有JSP頁(yè)面之內(nèi)實(shí)現(xiàn)快速內(nèi)存緩沖的功能。OSCache是個(gè)一個(gè)廣泛采用的高性能的J2EE緩存框架,OSCache能用于任何Java應(yīng)用程序的普通的緩存解決方案。OSCache有以下特點(diǎn):緩存任何對(duì)象,你可以不受限制的緩存部分jsp頁(yè)面或HTTP請(qǐng)求,任何java對(duì)象都可以緩存。 擁有全面的API--OSCache API給你全面的程序來(lái)控制所有的OSCache特性。 永久緩存--緩存能隨意的寫入硬盤,因此允許昂貴的創(chuàng)建(expensive-to-create)數(shù)據(jù)來(lái)保持緩存,甚至能讓應(yīng)用重啟。 支持集群--集群緩存數(shù)據(jù)能被單個(gè)的進(jìn)行參數(shù)配置,不需要修改代碼。 緩存記錄的過(guò)期--你可以有最大限度的控制緩存對(duì)象的過(guò)期,包括可插入式的刷新策略(如果默認(rèn)性能不需要時(shí))。
- JCACHE JCACHE是一種即將公布的標(biāo)準(zhǔn)規(guī)范(JSR 107),說(shuō)明了一種對(duì)Java對(duì)象臨時(shí)在內(nèi)存中進(jìn)行緩存的方法,包括對(duì)象的創(chuàng)建、共享訪問(wèn)、假脫機(jī)(spooling)、失效、各JVM的一致性等。它可被用于緩存JSP內(nèi)最經(jīng)常讀取的數(shù)據(jù),如產(chǎn)品目錄和價(jià)格列表。利用JCACHE,多數(shù)查詢的反應(yīng)時(shí)間會(huì)因?yàn)橛芯彺娴臄?shù)據(jù)而加快(內(nèi)部測(cè)試表明反應(yīng)時(shí)間大約快15倍)。
- Ehcache Ehcache出自Hibernate,在Hibernate中使用它作為數(shù)據(jù)緩存的解決方案。
- Java Caching System JCS是Jakarta的項(xiàng)目Turbine的子項(xiàng)目。它是一個(gè)復(fù)合式的緩沖工具??梢詫?duì)象緩沖到內(nèi)存、硬盤。具有緩沖對(duì)象時(shí)間過(guò)期設(shè)定。還可以通過(guò)JCS構(gòu)建具有緩沖的分布式構(gòu)架,以實(shí)現(xiàn)高性能的應(yīng)用。 對(duì)于一些需要頻繁訪問(wèn)而每訪問(wèn)一次都非常消耗資源的對(duì)象,可以臨時(shí)存放在緩沖區(qū)中,這樣可以提高服務(wù)的性能。而JCS正是一個(gè)很好的緩沖工具。緩沖工具對(duì)于讀操作遠(yuǎn)遠(yuǎn)多于寫操作的應(yīng)用性能提高非常顯著。
- SwarmCache SwarmCache是一個(gè)簡(jiǎn)單而功能強(qiáng)大的分布式緩存機(jī)制。它使用IP組播來(lái)有效地在緩存的實(shí)例之間進(jìn)行通信。它是快速提高集群式Web應(yīng)用程序的性能的理想選擇。
- ShiftOne ShiftOne Object Cache這個(gè)Java庫(kù)提供了基本的對(duì)象緩存能力。實(shí)現(xiàn)的策略有先進(jìn)先出(FIFO),最近使用(LRU),最不常使用(LFU)。所有的策略可以最大化元素的大小,最大化其生存時(shí)間。
- WhirlyCache Whirlycache是一個(gè)快速的、可配置的、存在于內(nèi)存中的對(duì)象的緩存。它能夠通過(guò)緩存對(duì)象來(lái)加快網(wǎng)站或應(yīng)用程序的速度,否則就必須通過(guò)查詢數(shù)據(jù)庫(kù)或其他代價(jià)較高的處理程序來(lái)建立。
- Jofti Jofti可對(duì)在緩存層中(支持EHCache,JBossCache和OSCache)的對(duì)象或在支持Map接口的存儲(chǔ)結(jié)構(gòu)中的對(duì)象進(jìn)行索引與搜索。這個(gè)框架還為對(duì)象在索引中的增刪改提供透明的功能同樣也為搜索提供易于使用的查詢功能。
- cache4j cache4j是一個(gè)有簡(jiǎn)單API與實(shí)現(xiàn)快速的Java對(duì)象緩存。它的特性包括:在內(nèi)存中進(jìn)行緩存,設(shè)計(jì)用于多線程環(huán)境,兩種實(shí)現(xiàn):同步與阻塞,多種緩存清除策略:LFU, LRU, FIFO,可使用強(qiáng)引用(strong reference)與軟引用(soft reference)存儲(chǔ)對(duì)象。
- Open Terracotta 一個(gè)JVM級(jí)的開源群集框架,提供:HTTP Session復(fù)制,分布式緩存,POJO群集,跨越群集的JVM來(lái)實(shí)現(xiàn)分布式應(yīng)用程序協(xié)調(diào)(采用代碼注入的方式,所以你不需要修改任何)。
- sccache SHOP.COM使用的對(duì)象緩存系統(tǒng)。sccache是一個(gè)in-process cache和二級(jí)、共享緩存。它將緩存對(duì)象存儲(chǔ)到磁盤上。支持關(guān)聯(lián)Key,任意大小的Key和任意大小的數(shù)據(jù)。能夠自動(dòng)進(jìn)行垃圾收集。
- Shoal Shoal是一個(gè)基于Java可擴(kuò)展的動(dòng)態(tài)集群框架,能夠?yàn)闃?gòu)建容錯(cuò)、可靠和可用的Java應(yīng)用程序提供了基礎(chǔ)架構(gòu)支持。這個(gè)框架還可以集成到不希望綁定到特定通信協(xié)議,但需要集群和分布式系統(tǒng)支持的任何Java產(chǎn)品中。Shoal是GlassFish和JonAS應(yīng)用服務(wù)器的集群引擎。
- Simple-Spring-Memcached Simple-Spring-Memcached,它封裝了對(duì)MemCached的調(diào)用,使MemCached的客戶端開發(fā)變得超乎尋常的簡(jiǎn)單。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
解析Java程序中對(duì)象內(nèi)存的分配和控制的基本方法
這篇文章主要介紹了解析Java程序中對(duì)象內(nèi)存的分配和控制的基本方法,包括計(jì)算對(duì)象的內(nèi)存占用的方法,要的朋友可以參考下2016-04-04Gradle構(gòu)建基本的Web項(xiàng)目結(jié)構(gòu)
這篇文章主要為大家介紹了Gradle創(chuàng)建Web項(xiàng)目基本的框架結(jié)構(gòu)搭建,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-03-03在service層注入mapper時(shí)報(bào)空指針的解決
這篇文章主要介紹了在service層注入mapper時(shí)報(bào)空指針的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06Spring MVC獲取HTTP請(qǐng)求頭的兩種方式小結(jié)
這篇文章主要介紹了Spring MVC獲取HTTP請(qǐng)求頭的兩種方式小結(jié),幫助大家更好的理解和使用Spring MVC,感興趣的朋友可以了解下2021-01-01Sharding-Jdbc 自定義復(fù)合分片的實(shí)現(xiàn)(分庫(kù)分表)
本文主要介紹了Sharding-Jdbc 自定義復(fù)合分片的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-07-07SpringMVC xml文件路徑在web.xml中的配置方式
這篇文章主要介紹了SpringMVC xml文件路徑在web.xml中的配置方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-09-09