Nginx實(shí)現(xiàn)非套路鏡像站的踩坑記錄
緣起
前幾天發(fā)現(xiàn)一個(gè)電子書(shū)非常棒,但是是 github 上的,總是打不開(kāi),而正好我的服務(wù)器是在香港的,所以我想做一個(gè)鏡像。下面給大家提供了兩種方案,下面話不多說(shuō)了,來(lái)一起看看詳細(xì)的介紹吧。
方案一
做了如下配置:
location ^~ /book-c/ { proxy_pass http://akaedu.github.io/book/; proxy_redirect off; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; }
瀏覽了下,都 ok,但是有幾點(diǎn)不太好
- 如果以后我發(fā)現(xiàn)類似的書(shū)很好,都要增加一個(gè) nginx 配置。
- 如果原始網(wǎng)站完全無(wú)法訪問(wèn)了,我這邊也掛了,不能緩存到我本地服務(wù)器。
- 我想修改網(wǎng)頁(yè)內(nèi)容也不太好操作,比如我想加上原作者的版權(quán)和原始訪問(wèn)地址說(shuō)明等。
完全采集過(guò)來(lái),我也懶得寫(xiě)腳本去跑,最終走上了下面這段踩坑路。
嘗試改進(jìn)
所以嘗試了如下做法
rewrite ^/book-(.*?)/ /index.php?m=Book&a=show&book=$1 last;
class BookAction extends Action{ private $uri; public function show(){ $book = $_GET['book']; if (!method_exists($this,$book)){ $this->error404(); } try{ $this->$book(); }catch (Exception $e){ $this->error404(); } } /** * http://akaedu.github.io/book/ */ private function c(){ $baseUrl = "http://akaedu.github.io/book/"; $url = $baseUrl.$this->uri; echo file_get_contents($url); } }
又遇到了一個(gè)問(wèn)題,當(dāng)我訪問(wèn) https://mengkang.net/book-c/styles.css 則無(wú)法 rewrite 匹配到了。
原因是 nginx 優(yōu)先匹配了
location ~ .*\.(js|css)?$ { expires 12h; }
正則匹配優(yōu)先級(jí)關(guān)系:http://www.dbjr.com.cn/article/134233.htm
方案二
添加一條
location ~ /book-.*?/ { rewrite ^/book-(.*?)/ /index.php?m=Book&a=show&book=$1 last; }
location ^~ 不支持正則的,所以沒(méi)法用
采坑小記
如果是使用的 location ~ /book-.*/ ,根據(jù)正則就是貪婪模式,那么
https://mengkang.net/book-c/images/sortsearch.theta.png
匹配到的就是 /book-c/images/ ,也就是說(shuō)rewrite里面的 $1 就是 c/images ,這樣和我們的預(yù)期相悖的。
故障:無(wú)法匹配到 css 文件
$ wget -S https://mengkang.net/book-c/styles.css -O /dev/null --2018-02-01 13:13:36-- https://mengkang.net/book-c/styles.css Resolving mengkang.net... 203.195.188.207 Connecting to mengkang.net|203.195.188.207|:443... connected. HTTP request sent, awaiting response... HTTP/1.1 200 OK Server: nginx Date: Thu, 01 Feb 2018 05:13:38 GMT Content-Type: text/html; charset=UTF-8
所有內(nèi)容的輸出默認(rèn)都是 text/html ,那么也就是我需要對(duì)文件的后綴判斷咯。 感覺(jué)自己給自己挖坑,不如直接采集得了
<?php class BookAction extends Action{ const BOOK_SAVE_DIR = "/data/book/"; private $uri; private $baseUrl; private $book; private $bookname; public function show(){ $book = $_GET['book']; $this->book = $book; $this->uri = str_replace("/book-{$book}/","",$_SERVER['REQUEST_URI']); if (!method_exists($this,$book)){ $this->error404(); } try{ $this->$book(); }catch (Exception $e){ $this->error404(); } } /** * http://akaedu.github.io/book/ */ private function c(){ $this->baseUrl = "http://akaedu.github.io/book/"; $url = $this->baseUrl.$this->uri; $this->output($url); } private function output($url){ $ext = pathinfo($url,PATHINFO_EXTENSION); if (!$ext) { $url = $url."/index.html"; $ext = "html"; } switch ($ext){ case "css": header("Content-Type: text/css; charset=UTF-8"); break; default: header("Content-Type: text/html; charset=UTF-8"); break; } // 如果已經(jīng)緩存 $filename = self::BOOK_SAVE_DIR.$this->book."/".str_replace($this->baseUrl,"",$url); if (file_exists($filename)){ $data = file_get_contents($filename); }else{ $data = file_get_contents($url); $dir = dirname($filename); if (!file_exists($dir)){ mkdir($dir,755,true); } file_put_contents($filename,$data); } // 增加原始版權(quán)說(shuō)明 echo $data; } }
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問(wèn)大家可以留言交流,謝謝大家對(duì)腳本之家的支持。
相關(guān)文章
Nginx使用mirror指令實(shí)現(xiàn)接口復(fù)制
Nginx中使用mirro指令可以方便地實(shí)現(xiàn)接口請(qǐng)求的復(fù)制,這個(gè)功能非常適合用于流量監(jiān)控、數(shù)據(jù)收集或負(fù)載均衡,下面我們就來(lái)看看具體的用法吧2024-10-10使用Nginx實(shí)現(xiàn)HTTPS雙向驗(yàn)證的方法
這篇文章主要介紹了使用Nginx實(shí)現(xiàn)HTTPS雙向驗(yàn)證的方法,涉及到單向驗(yàn)證和雙向驗(yàn)證的區(qū)別介紹,本文介紹的非常詳細(xì),具有參考借鑒價(jià)值,感興趣的朋友一起學(xué)習(xí)吧2016-06-06Nginx Lua 緩存配置的實(shí)現(xiàn)步驟
在Web應(yīng)用緩存層次中,Nginx Lua緩存因其高效的協(xié)程機(jī)制,與Nginx的集成,以及OpenResty的擴(kuò)展性,成為了一種高性能的緩存解決方案,本文就來(lái)詳細(xì)介紹,感興趣的可以了解一下2022-05-05Nginx中的root&alias文件路徑及索引目錄配置詳解
這篇文章主要介紹了Nginx中的root&alias文件路徑及索引目錄配置,順帶講解了root和alias命令的用法,需要的朋友可以參考下2016-01-01使用ngxtop實(shí)時(shí)監(jiān)控Nginx日志文件的示例代碼
在Nginx日志分析領(lǐng)域,ngxtop是一款強(qiáng)大的實(shí)時(shí)監(jiān)控工具,它能夠即時(shí)解析Nginx的訪問(wèn)日志文件,提供直觀、可定制的實(shí)時(shí)統(tǒng)計(jì)信息,幫助管理員更好地了解服務(wù)器的運(yùn)行狀況和Web流量,本文給大家介紹使用ngxtop實(shí)時(shí)監(jiān)控Nginx日志文件的示例代碼,需要的朋友可以參考下2024-01-01Nginx配置WebSocket反向代理的實(shí)現(xiàn)示例
本文主要介紹了Nginx配置WebSocket反向代理的實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-08-08