不錯(cuò)的一篇學(xué)習(xí)CGI腳本(腳本)
作為一個(gè)網(wǎng)頁(yè)設(shè)計(jì)者, 你創(chuàng)建客戶端的 CGI腳本, 服務(wù)器端的程序用來(lái)處理用戶輸入, 結(jié)果返回給用戶.
在這里你將學(xué)習(xí)關(guān)于CGI腳本的一切:
- CGI腳本是什么?它是怎樣工作的
- 一個(gè)CGI腳本輸出象什么?
- 怎樣用參數(shù)或無(wú)參數(shù)創(chuàng)建一個(gè)CGI腳本
- 怎樣創(chuàng)建一個(gè)返回規(guī)定響應(yīng)的CGI腳本
- 怎樣創(chuàng)建一個(gè)輸入表單的CGI腳本
- 有關(guān)在使用CGI腳本中的問(wèn)題
- 你能在腳本中使用的CGI變量
CGI腳本是什么?
CGI 腳本難道不是一個(gè)真正的腳本?按照你的服務(wù)器的支持, 他們可能是一個(gè)編譯好的程序或者批命令文件或者其他可執(zhí)行的東西. 為了簡(jiǎn)單起見(jiàn),我們統(tǒng)稱他們?yōu)槟_本scripts.
CGI腳本是用下列兩種方法使用的: 作為一個(gè)表單的ACTION 或 作為一個(gè)頁(yè)中的直接link。
CGI腳本是怎樣工作的?
圖1. 從瀏覽器到服務(wù)器到腳本到程序 記住再回來(lái)噢!
這有個(gè)簡(jiǎn)短的示意解釋:
- 一個(gè)URL指向一個(gè)CGI腳本. 一個(gè)CGI腳本的URL能如普通的URL一樣在任何地方出現(xiàn)。
- 服務(wù)器接收請(qǐng)求, 按照那個(gè)URL指向的腳本文件(注意文件的位置和擴(kuò)展名),執(zhí)行腳本.
- 腳本執(zhí)行基于輸入數(shù)據(jù)的操作,包括查詢數(shù)據(jù)庫(kù)、計(jì)算數(shù)值或調(diào)用系統(tǒng)中其他程序.
- 腳本產(chǎn)生某種Web服務(wù)器能理解的輸出結(jié)果.
- 服務(wù)器接收來(lái)自腳本的輸出并且把它傳回瀏覽器,讓用戶了解結(jié)果。
一個(gè)簡(jiǎn)單的例子
在圖2中有個(gè)例圖:
圖2. 帶有一個(gè)腳本連接的頁(yè).
Display Date處是個(gè)指向CGI腳本的連接. 它的HTML是這樣的:
<A >Display the Date</A>說(shuō)明是個(gè)CGI腳本是因?yàn)檫@里面有個(gè)cgi-bin的路徑. 在許多服務(wù)器cgi-bin是僅能夠放置CGI腳本的目錄.
當(dāng)你選擇這個(gè)連接時(shí), 你的瀏覽器將向www.popchina.com服務(wù)器提出請(qǐng)求. 服務(wù)器接收這個(gè)請(qǐng)求計(jì)算出URL處的腳本文件名然后執(zhí)行這個(gè)腳本.
這個(gè)getdate腳本, 在UNIX系統(tǒng)中執(zhí)行是這樣的:
#!/bin/sh echo Content-type: text/plain echo /bin/date第一行是個(gè)特殊的命令,告訴UNIX系統(tǒng)這是個(gè)shell腳本; 真實(shí)的情況是從這行開(kāi)始的下一行,這個(gè)腳本做兩件事:它輸出行Content-type: text/plain, 接著開(kāi)始一個(gè)空行;第二, 它調(diào)用UNIX系統(tǒng)時(shí)間date程序, 這樣輸出日期和時(shí)間. 腳本執(zhí)行后輸出應(yīng)該這樣:
Content-type: text/plain Tue Oct 25 16:15:57 EDT 1994這個(gè)Content-type是什么東東?它是個(gè)特殊的編碼,Web服務(wù)器用來(lái)告訴瀏覽器輸出這個(gè)文本是什么類型的. 這與HTML中Content-type含義是一樣的。
這樣瀏覽器的輸出就如圖3.
這是最基本的,實(shí)際情況要復(fù)雜得多,總之可以用來(lái)理解瀏覽器、服務(wù)器和腳本之間是怎樣工作的。
我能用CGI腳本嗎?
肯定嗎?就是做不到,學(xué)學(xué)也可以?好吧!讓我們繼續(xù).
你的服務(wù)器配置允許CGI腳本嗎?
但是即使你有一個(gè)Web服務(wù)器, 這個(gè)服務(wù)器必須特別地為運(yùn)行CGI腳本配置一下. 那意味著你所有的腳本必須放置在一個(gè)叫做cgi-bin的目錄下.
在編寫(xiě)CGI腳本之前, 詢問(wèn)你的服務(wù)器管理者是否允許你安裝和運(yùn)行CGI腳本, 并且如果可以的話,他們必須放置在哪兒?還有,你必須有個(gè)真正的Web服務(wù)器,如果是FTP或Gopher服務(wù)器,那你就不能用CGI.
如果你在自己的服務(wù)器上運(yùn)行, 你必須特別地創(chuàng)造一個(gè)叫cgi-bin的目錄,并配置你的服務(wù)器認(rèn)可這個(gè)目錄為一個(gè)腳本目錄. 也必須記住下面有關(guān)CGI腳本特點(diǎn):
- 每個(gè)腳本是個(gè)程序, 它運(yùn)行在瀏覽器可以請(qǐng)求的系統(tǒng)上, 執(zhí)行時(shí)使用CPU時(shí)間和內(nèi)存. 如果有成打上千的這些腳本同時(shí)運(yùn)行,會(huì)怎樣?你的系統(tǒng)將不忍負(fù)載直至崩潰。
- 如果你不仔細(xì)地編寫(xiě)你的CGI腳本, 你將有可能讓別人通過(guò)你的CGI腳本參數(shù)進(jìn)入傷害你的系統(tǒng).
你會(huì)編程嗎?
你必須用什么編程語(yǔ)言?
在這本學(xué)習(xí)手冊(cè)中,僅用兩種語(yǔ)言編寫(xiě)CGI腳本: UNIX shell和 Perl語(yǔ)言. 這個(gè)shell是適合在任何相近的UNIX系統(tǒng)上運(yùn)行并且容易學(xué)習(xí), 但是處理復(fù)雜的情況就困難了. Perl, 就要用這個(gè)語(yǔ)言了, 它是免費(fèi)的, 這個(gè)語(yǔ)言是穩(wěn)定和強(qiáng)大的,類似C,但它也是較難學(xué)習(xí)的.
你的服務(wù)器設(shè)置正確了嗎?
如果你是租用服務(wù)器,就要是否允許運(yùn)行CGI腳本.
如果你擁有自己的服務(wù)器,檢查你的服務(wù)器說(shuō)明書(shū)是怎樣處理CGI腳本的.
如果你用的不是UNIX?
解剖一個(gè)CGI腳本
輸出頭部
這個(gè)頭部是實(shí)際不是文本的一部分,是服務(wù)器與瀏覽器之間的信息協(xié)議,你實(shí)際看不到。
有三個(gè)類型的頭部: Content-type, Location, 和Status. Content-type 最普遍的。
有關(guān)content-type解釋可以見(jiàn)有關(guān)HTML的說(shuō)明, 一個(gè)你可以發(fā)出的特定編碼象這樣:
Content-type: text/html在這個(gè)例子中,輸出數(shù)據(jù)的類型是text/html; 換句話說(shuō), 他是個(gè)HTML文件.
Format |
Content-Type |
HTML | text/html |
Text | text/plain |
GIF | image/gif |
JPEG | image/jpeg |
PostScript | application/postscript |
MPEG | video/mpeg |
輸出數(shù)據(jù)
練習(xí)1: 小試試.
圖4. 腳本的結(jié)果
這是個(gè)很簡(jiǎn)單的例子, 他能這樣備調(diào)用:
<A >Is Laura Logged in?</A>這是沒(méi)有輸入的腳本,它只運(yùn)行并且返回?cái)?shù)據(jù).
根據(jù)前面的闡述,這個(gè)腳本內(nèi)容是這樣::
#!/bin/sh
echo Content-type: text/html
echo "<HTML><HEAD>"
echo "<TITLE>Is Laura There?</TITLE>"
echo "</HEAD><BODY>"
為了測(cè)試我是否已經(jīng)登陸系統(tǒng),用who命令(我的登陸名假設(shè)為lemay), 儲(chǔ)存結(jié)果在變量ison中. 如果我登陸, 變量ison將有些內(nèi)容,否則則是空的.
ison='who | grep lemay'試驗(yàn)結(jié)果及返回相應(yīng)提示的腳本是這樣:
if [ ! -z "$ison" ]; then echo "<P>Laura is logged in."</P> else echo "<P>Laura isn't logged in."</P> fi最后關(guān)閉HTML:
echo "</BODY></HTML>"現(xiàn)在你通過(guò)從命令行運(yùn)行他,測(cè)試一下,你將得到一個(gè)結(jié)果說(shuō)我未登陸你的系統(tǒng),當(dāng)然不可能的,他的輸出是這樣的:
Content-type: text/html <HTML><HEAD> <TITLE>Are You There?</TITLE> </HEAD><BODY> <P>Laura is not logged in. </BODY></HTML>這是輸出的一個(gè)HTML文本,這樣你的瀏覽器能正常顯示他,因?yàn)樗莻€(gè)HTML文件。
這個(gè)例子完整的腳本如下:
#!/bin/sh echo "Content-type: text/html" echo echo "<HTML><HEAD>" echo "<TITLE>Is Laura There?</TITLE>" echo "</HEAD><BODY>" ison='who | grep lemay' if [ ! -z "$ison" ]; then echo "<P>Laura is logged in" else echo "<P>Laura isn't logged in" fi echo "</BODY></HTML>"
帶有參數(shù)的腳本
<A HREF="/cgi-bin/myscript?arg1+arg2+arg3">run my script</A>當(dāng)服務(wù)器接收到這個(gè)請(qǐng)求,它傳遞 arg1, arg2, 和 arg3 參數(shù)給腳本. 你然后能在腳本中使用這些參數(shù).
這個(gè)方法有時(shí)叫查詢, 因?yàn)樵缙谒迷谒阉鞴δ苤?
練習(xí)2: 檢查是否有人登陸.
我們?nèi)€(gè)不同題目:
#!/bin/sh echo "Content-type: text/html" echo echo "<HTML><HEAD>" echo "<TITLE>Are You There?</TITLE>" echo "</HEAD><BODY>"在上面的例子中, 下一步應(yīng)該是測(cè)試我是否登陸,在這里我們用參數(shù)${1}代替我的名字lemay, ${1}作為第一個(gè)參數(shù), ${2}作為第二個(gè), ${3}作為第三個(gè).
ison='who | grep "${1}"'
剩下的所有修改如下:
if [ ! -z "$ison" ]; then echo "<P>$1 is logged in" else echo "<P>$1 isn't logged in" fi
echo "</BODY></HTML>"好了,讓我們修改HTML頁(yè)中的連接吧!原來(lái)是這樣:
<A >Is Laura Logged in?</A>修改為通用查詢功能后是這樣,比如查詢名字叫john的人是否登陸:
<A >Is John Logged in?</A>在你的服務(wù)器上試試,看是否有結(jié)果。
傳遞其他信息給腳本
看下面一個(gè)路徑信息path information例子, :
http://myhost/cgi-bin/myscript/remaining_path_info?arg1+arg2當(dāng)腳本運(yùn)行時(shí),在路徑中的信息將被放置于環(huán)境參數(shù)PATH_INFO. 你能在你的腳本內(nèi)容中使用這些信息.
比如說(shuō), 讓我們假設(shè)你在多頁(yè)上已有多個(gè)連接到同一個(gè)腳本. 你能用這個(gè)路徑信息顯示那個(gè)有連接的HTML文件名. 這樣, 在你完成處理你的腳本之后, 當(dāng)你發(fā)回一個(gè)HTML文件時(shí), 你能在這個(gè)文件里包含一個(gè)連接,發(fā)回用戶一開(kāi)始那個(gè)頁(yè)。
你會(huì)在下一章節(jié)學(xué)到更多路徑信息:有用的表單和腳本. 待后來(lái)登出
創(chuàng)建一個(gè)特殊的腳本輸出
不用怕, 這里開(kāi)始解釋這些情況.
用調(diào)用另一個(gè)文本作為響應(yīng)
Location: ../docs/final.html這個(gè)Location行用作通常的輸出位置,也就是說(shuō),如果你用了Location, 你就不必再用象Content-type這樣的數(shù)據(jù)輸出(實(shí)際上,你也不能). 正如Content-type, 你也必須在這一行后面跟一個(gè)空行.
指向這個(gè)文件的路徑可以是一個(gè)URL或相對(duì)路徑. 所有相對(duì)路徑是指相對(duì)于腳本所在的位置. 例子中的final.html文本是在當(dāng)前上一個(gè)目錄下docs的目錄下:
echo Location: ../docs/final.html echo
No Response
很幸運(yùn), 這一切很容易. 你只要輸出下面這個(gè)命令即可(后面跟一個(gè)空行):
echo Status: 204 No Response echo這個(gè)Status頭部提供狀態(tài)碼給服務(wù)器(并且也給瀏覽器). 特別的204將傳遞給瀏覽器,如果能識(shí)別它,它將什么也不做.
處理表單的腳本
記住, 大多數(shù)表單有兩個(gè)部分: HTML的表單格式;處理表單數(shù)據(jù)的CGI腳本. 這個(gè)CGI腳本使用標(biāo)簽<FORM>屬性調(diào)用的.
表單形式和表單腳本
這個(gè)ACTION屬性包含著處理表單的腳本:
<FORM ACTION="http://www.popchina.com/cgi-bin/processorscript">在這個(gè)表單中, 每個(gè)輸入?yún)^(qū)都有一個(gè)NAME的屬性, 用來(lái)稱呼表單元素. 當(dāng)這個(gè)表單數(shù)據(jù)被遞交給你在ACTION中定義的CGI腳本, 這樣這些name和輸入內(nèi)容被作為一個(gè)數(shù)字或字符傳遞給腳本.
GET 和 POST
我們上面談?wù)摰姆椒?,?shí)際是GET,它將數(shù)據(jù)打包放置在環(huán)境變量QUERY_STRING中作為URL整體的一部分傳遞給服務(wù)器。
POST做很多類似GET同樣的事情, 不同的地方就是它是分離地傳遞數(shù)據(jù)給腳本. 你的腳本通過(guò)標(biāo)準(zhǔn)輸入獲取這些數(shù)據(jù). (有些Web服務(wù)器是存儲(chǔ)在臨時(shí)文件中.) 這個(gè)QUERY_STRING環(huán)境變量將不再設(shè)置.
那你用那個(gè)方法呢? POST是個(gè)安全的方法, 尤其如果你的表單中有很多數(shù)據(jù)的話. 當(dāng)你用GET, 這個(gè)服務(wù)器就分配變量QUERY_STRING給所有的表單數(shù)據(jù), 但是這個(gè)變量可存儲(chǔ)量是有限的. 換句話說(shuō),如果你有很多數(shù)據(jù)但是你又用GET,你會(huì)丟失很多數(shù)據(jù).
如果你用POST, 你可以盡可能多地使用數(shù)據(jù), 因?yàn)檫@些數(shù)據(jù)從來(lái)也不分配到一個(gè)變量里.
URL 編碼
theName=Ichabod+Crane&gender=male&status=missing&headless=yesURL編碼遵循下列規(guī)則:
- 每對(duì)name/value由&符分開(kāi).
- 每對(duì)來(lái)自表單的name/value由=符分開(kāi). 如果用戶沒(méi)有輸入值給這個(gè)name,那么這個(gè)name還是出現(xiàn),只是無(wú)值(象這樣 "name=").
- 任何特殊的字符(就是那些不是簡(jiǎn)單的七位ASCII,如漢字) 將以百分符%用十六進(jìn)制編碼. 當(dāng)然也包括象 =, &, 和 % 這些特殊的字符.
- 在輸入?yún)^(qū)中的空格將以加號(hào)+顯示.
這里介紹一個(gè)叫uncgi的解碼程序, 你可以從http://www.hyperion.com/~koreth/uncgi.html. 得到原碼,安裝在你自己的cgi-bin目錄下.
練習(xí)3: 告訴我你的名字.
這個(gè)輸入被發(fā)給腳本, 然后發(fā)回顯示一個(gè)hello的信息(間圖.6).
如果你在姓名輸入處不輸入任何東東,會(huì)怎樣?見(jiàn)圖7.
修改表單的HTML
<FORM METHOD=POST ACTION="../cgi-bin/form-name"> </FORM>如果你在用uncgi從input中解碼, 情況有點(diǎn)不同. 為了是uncgi正常工作, 你首先必須調(diào)用uncgi , 如果uncgi是個(gè)目錄,加上實(shí)際的腳本名, 象這樣:
<FORM METHOD=POST ACTION="../cgi-bin/uncgi/form-name"> </FORM>這樣,你不必修改表單中原始的HTML; 原始的HTML可以工作得很好.
腳本
在腳本中第一步是解碼,在這個(gè)例子中, 我們已經(jīng)使用uncgi解碼輸入數(shù)據(jù), 實(shí)際這個(gè)表單已經(jīng)為你做好解碼. 通過(guò)建立一個(gè)uncgi的目錄,一旦表單遞交給服務(wù)器,服務(wù)器會(huì)自動(dòng)進(jìn)行解碼,這樣,所有的name/value已經(jīng)準(zhǔn)備就緒等待你的使用.
現(xiàn)在,一個(gè)例子開(kāi)始部分假設(shè)是下面這樣:
echo Content-type: text/html echo echo "<HTML><HEAD>" echo "<TITLE>Hello</TITLE>" echo "</HEAD><BODY>" echo "<P>"接下來(lái),有兩種情況要處理:一件是處理用戶不輸入名字的情況,一個(gè)是如果輸入了向他們說(shuō)hello.
這個(gè)Name元素的值, 是包含在WWW_theName環(huán)境變量中. 用一個(gè)簡(jiǎn)單的測(cè)試命令(-z), 你能查看環(huán)境變量是否是空的還是包括相應(yīng)的輸出值:
if [ ! -z "$WWW_theName" ]; then echo "Hello, " echo $WWW_theName else echo "You don't have a name?" fi最后增加一個(gè)連接"go back" . 用來(lái)返回:
echo "</P><P><A HREF="../lemay/name1.html">Go Back</A></P>" echo "</BODY></HTML>"
問(wèn)題
- 腳本內(nèi)容只顯示不執(zhí)行.
你正確配置了你的服務(wù)器運(yùn)行CGI腳本? 你的腳本是放置在cgi-bin目錄中嗎?如果你的服務(wù)器允許帶.cgi擴(kuò)展名的CGI運(yùn)行, 你的腳本文件名的擴(kuò)展名是這樣嗎?
- Error 500: Server doesn't support POST.
解答還是如上一條一樣,然后你用命令行執(zhí)行你的CGI,可以正常運(yùn)行嗎?是否有錯(cuò)誤?.
- Document contains no data.
確定你的頭部行和數(shù)據(jù)部之間有一空行.
- Error 500: Bad Script Request.
確定你的腳本是可執(zhí)行的(在UNIX, 用chmod +x 你的腳本.cgi). 在從瀏覽器運(yùn)行之前,你應(yīng)當(dāng)從命令行運(yùn)行你的腳本,如果客戶端是win95,可以用telnet登陸你的服務(wù)器,執(zhí)行命令行,當(dāng)然必須了解UNIX命令.
CGI變量
環(huán)境變量 |
意義 |
SERVER_NAME | CGI腳本運(yùn)行時(shí)的主機(jī)名和IP地址. |
SERVER_SOFTWARE | 你的服務(wù)器的類型如: CERN/3.0 或 NCSA/1.3. |
GATEWAY_INTERFACE | 運(yùn)行的CGI版本. 對(duì)于UNIX服務(wù)器, 這是CGI/1.1. |
SERVER_PROTOCOL | 服務(wù)器運(yùn)行的HTTP協(xié)議. 這里當(dāng)是HTTP/1.0. |
SERVER_PORT | 服務(wù)器運(yùn)行的TCP口,通常Web服務(wù)器是80. |
REQUEST_METHOD | POST 或 GET, 取決于你的表單是怎樣遞交的. |
HTTP_ACCEPT | 瀏覽器能直接接收的Content-types, 可以有HTTP Accept header定義. |
HTTP_USER_AGENT | 遞交表單的瀏覽器的名稱、版本 和其他平臺(tái)性的附加信息。 |
HTTP_REFERER | 遞交表單的文本的 URL,不是所有的瀏覽器都發(fā)出這個(gè)信息,不要依賴它 |
PATH_INFO | 附加的路徑信息, 由瀏覽器通過(guò)GET方法發(fā)出. |
PATH_TRANSLATED | 在PATH_INFO中系統(tǒng)規(guī)定的路徑信息. |
SCRIPT_NAME | 指向這個(gè)CGI腳本的路徑, 是在URL中顯示的(如, /cgi-bin/thescript). |
QUERY_STRING | 腳本參數(shù)或者表單輸入項(xiàng)(如果是用GET遞交). QUERY_STRING 包含URL中問(wèn)號(hào)后面的參數(shù). |
REMOTE_HOST | 遞交腳本的主機(jī)名,這個(gè)值不能被設(shè)置. |
REMOTE_ADDR | 遞交腳本的主機(jī)IP地址. |
REMOTE_USER | 遞交腳本的用戶名. 如果服務(wù)器的authentication被激活,這個(gè)值可以設(shè)置。 |
REMOTE_IDENT | 如果Web服務(wù)器是在ident (一種確認(rèn)用戶連接你的協(xié)議)運(yùn)行, 遞交表單的系統(tǒng)也在運(yùn)行ident, 這個(gè)變量就含有ident返回值. |
CONTENT_TYPE | 如果表單是用POST遞交, 這個(gè)值將是 application/x-www-form-urlencoded. 在上載文件的表單中, content-type 是個(gè) multipart/form-data. |
CONTENT_LENGTH | 對(duì)于用POST遞交的表單, 標(biāo)準(zhǔn)輸入口的字節(jié)數(shù). |
表單輸入的解碼程序
當(dāng)然也有表單上載時(shí)可以解碼的程序,很少。
uncgi
cgi-lib.pl
為了使用cgi-lib.pl,你通常要這樣寫(xiě):
#!/usr/lib/perl
require 'cgi-lib.pl';cgi-lib中盡管有很多子程序, 最重要的是ReadParse子程. ReadParse 讀取輸入方便地將name/value儲(chǔ)存在一個(gè)Perl陣列中. 在你的Perl腳本中通常是這樣調(diào)用的:
&ReadParse(*in);此例中,陣列名是in, 可以隨便取名的.
在表單輸入解碼后, 你能讀取和處理這個(gè)name/value,方法是象下面這樣:
print $in{'theName'};這個(gè)將顯示名字name是theName的值value.
如果你有多個(gè)用同樣名字的name對(duì), cgi-lib.pl用(\0)分隔多個(gè)名字. 這樣可以正常處理你的腳本.
解碼上傳的文件輸入
cgi-lib.pl 后來(lái)版本可以很好支持, 在http://www.bio.cam.ac.uk/cgi-lib/ 了解更多的情況.
另一個(gè)處理用Perl編寫(xiě)的CGI地址是 http://valine.ncsa.uiuc.edu/cgi_docs.html .
自己做
非解剖的腳本頭部
<ISINDEX> 腳本
總結(jié)
注意:上述程序可以用ultra edit來(lái)編輯,注意轉(zhuǎn)換UNIX格式 ,必須采用UNIX格式存盤(pán),再上載,用telnet登陸,在命令行鍵入perl sample.pl,看有無(wú)bug,再 在瀏覽器中調(diào)用。CGI程序包括放置CGI的目錄一定要改屬性為777, 要寫(xiě)入的HTML文件也要改屬性為777.
現(xiàn)在網(wǎng)上有很多免費(fèi)的cgi,基本可以滿足一般需求,請(qǐng)到這個(gè)網(wǎng)址查詢你要的cgi:http://www.itm.com/cgicollection/
本人漢化了一個(gè)古老的通用留言簿,大家可以拿去做自己的留言簿。這里下載
相關(guān)文章
不錯(cuò)的mod_perl編程的簡(jiǎn)單應(yīng)用實(shí)例介紹
不錯(cuò)的mod_perl編程的簡(jiǎn)單應(yīng)用實(shí)例介紹...2007-03-03Perl語(yǔ)言入門(mén)三部曲 附電子書(shū)下載
Perl語(yǔ)言入門(mén)三部曲 附電子書(shū)下載,想要學(xué)習(xí)perl語(yǔ)言的朋友可以參考下2012-08-08