NodeJS url驗證(url-valid)的使用方法
更新時間:2013年11月18日 09:10:43 作者:
本文主要介紹了NodeJS url驗證(url-valid)模塊的使用方法,最后提供了實例代碼供大家參考
Javascript做url檢驗,通常是使用正則表達式來判定,其格式是否正確,例如:
/^https?:\/\//.test(url);
當然還有更好的檢測方法比如基于RFC 3986, RFC 3966, RFC 4694, RFC 4759, RFC 4904等標準的進行驗證的valid-url庫。
不過個根據(jù)格式進行驗證當然不能確定該url是否存在啦,所以就有了url-valid,我們基于HTTP請求進行驗證。
接口設計
實際上我們只需要一個函數(shù)傳入一個url地址,并回調(diào)返回該鏈接是否可用。
但請求容易產(chǎn)生未知錯誤,所以我們在回調(diào)函數(shù)傳入一個error參數(shù),如果不為空,則有錯誤產(chǎn)生。
我們可能還希望能夠得到網(wǎng)頁的相關數(shù)據(jù),未來用在頁面的信息提取上。
盡可能鏈式操作吧。
所以最后使用上大概是這樣的:
valid(url)
.on('check', function (err, status) {
if (err) throw err;
status ?
console.log('url是可用的') :
console.log('url是不可用的');
})
.on('data', function (err, data) {
console.log(data);
})
.on('end', function (err, data) {
console.log('請求結束');
})
HTTP GET 還是 HTTP HEAD
本來我們想利用HTTP HEAD請求來實現(xiàn)的,因為HEAD請求只會返回頭信息,這可以減少請求時間,但是HEAD請求,不一定所有鏈接都會支持。
所以最后我們使用HTTP GET方式,在得到正確的statusCode后立刻abort掉請求。
處理301-303
因為301到303都是重定向狀態(tài)所以,我們需要繼續(xù)檢查對應Location是否依然存在。
利用process.nextTick異步執(zhí)行
為了在注冊監(jiān)聽后,再執(zhí)行代碼,我們使用process.nextTick來一步操作。
實現(xiàn)
/*!
* valid
* MIT Licensed
*/
module.exports = (function () {
'use strict';
var http = require('http')
, https = require('https')
, EventEmitter = require('events').EventEmitter
, URL = require('url')
, urlReg = /^(https?):\/\//;
/**
* Valid
* @class
*/
function Valid(url, callback) {
var that = this;
this.url = url;
this.emitter = new EventEmitter();
process.nextTick(function () {
that.get(url);
});
this.fetch = false;
callback && this.emitter.on('check', callback);
}
Valid.prototype = {
constructor: Valid,
/**
* get
* @param {String} url
*/
get: function (url) {
var match = url.match(urlReg)
, that = this;
if (match) {
var httpLib = (match[1].toLowerCase() === 'http') ? http : https
, opts = URL.parse(url)
, req;
opts.agent = false;
opts.method = 'GET';
req = httpLib.request(opts, function (res) {
var statusCode = res.statusCode;
if (statusCode === 200) {
that.emitter.emit('check', null, true);
that.fetch ?
(res.on('data', function (data) {
that.emitter.emit('data', null, data);
}) && res.on('end', function () {
that.emitter.emit('end');
})) :
(req.abort() || that.emitter.emit('end'));
} else if (300 < statusCode && statusCode < 304) {
req.abort();
var emitter = that.emitter
, valid = one(URL.resolve(url, res.headers.location), function (err, valid) {
emitter.emit('check', err, valid);
});
that.fetch && valid.on('data', function (err, data) {
emitter.emit('data', err, data);
});
valid.on('error', function (err) {
that.emitter.emit('error', err);
});
valid.on('end', function () {
that.emitter.emit('end');
});
} else {
that.emitter.emit('check', null, false);
}
res.on('error', function (err) {
req.abort();
that.emitter.emit('data', err);
});
});
req.on('error', function (err) {
req.abort();
return that.emitter.emit('check', null, false);
});
req.end();
} else {
return that.emitter.emit('check', null, false);
}
},
/**
* on
* @param {Stirng} event
* @param {Function} callback
*/
on: function (event, callback) {
(event === 'data') && (this.fetch = true);
this.emitter.on(event, callback);
return this;
},
/**
* destroy
*/
destroy: function () {
this.emitter.removeAllListeners();
this.url = undefined;
this.emitter = null;
this.fetch = undefined;
},
/**
* removeAllListeners
* @param
*/
removeAllListeners: function (event) {
event ?
this.emitter.removeAllListeners(event) :
this.emitter.removeAllListeners();
return this;
},
/**
* listeners
* @param
*/
listeners: function (event) {
if (event) {
return this.emitter.listeners(event);
} else {
var res = []
, that = this
, _push = Array.prototype.push;
Object.keys(this.emitter._events).forEach(function (key) {
_push.apply(res, that.emitter.listeners(key));
});
return res;
}
}
}
/**
* one
* @param {String} url
* @param {Function} callback
* @return {Valid}
*/
function one(url, callback) {
return (new Valid(url, callback));
}
one.one = one;
return one;
})();
復制代碼 代碼如下:
/^https?:\/\//.test(url);
當然還有更好的檢測方法比如基于RFC 3986, RFC 3966, RFC 4694, RFC 4759, RFC 4904等標準的進行驗證的valid-url庫。
不過個根據(jù)格式進行驗證當然不能確定該url是否存在啦,所以就有了url-valid,我們基于HTTP請求進行驗證。
接口設計
實際上我們只需要一個函數(shù)傳入一個url地址,并回調(diào)返回該鏈接是否可用。
但請求容易產(chǎn)生未知錯誤,所以我們在回調(diào)函數(shù)傳入一個error參數(shù),如果不為空,則有錯誤產(chǎn)生。
我們可能還希望能夠得到網(wǎng)頁的相關數(shù)據(jù),未來用在頁面的信息提取上。
盡可能鏈式操作吧。
所以最后使用上大概是這樣的:
復制代碼 代碼如下:
valid(url)
.on('check', function (err, status) {
if (err) throw err;
status ?
console.log('url是可用的') :
console.log('url是不可用的');
})
.on('data', function (err, data) {
console.log(data);
})
.on('end', function (err, data) {
console.log('請求結束');
})
HTTP GET 還是 HTTP HEAD
本來我們想利用HTTP HEAD請求來實現(xiàn)的,因為HEAD請求只會返回頭信息,這可以減少請求時間,但是HEAD請求,不一定所有鏈接都會支持。
所以最后我們使用HTTP GET方式,在得到正確的statusCode后立刻abort掉請求。
處理301-303
因為301到303都是重定向狀態(tài)所以,我們需要繼續(xù)檢查對應Location是否依然存在。
利用process.nextTick異步執(zhí)行
為了在注冊監(jiān)聽后,再執(zhí)行代碼,我們使用process.nextTick來一步操作。
實現(xiàn)
復制代碼 代碼如下:
/*!
* valid
* MIT Licensed
*/
module.exports = (function () {
'use strict';
var http = require('http')
, https = require('https')
, EventEmitter = require('events').EventEmitter
, URL = require('url')
, urlReg = /^(https?):\/\//;
/**
* Valid
* @class
*/
function Valid(url, callback) {
var that = this;
this.url = url;
this.emitter = new EventEmitter();
process.nextTick(function () {
that.get(url);
});
this.fetch = false;
callback && this.emitter.on('check', callback);
}
Valid.prototype = {
constructor: Valid,
/**
* get
* @param {String} url
*/
get: function (url) {
var match = url.match(urlReg)
, that = this;
if (match) {
var httpLib = (match[1].toLowerCase() === 'http') ? http : https
, opts = URL.parse(url)
, req;
opts.agent = false;
opts.method = 'GET';
req = httpLib.request(opts, function (res) {
var statusCode = res.statusCode;
if (statusCode === 200) {
that.emitter.emit('check', null, true);
that.fetch ?
(res.on('data', function (data) {
that.emitter.emit('data', null, data);
}) && res.on('end', function () {
that.emitter.emit('end');
})) :
(req.abort() || that.emitter.emit('end'));
} else if (300 < statusCode && statusCode < 304) {
req.abort();
var emitter = that.emitter
, valid = one(URL.resolve(url, res.headers.location), function (err, valid) {
emitter.emit('check', err, valid);
});
that.fetch && valid.on('data', function (err, data) {
emitter.emit('data', err, data);
});
valid.on('error', function (err) {
that.emitter.emit('error', err);
});
valid.on('end', function () {
that.emitter.emit('end');
});
} else {
that.emitter.emit('check', null, false);
}
res.on('error', function (err) {
req.abort();
that.emitter.emit('data', err);
});
});
req.on('error', function (err) {
req.abort();
return that.emitter.emit('check', null, false);
});
req.end();
} else {
return that.emitter.emit('check', null, false);
}
},
/**
* on
* @param {Stirng} event
* @param {Function} callback
*/
on: function (event, callback) {
(event === 'data') && (this.fetch = true);
this.emitter.on(event, callback);
return this;
},
/**
* destroy
*/
destroy: function () {
this.emitter.removeAllListeners();
this.url = undefined;
this.emitter = null;
this.fetch = undefined;
},
/**
* removeAllListeners
* @param
*/
removeAllListeners: function (event) {
event ?
this.emitter.removeAllListeners(event) :
this.emitter.removeAllListeners();
return this;
},
/**
* listeners
* @param
*/
listeners: function (event) {
if (event) {
return this.emitter.listeners(event);
} else {
var res = []
, that = this
, _push = Array.prototype.push;
Object.keys(this.emitter._events).forEach(function (key) {
_push.apply(res, that.emitter.listeners(key));
});
return res;
}
}
}
/**
* one
* @param {String} url
* @param {Function} callback
* @return {Valid}
*/
function one(url, callback) {
return (new Valid(url, callback));
}
one.one = one;
return one;
})();
相關文章
想學習javascript JS和jQuery哪個重要 先學哪個
在一些技術論壇與qq群經(jīng)??吹接羞@樣類似的提問,當然提出這樣問題的通常都是新手為了解決大家的疑惑,同時幫助新手程序員能更快掌握學習的方向,不致于弄錯重點2016-12-12Javascript基礎教程之定義和調(diào)用函數(shù)
這篇文章主要介紹了Javascript基礎教程之定義和調(diào)用函數(shù)的相關資料,需要的朋友可以參考下2015-01-01