欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python中django框架通過正則搜索頁面上email地址的方法

 更新時間:2015年03月21日 12:39:55   作者:niuniu  
這篇文章主要介紹了python中django框架通過正則搜索頁面上email地址的方法,涉及django框架及正則表達(dá)式的使用技巧,需要的朋友可以參考下

本文實例講述了python中django框架通過正則搜索頁面上email地址的方法。分享給大家供大家參考。具體實現(xiàn)方法如下:

import re
from django.shortcuts import render
from pattern.web import URL, DOM, abs, find_urls
def index(request):
 """
 find email addresses in requested url or contact page
 """
 error = ''
 emails = set()
 url_string = request.GET.get('url', '')
 EMAIL_REGEX = re.compile(r'[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,6}', re.IGNORECASE)
 # use absolute url or domain name
 url = URL(url_string) if url_string.startswith('http') else URL(domain=url_string,protocol='http')
 if url_string:
 try:
  dom = DOM(url.download(cached=True))
 except Exception, e:
  error = e
 else:
  contact_urls = { url.string }
  # search links of contact page
  for link in dom('a'):
  if re.search(r'contact|about', link.source, re.IGNORECASE):
   contact_urls.add(
   abs(link.attributes.get('href',''), base=url.redirect or url.string))
  for contact_url in contact_urls:
  # download contact page
  dom = DOM(URL(contact_url).download(cached=True))
  # search emails in the body of the page
  for line in dom('body')[0].content.split('\n'):
   found = EMAIL_REGEX.search(line)
   if found:
   emails.add(found.group())
 data = {
 'url': url_string,
 'emails': emails,
 'error': error,
 }
 return render(request, 'index.html', data)

PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:

JavaScript正則表達(dá)式在線測試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述對大家的Python程序設(shè)計有所幫助。

相關(guān)文章

  • python二分法查找實例代碼

    python二分法查找實例代碼

    二分算法是一種效率比較高的查找算法,其輸入的是一個有序的元素列表,如果查找元素包含在列表中,二分查找返回其位置,否則返回NONE,下面這篇文章主要給大家介紹了關(guān)于python二分法查找的相關(guān)資料,需要的朋友可以參考下
    2021-11-11
  • python將數(shù)據(jù)插入數(shù)據(jù)庫的代碼分享

    python將數(shù)據(jù)插入數(shù)據(jù)庫的代碼分享

    在本篇文章里小編給大家整理的是關(guān)于python將數(shù)據(jù)插入數(shù)據(jù)庫的代碼內(nèi)容,有興趣的朋友們可以參考下。
    2020-08-08
  • python實現(xiàn)圖片九宮格分割

    python實現(xiàn)圖片九宮格分割

    一張圖片分成的九宮圖,大家知道是怎么做到嗎?這篇文章就為大家詳細(xì)介紹了python實現(xiàn)圖片九宮格分割功能,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-07-07
  • Pycharm新建項目時報錯解決辦法

    Pycharm新建項目時報錯解決辦法

    pycharm可以很方便的管理Python的解釋器(如果安裝了多個的話),以及第三方模塊,包,下面這篇文章主要給大家介紹了關(guān)于Pycharm新建項目時報錯解決的相關(guān)資料,需要的朋友可以參考下
    2023-06-06
  • 利用python-docx模塊寫批量生日邀請函

    利用python-docx模塊寫批量生日邀請函

    這篇文章主要為大家詳細(xì)介紹了利用python-docx模塊批量生日邀請函,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-08-08
  • Linux下使用python調(diào)用top命令獲得CPU利用率

    Linux下使用python調(diào)用top命令獲得CPU利用率

    這篇文章主要介紹了Linux下使用python調(diào)用top命令獲得CPU利用率,本文直接給出實現(xiàn)代碼,需要的朋友可以參考下
    2015-03-03
  • Python中的序列化詳細(xì)解析

    Python中的序列化詳細(xì)解析

    這篇文章主要介紹了Python中的序列化詳細(xì)解析,序列化是指把程序中的一個類轉(zhuǎn)化成一個標(biāo)準(zhǔn)化的格式,標(biāo)準(zhǔn)化的意義是這個格式可以跨程序,跨平臺的被使用,而且保持其原有的內(nèi)容,規(guī)范,需要的朋友可以參考下
    2023-11-11
  • python3正則提取字符串里的中文實例

    python3正則提取字符串里的中文實例

    今天小編就為大家分享一篇python3正則提取字符串里的中文實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • Python求一批字符串的最長公共前綴算法示例

    Python求一批字符串的最長公共前綴算法示例

    這篇文章主要介紹了Python求一批字符串的最長公共前綴算法,涉及Python針對字符串的遍歷、判斷、計算等相關(guān)操作技巧,需要的朋友可以參考下
    2019-03-03
  • Pytorch建模過程中的DataLoader與Dataset示例詳解

    Pytorch建模過程中的DataLoader與Dataset示例詳解

    這篇文章主要介紹了Pytorch建模過程中的DataLoader與Dataset,同時PyTorch針對不同的專業(yè)領(lǐng)域,也提供有不同的模塊,例如?TorchText,?TorchVision,?TorchAudio,這些模塊中也都包含一些真實數(shù)據(jù)集示例,本文給大家介紹的非常詳細(xì),需要的朋友參考下吧
    2023-01-01

最新評論