欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python3.x提取中文的正則表達(dá)式示例代碼

 更新時(shí)間:2019年07月23日 10:36:25   投稿:mrr  
這篇文章主要介紹了python3.x中提取中文的正則表達(dá)式的書寫,需要的朋友可以參考下

實(shí)例一: 讀取txt文件中含有中文的字符

import re ##此處使用的編輯器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符號(hào)
f=open('test.txt','rb') #這里以二進(jìn)制讀取,方便中文的轉(zhuǎn)義 ,不設(shè)置回報(bào)錯(cuò) 這里的TXT文檔
#文檔內(nèi)容:
Hello world
China
你好,你好好
This is a txt File
s2f程序員雜志一2d3程序員雜志二2d3程序員雜志三2d3程序員雜志四2d3
#此處涉及到文本的讀取工作,先讀取文件,再進(jìn)行文檔行的識(shí)別匹配
L=[]#創(chuàng)建一個(gè)列表進(jìn)行存儲(chǔ)即將生成的中文
for i in f: #遍歷txt文檔中的行
  i=i.decode('utf-8')#轉(zhuǎn)意utf-8
  l=re.findall(d,i) #正則匹配中文
  L+=l #將中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

實(shí)例二: 讀取給定字符串的中文字符

import re ##此處使用的編輯器是python3.x 
s = "s2f程序員雜志一2d3程序員雜志二2d3程序員雜志三2d3程序員雜志四2d3".encode() #此處必須進(jìn)行字符串轉(zhuǎn)義
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正則表達(dá)式
regex = re.compile(pattern) #生成正則對(duì)象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍歷出內(nèi)容
  print (result)

總結(jié)

以上所述是小編給大家介紹的python3.x提取中文的正則表達(dá)式示例代碼,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
如果你覺得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!

相關(guān)文章

  • Python3?中return和yield的區(qū)別

    Python3?中return和yield的區(qū)別

    這篇文章主要介紹了Python3?中return和yield的區(qū)別,return和yield都用來返回值;在一次性地返回所有值場(chǎng)景中return和yield的作用是一樣的,但是具體有什么區(qū)別呢,帶著疑問一起進(jìn)入下面文章學(xué)習(xí)詳細(xì)內(nèi)容吧
    2022-06-06
  • 詳解python Todo清單實(shí)戰(zhàn)

    詳解python Todo清單實(shí)戰(zhàn)

    這篇文章主要介紹了詳解python Todo清單實(shí)戰(zhàn),需要實(shí)現(xiàn)的功能有添加任務(wù)、刪除任務(wù)、編輯任務(wù),操作要關(guān)聯(lián)數(shù)據(jù)庫(kù),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-11-11
  • python圖片剪裁代碼(圖片按四個(gè)點(diǎn)坐標(biāo)剪裁)

    python圖片剪裁代碼(圖片按四個(gè)點(diǎn)坐標(biāo)剪裁)

    這篇文章主要介紹了python圖片剪裁代碼(圖片按四個(gè)點(diǎn)坐標(biāo)剪裁),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • Python中turtle.write方法使用說明

    Python中turtle.write方法使用說明

    turtle模塊以面向?qū)ο蠛兔嫦蜻^程的方式提供turtle圖形基元,由于它使用Tkinter作為基礎(chǔ)圖形,因此需要安裝有Tk支持的Python版本,下面這篇文章主要給大家介紹了關(guān)于Python中turtle.write方法使用說明的相關(guān)資料,需要的朋友可以參考下
    2022-02-02
  • Python計(jì)算當(dāng)前日期是一年中的第幾天的方法詳解

    Python計(jì)算當(dāng)前日期是一年中的第幾天的方法詳解

    在Python中,計(jì)算當(dāng)前日期是一年中的第幾天可以通過內(nèi)置的datetime模塊來實(shí)現(xiàn),本文將詳細(xì)介紹如何使用Python編寫代碼來完成這個(gè)任務(wù),需要的可以參考下
    2023-12-12
  • Python利用Turtle繪制Technoblade的示例代碼

    Python利用Turtle繪制Technoblade的示例代碼

    國(guó)外一位在YouTube擁有上千萬粉絲的我的世界游戲主播Technoblade因癌癥與世長(zhǎng)辭,為了紀(jì)念他,特地寫了這篇文章,教大家用Turtle繪制出Technoblade,快跟隨小編一起學(xué)習(xí)一下吧
    2023-01-01
  • python讀取多類型文件夾中的文檔內(nèi)容

    python讀取多類型文件夾中的文檔內(nèi)容

    無論我們使用哪種編程語言,處理文件對(duì)于每個(gè)程序員都是必不可少的,本文主要介紹了python讀取多類型文件夾中的文檔內(nèi)容,具有一定的參考價(jià)值,感興趣的可以了解一下
    2024-03-03
  • Django框架 信號(hào)調(diào)度原理解析

    Django框架 信號(hào)調(diào)度原理解析

    這篇文章主要介紹了Django框架 信號(hào)調(diào)度原理解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-09-09
  • python中的django是做什么的

    python中的django是做什么的

    在本篇文章里小編給大家整理了關(guān)于python中的django作用以及相關(guān)基礎(chǔ)知識(shí)點(diǎn),需要的朋友們學(xué)習(xí)下。
    2020-07-07
  • TensorFlow tensor的拼接實(shí)例

    TensorFlow tensor的拼接實(shí)例

    今天小編就為大家分享一篇TensorFlow tensor的拼接實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01

最新評(píng)論