欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python使用正則表達(dá)式去除中文文本多余空格,保留英文之間空格方法詳解

 更新時(shí)間:2020年02月11日 16:40:49   作者:六神就是我  
這篇文章主要介紹了python使用正則表達(dá)式去除中文文本多余空格,保留英文之間空格方法詳解,需要的朋友可以參考下

在pdf轉(zhuǎn)為文本的時(shí)候,經(jīng)常會(huì)多出空格,影響數(shù)據(jù)觀感,因此需要去掉文本中多余的空格,而文本中的英文之間的正常空格需要保留,輸入輸出如下:

input:我今天 賺了 10 個(gè)億,老百姓very happy。

output:我今天賺了10個(gè)億,老百姓very happy。

代碼

def clean_space(text):
  """"
  處理多余的空格
  """
  match_regex = re.compile(u'[\u4e00-\u9fa5。\.,,::《》、\(\)()]{1} +(?<![a-zA-Z])|\d+ +| +\d+|[a-z A-Z]+')
  should_replace_list = match_regex.findall(text)
  order_replace_list = sorted(should_replace_list,key=lambda i:len(i),reverse=True)
  for i in order_replace_list:
    if i == u' ':
      continue
    new_i = i.strip()
    text = text.replace(i,new_i)
  return text

python去除英文單詞之間多余的空格

re.sub(" +", " ", s)

import re 

s = "     info has been found (+/- 100 pages, and 4.5 mb of .pdf files) now i have to wait untill our team leader has processed it and learns html.     "
re.sub(" +", " ", s)

' '.join(s.split())

s = "     info has been found (+/- 100 pages, and 4.5 mb of .pdf files) now i have to wait untill our team leader has processed it and learns html.     "

s = ' '.join(s.split())
s

更多關(guān)于python使用正則表達(dá)式去除多余空格方法請(qǐng)查看下面的相關(guān)鏈接

相關(guān)文章

  • python爬蟲(chóng)請(qǐng)求庫(kù)httpx和parsel解析庫(kù)的使用測(cè)評(píng)

    python爬蟲(chóng)請(qǐng)求庫(kù)httpx和parsel解析庫(kù)的使用測(cè)評(píng)

    這篇文章主要介紹了python爬蟲(chóng)請(qǐng)求庫(kù)httpx和parsel解析庫(kù)的使用測(cè)評(píng),幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下
    2021-05-05
  • python中的IO流使用解讀

    python中的IO流使用解讀

    這篇文章主要介紹了python中的IO流使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • 詳解Python3.8+PyQt5+pyqt5-tools+Pycharm配置詳細(xì)教程

    詳解Python3.8+PyQt5+pyqt5-tools+Pycharm配置詳細(xì)教程

    這篇文章主要介紹了Python3.8+PyQt5+pyqt5-tools+Pycharm配置詳細(xì)教程,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧
    2020-11-11
  • python中session的使用案例詳解

    python中session的使用案例詳解

    這篇文章主要介紹了python?session使用,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2023-05-05
  • Python繪制柱狀圖可視化神器pyecharts

    Python繪制柱狀圖可視化神器pyecharts

    這篇文章主要介紹了Python繪制柱狀圖可視化神器pyecharts,文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-09-09
  • Python列表元素常見(jiàn)操作簡(jiǎn)單示例

    Python列表元素常見(jiàn)操作簡(jiǎn)單示例

    這篇文章主要介紹了Python列表元素常見(jiàn)操作,結(jié)合簡(jiǎn)單示例形式分析了Python針對(duì)列表元素的打印、添加、刪除、修改、排序等相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下
    2019-10-10
  • python求質(zhì)數(shù)的3種方法

    python求質(zhì)數(shù)的3種方法

    這篇文章主要為大家詳細(xì)介紹了python求質(zhì)數(shù)的多種方法,多種方法求質(zhì)數(shù)的實(shí)現(xiàn)代碼,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-09-09
  • Python實(shí)現(xiàn)樹(shù)莓派攝像頭持續(xù)錄像并傳送到主機(jī)的步驟

    Python實(shí)現(xiàn)樹(shù)莓派攝像頭持續(xù)錄像并傳送到主機(jī)的步驟

    這篇文章主要介紹了Python實(shí)現(xiàn)樹(shù)莓派攝像頭持續(xù)錄像并傳送到主機(jī)的步驟,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-11-11
  • Python3列表內(nèi)置方法大全及示例代碼小結(jié)

    Python3列表內(nèi)置方法大全及示例代碼小結(jié)

    這篇文章主要介紹了Python3列表內(nèi)置方法大全及示例代碼小結(jié),非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-05-05
  • Python中的高級(jí)數(shù)據(jù)結(jié)構(gòu)詳解

    Python中的高級(jí)數(shù)據(jù)結(jié)構(gòu)詳解

    這篇文章主要介紹了Python中的高級(jí)數(shù)據(jù)結(jié)構(gòu)詳解,本文講解了Collection、Array、Heapq、Bisect、Weakref、Copy以及Pprint這些數(shù)據(jù)結(jié)構(gòu)的用法,需要的朋友可以參考下
    2015-03-03

最新評(píng)論