python刪除文本中行數(shù)標簽的方法
問題描述:
我們在網(wǎng)上下載或者復(fù)制別人代碼的時候經(jīng)常會遇到下載的代碼中包含行數(shù)標簽的情況。如下圖:
這些代碼中包含著行數(shù)如1.,2.等,如果我們想直接運行或者copy代碼需要自己手動的刪除這些標簽。既然學(xué)了python,我們寫一段腳本來處理它吧。
思路分析:
首先,我們逐行的讀取文本。
利用正則表達式,可以順利地匹配出所有的這些標簽以及后面跟隨的“\t”,正則表達式為:“\d+.\t”。
接著我們將匹配的結(jié)果在這一行中刪除它,使用string模塊的replace方法,將匹配的結(jié)果用‘'代替。
最后,我們保存每次刪除了行數(shù)標簽的結(jié)果行,然后將這些行寫入原文本。注意,以w的方式打開文本會刪除原文本內(nèi)容。
代碼:
# -*- coding:utf-8 -*- import re import os import sys reload(sys) sys.setdefaultencoding('utf-8') ls = os.linesep label_regex = r'\d+.\t' content = [] for line in open('source.txt', 'r'): mm = re.search(label_regex, line) if mm: mm = mm.group() content.append(line.replace(mm, '').rstrip()) else: break f = open('source.txt', 'w') f.writelines(['%s%s' % (x,ls) for x in content])
結(jié)果:
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
分析機器學(xué)習(xí)之決策樹Python實現(xiàn)
決策樹是一種非參數(shù)的有監(jiān)督學(xué)習(xí)方法,它能夠從一系列有特征和標簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖的結(jié)構(gòu)來呈現(xiàn)這些規(guī)則,以解決分類和回歸問題。決策樹算法容易理解,適用各種數(shù)據(jù),在解決各種問題時都有良好表現(xiàn)2021-06-06python如何通過psutil獲取服務(wù)器cpu、內(nèi)存、磁盤使用率
這篇文章主要介紹了python通過psutil獲取服務(wù)器cpu,內(nèi)存,磁盤使用率,使用psutil,可以很方便地監(jiān)控系統(tǒng)的運行狀況,診斷問題和優(yōu)化性能,需要的朋友可以參考下2023-04-04Python實現(xiàn)對字典分別按鍵(key)和值(value)進行排序的方法分析
這篇文章主要介紹了Python實現(xiàn)對字典分別按鍵(key)和值(value)進行排序的方法,結(jié)合實例形式分析了Python基于sorted函數(shù)及operator庫進行字典排序的相關(guān)操作技巧,需要的朋友可以參考下2018-12-12Python繪制數(shù)據(jù)動態(tài)圖的方法詳解
這篇文章主要為大家詳細介紹了如何利用Python語言繪制好看的數(shù)據(jù)動態(tài)圖,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起動手嘗試一下2022-07-07