python刪除文本中行數(shù)標(biāo)簽的方法
問題描述:
我們在網(wǎng)上下載或者復(fù)制別人代碼的時(shí)候經(jīng)常會(huì)遇到下載的代碼中包含行數(shù)標(biāo)簽的情況。如下圖:
這些代碼中包含著行數(shù)如1.,2.等,如果我們想直接運(yùn)行或者copy代碼需要自己手動(dòng)的刪除這些標(biāo)簽。既然學(xué)了python,我們寫一段腳本來處理它吧。
思路分析:
首先,我們逐行的讀取文本。
利用正則表達(dá)式,可以順利地匹配出所有的這些標(biāo)簽以及后面跟隨的“\t”,正則表達(dá)式為:“\d+.\t”。
接著我們將匹配的結(jié)果在這一行中刪除它,使用string模塊的replace方法,將匹配的結(jié)果用‘'代替。
最后,我們保存每次刪除了行數(shù)標(biāo)簽的結(jié)果行,然后將這些行寫入原文本。注意,以w的方式打開文本會(huì)刪除原文本內(nèi)容。
代碼:
# -*- coding:utf-8 -*- import re import os import sys reload(sys) sys.setdefaultencoding('utf-8') ls = os.linesep label_regex = r'\d+.\t' content = [] for line in open('source.txt', 'r'): mm = re.search(label_regex, line) if mm: mm = mm.group() content.append(line.replace(mm, '').rstrip()) else: break f = open('source.txt', 'w') f.writelines(['%s%s' % (x,ls) for x in content])
結(jié)果:
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
分析機(jī)器學(xué)習(xí)之決策樹Python實(shí)現(xiàn)
決策樹是一種非參數(shù)的有監(jiān)督學(xué)習(xí)方法,它能夠從一系列有特征和標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖的結(jié)構(gòu)來呈現(xiàn)這些規(guī)則,以解決分類和回歸問題。決策樹算法容易理解,適用各種數(shù)據(jù),在解決各種問題時(shí)都有良好表現(xiàn)2021-06-06python如何通過psutil獲取服務(wù)器cpu、內(nèi)存、磁盤使用率
這篇文章主要介紹了python通過psutil獲取服務(wù)器cpu,內(nèi)存,磁盤使用率,使用psutil,可以很方便地監(jiān)控系統(tǒng)的運(yùn)行狀況,診斷問題和優(yōu)化性能,需要的朋友可以參考下2023-04-04解決keras加入lambda層時(shí)shape的問題
這篇文章主要介紹了解決keras加入lambda層時(shí)shape的問題,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06Python實(shí)現(xiàn)對字典分別按鍵(key)和值(value)進(jìn)行排序的方法分析
這篇文章主要介紹了Python實(shí)現(xiàn)對字典分別按鍵(key)和值(value)進(jìn)行排序的方法,結(jié)合實(shí)例形式分析了Python基于sorted函數(shù)及operator庫進(jìn)行字典排序的相關(guān)操作技巧,需要的朋友可以參考下2018-12-12Python繪制數(shù)據(jù)動(dòng)態(tài)圖的方法詳解
這篇文章主要為大家詳細(xì)介紹了如何利用Python語言繪制好看的數(shù)據(jù)動(dòng)態(tài)圖,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起動(dòng)手嘗試一下2022-07-07