python去除文件中重復的行實例
更新時間:2018年06月29日 14:51:40 作者:yizhen_nlp
今天小編就為大家分享一篇python去除文件中重復的行實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
python去除文件中重復的行,我們可以設置一個一個空list,res_list,用來加入沒有出現過的字符行!
如果出現在res_list,我們就認為該行句子已經重復了,可以再加入到記錄重復句子的list中。
如下代碼:
# -*- coding: UTF-8 -*- #程序功能是為了完成判斷文件中是否有重復句子 #并將重復句子打印出來 res_list = [] #f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r') f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r') res_dup = [] index = 0 file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w') for line in f.readlines(): index = index + 1 if line in res_list: temp_str = "" temp_str = temp_str + str(index) #要變?yōu)閟tr才行 temp_line = ''.join(line) temp_str = temp_str+temp_line #最終要變?yōu)閟tr類型 file_dul.write(temp_str); #將重復的存入到文件中 else: res_list.append(line)
以上這篇python去除文件中重復的行實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python3 jupyter notebook 服務器搭建過程
這篇文章主要介紹了Python3 jupyter notebook 服務器搭建過程,非常不錯,具有一定的參考借鑒價值,需要的朋友參考下吧2018-11-11最簡化ChatGLM2-6b小白部署教程【windows系統,16G內存即可,對顯卡無要求,CPU運行】
這篇文章主要介紹了最簡化ChatGLM2-6b小白部署的方法,可以在windows系統環(huán)境下,16G內存且對顯卡無要求,并以CPU模式運行,方便實現個人PC機環(huán)境下的部署體驗,需要的朋友可以參考下2023-07-07python+selenium開發(fā)環(huán)境搭建圖文教程
這篇文章主要為大家詳細介紹了python+selenium開發(fā)環(huán)境搭建的圖文教程,具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-08-08