欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python去除文件中重復(fù)的行實(shí)例

 更新時(shí)間:2018年06月29日 14:51:40   作者:yizhen_nlp  
今天小編就為大家分享一篇python去除文件中重復(fù)的行實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

python去除文件中重復(fù)的行,我們可以設(shè)置一個(gè)一個(gè)空l(shuí)ist,res_list,用來(lái)加入沒(méi)有出現(xiàn)過(guò)的字符行!

如果出現(xiàn)在res_list,我們就認(rèn)為該行句子已經(jīng)重復(fù)了,可以再加入到記錄重復(fù)句子的list中。

如下代碼:

# -*- coding: UTF-8 -*-
#程序功能是為了完成判斷文件中是否有重復(fù)句子
#并將重復(fù)句子打印出來(lái)
 
res_list = []
#f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r')
f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r')
res_dup = []
index = 0
file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w')
for line in f.readlines():
 index = index + 1
 if line in res_list:
  temp_str = ""
  temp_str = temp_str + str(index)     #要變?yōu)閟tr才行
  temp_line = ''.join(line)
  temp_str = temp_str+temp_line
  #最終要變?yōu)閟tr類型
  file_dul.write(temp_str);       #將重復(fù)的存入到文件中
 else:
  res_list.append(line)

以上這篇python去除文件中重復(fù)的行實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評(píng)論