python實(shí)現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法
本文實(shí)例講述了python實(shí)現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法,是一個(gè)非常實(shí)用的技巧,分享給大家供大家參考。具體如下:
有時(shí)候我們討厭下載電影和電視劇文件名中的多余字符(如網(wǎng)址和廣告字樣),搞得文件名好長(zhǎng)!不便于查看,這時(shí)候就可以使用下面的Python代碼,自行修改即可.
具體實(shí)現(xiàn)代碼如下:
#!\usr\bin\env python # -*- coding: utf-8 -*- # Author: 吳徐平 # FileName: RefineFileName.py # Function: # 下載的電影電視文件名太長(zhǎng), # 常常含有多余的字符,如'中英雙字幕', # 可以使用本Python代碼去掉 # Using python 2.7.X,win xp sp3 import sys import os import re # 文件夾目錄列表 FileDirectoryList=[\ u"E:\\電視電影\\都市俠盜.Leverage",\ u"E:\\電視電影\\犯罪心理.Criminal.Minds",\ u"E:\\電視電影\\海軍罪案調(diào)查處.NCIS",\ u"E:\\電視電影\\警察世家.Blue.Bloods"\ ] #文件名開頭處是否需要添加的字符串 #不需要添加字符時(shí),留空(或空白)字符來表示 AddStringList=[\ u'Leverage',\ u'Criminal.Minds',\ u'NCIS.',\ u'Blue.Bloods.' ] # 文件名中必須去掉的字符 MustReplaceStringList=[\ u'都市俠盜',\ u'犯罪心理',\ u'海軍罪案調(diào)查處',\ u'警察世家',\ u'人人影視',\ u'SFiles',\ u'YYeTs',\ ] # 去掉所有不必要的字符 NewString=u''; # 自定義重命名文件的函數(shù) def RenameFileName(OldFileName,NewFileName): oldpath,oldfn = os.path.split(OldFileName) newpath,newfn = os.path.split(NewFileName) print(oldpath.encode('ascii','ignore')) os.rename(OldFileName, NewFileName) #print (oldfn.encode('ascii','ignore')+' --> '+newfn.encode('ascii','ignore')) #正則表達(dá)式替換,最多一次,忽略大小寫 def StringRegexReplace(pattern,repl,string): return re.sub(pattern, repl, string, count=1, flags=re.I) # 循環(huán)#硬盤的電影電視劇所有目錄下的文件 for FileDirectory in FileDirectoryList: FileNamesList=os.listdir(FileDirectory) # 循環(huán)重新命名文件 for filenamei in FileNamesList: # 首先去掉文件名中的空格字符 RefinedFileName=filenamei.replace(u' ',NewString) # 循環(huán)必須去掉的文件名列表 for MustReplaceString in MustReplaceStringList: RefinedFileName=RefinedFileName.replace(MustReplaceString,NewString) #去掉錄制信息 RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*rip(?=[\.\-_])','',RefinedFileName) RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])xvi[^.]*(?=[\.\-_])','',RefinedFileName) #去掉分辨率 RefinedFileName=StringRegexReplace('\d{1,4}X\d{1,4}','',RefinedFileName) #去掉[*]里面的所有內(nèi)容 RefinedFileName=StringRegexReplace(u'\[.*\]','',RefinedFileName) #去掉網(wǎng)址 RefinedFileName=StringRegexReplace(u'www\..*\.((com)|(net)|(cn)|(org))','',RefinedFileName) #去掉字幕(組)的字樣 RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*字幕組?','',RefinedFileName) #去掉出品和作品字樣 RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*[出作]品','',RefinedFileName) #去掉開頭的點(diǎn).下劃線_連接符-等 RefinedFileName=StringRegexReplace(u'^[._\-]','',RefinedFileName) # 經(jīng)常出現(xiàn)兩個(gè)點(diǎn)以上,直接替換成一個(gè)點(diǎn) RefinedFileName=RefinedFileName.replace(u'...',u'.') RefinedFileName=RefinedFileName.replace(u'..',u'.') # 可以重新命名了 OldFileName=os.path.join(FileDirectory,filenamei) NewFileName=os.path.join(FileDirectory,RefinedFileName) RenameFileName(OldFileName,NewFileName) ####下面的代碼在文件頭添加字符串 #判斷是否已經(jīng)添加了字符串 def HasAddString(AddString0,FileNameString0): if (len(AddString0.strip())<1):#AddString0為空字符不需要再添加任何字符了 print('Empty AddString,No need to add to : '+ FileNameString0.encode('ascii','ignore')) return True else: AddString=AddString0.strip().lower() FileNameString=FileNameString0.strip().lower() if(len(FileNameString)<=len(AddString)): return False else: if(FileNameString[0:(len(AddString)-1)]==AddString[0:(len(AddString)-1)]): return True else: return False DirCounter=0; # 循環(huán)#硬盤的電影電視劇所有目錄下的文件 for FileDirectory in FileDirectoryList: FileNamesList=os.listdir(FileDirectory) AddString =AddStringList[DirCounter] DirCounter=DirCounter+1 # 循環(huán)重新命名文件 for filenamei in FileNamesList: #已經(jīng)加過的文件名不再添加字符了 if HasAddString(AddString,filenamei): print(filenamei.encode('ascii','ignore')+' : ALready Added Header String!') else: # 首先連接字符串 RefinedFileName=AddString+filenamei # 可以重新命名了 OldFileName=os.path.join(FileDirectory,filenamei) NewFileName=os.path.join(FileDirectory,RefinedFileName) RenameFileName(OldFileName,NewFileName) print(filenamei.encode('ascii','ignore')+' : Add Header String, OK!')
對(duì)文件名的修改有特殊要求的,可以將StringRegexReplace函數(shù)用上.
運(yùn)行本文實(shí)例后可以看到下面的電視劇文件名看起來就舒服多了:
希望本文所述實(shí)例對(duì)大家的Python程序設(shè)計(jì)能有所幫助。
- 使用Python多線程爬蟲爬取電影天堂資源
- 基于python實(shí)現(xiàn)的抓取騰訊視頻所有電影的爬蟲
- 編寫Python爬蟲抓取豆瓣電影TOP100及用戶頭像的方法
- Python抓取電影天堂電影信息的代碼
- python實(shí)現(xiàn)根據(jù)用戶輸入從電影網(wǎng)站獲取影片信息的方法
- python正則表達(dá)式爬取貓眼電影top100
- 使用python實(shí)現(xiàn)抓取騰訊視頻所有電影的爬蟲
- python使用requests模塊實(shí)現(xiàn)爬取電影天堂最新電影信息
- Python爬取APP下載鏈接的實(shí)現(xiàn)方法
- Python3.6實(shí)現(xiàn)根據(jù)電影名稱(支持電視劇名稱),獲取下載鏈接的方法
相關(guān)文章
python使用tkinter實(shí)現(xiàn)自定義多參數(shù)對(duì)話框
Tkinter模塊是Python標(biāo)準(zhǔn)庫(kù)中的一部分,用于創(chuàng)建圖形用戶界面(GUI)應(yīng)用程序,它提供了一組工具和組件,用于創(chuàng)建窗口、按鈕、文本框等用戶界面元素,并且可以響應(yīng)用戶的輸入,本文將給大家講講python如何使用tkinter實(shí)現(xiàn)自定義多參數(shù)對(duì)話框2023-08-08Python3 queue隊(duì)列模塊詳細(xì)介紹
queue是python中的標(biāo)準(zhǔn)庫(kù),俗稱隊(duì)列。這篇文章給大家介紹了Python3 queue隊(duì)列模塊,包括模塊中的常用方法及構(gòu)造函數(shù),需要的朋友參考下吧2018-01-01pytorch中的named_parameters()和parameters()
這篇文章主要介紹了pytorch中的named_parameters()和parameters()使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-09-09Pytorch中的 torch.distributions庫(kù)詳解
這篇文章主要介紹了Pytorch中的 torch.distributions庫(kù),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-02-02Python基于similarities實(shí)現(xiàn)文本語(yǔ)義相似度計(jì)算和文本匹配搜索
similarities?實(shí)現(xiàn)了多種相似度計(jì)算、匹配搜索算法,支持文本、圖像,python3開發(fā),下面我們就來看看如何使用similarities實(shí)現(xiàn)文本語(yǔ)義相似度計(jì)算和文本匹配搜索吧2024-03-03