python實(shí)現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法
本文實(shí)例講述了python實(shí)現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法,是一個(gè)非常實(shí)用的技巧,分享給大家供大家參考。具體如下:
有時(shí)候我們討厭下載電影和電視劇文件名中的多余字符(如網(wǎng)址和廣告字樣),搞得文件名好長!不便于查看,這時(shí)候就可以使用下面的Python代碼,自行修改即可.
具體實(shí)現(xiàn)代碼如下:
#!\usr\bin\env python
# -*- coding: utf-8 -*-
# Author: 吳徐平
# FileName: RefineFileName.py
# Function:
# 下載的電影電視文件名太長,
# 常常含有多余的字符,如'中英雙字幕',
# 可以使用本Python代碼去掉
# Using python 2.7.X,win xp sp3
import sys
import os
import re
# 文件夾目錄列表
FileDirectoryList=[\
u"E:\\電視電影\\都市俠盜.Leverage",\
u"E:\\電視電影\\犯罪心理.Criminal.Minds",\
u"E:\\電視電影\\海軍罪案調(diào)查處.NCIS",\
u"E:\\電視電影\\警察世家.Blue.Bloods"\
]
#文件名開頭處是否需要添加的字符串
#不需要添加字符時(shí),留空(或空白)字符來表示
AddStringList=[\
u'Leverage',\
u'Criminal.Minds',\
u'NCIS.',\
u'Blue.Bloods.'
]
# 文件名中必須去掉的字符
MustReplaceStringList=[\
u'都市俠盜',\
u'犯罪心理',\
u'海軍罪案調(diào)查處',\
u'警察世家',\
u'人人影視',\
u'SFiles',\
u'YYeTs',\
]
# 去掉所有不必要的字符
NewString=u'';
# 自定義重命名文件的函數(shù)
def RenameFileName(OldFileName,NewFileName):
oldpath,oldfn = os.path.split(OldFileName)
newpath,newfn = os.path.split(NewFileName)
print(oldpath.encode('ascii','ignore'))
os.rename(OldFileName, NewFileName)
#print (oldfn.encode('ascii','ignore')+' --> '+newfn.encode('ascii','ignore'))
#正則表達(dá)式替換,最多一次,忽略大小寫
def StringRegexReplace(pattern,repl,string):
return re.sub(pattern, repl, string, count=1, flags=re.I)
# 循環(huán)#硬盤的電影電視劇所有目錄下的文件
for FileDirectory in FileDirectoryList:
FileNamesList=os.listdir(FileDirectory)
# 循環(huán)重新命名文件
for filenamei in FileNamesList:
# 首先去掉文件名中的空格字符
RefinedFileName=filenamei.replace(u' ',NewString)
# 循環(huán)必須去掉的文件名列表
for MustReplaceString in MustReplaceStringList:
RefinedFileName=RefinedFileName.replace(MustReplaceString,NewString)
#去掉錄制信息
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*rip(?=[\.\-_])','',RefinedFileName)
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])xvi[^.]*(?=[\.\-_])','',RefinedFileName)
#去掉分辨率
RefinedFileName=StringRegexReplace('\d{1,4}X\d{1,4}','',RefinedFileName)
#去掉[*]里面的所有內(nèi)容
RefinedFileName=StringRegexReplace(u'\[.*\]','',RefinedFileName)
#去掉網(wǎng)址
RefinedFileName=StringRegexReplace(u'www\..*\.((com)|(net)|(cn)|(org))','',RefinedFileName)
#去掉字幕(組)的字樣
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*字幕組?','',RefinedFileName)
#去掉出品和作品字樣
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*[出作]品','',RefinedFileName)
#去掉開頭的點(diǎn).下劃線_連接符-等
RefinedFileName=StringRegexReplace(u'^[._\-]','',RefinedFileName)
# 經(jīng)常出現(xiàn)兩個(gè)點(diǎn)以上,直接替換成一個(gè)點(diǎn)
RefinedFileName=RefinedFileName.replace(u'...',u'.')
RefinedFileName=RefinedFileName.replace(u'..',u'.')
# 可以重新命名了
OldFileName=os.path.join(FileDirectory,filenamei)
NewFileName=os.path.join(FileDirectory,RefinedFileName)
RenameFileName(OldFileName,NewFileName)
####下面的代碼在文件頭添加字符串
#判斷是否已經(jīng)添加了字符串
def HasAddString(AddString0,FileNameString0):
if (len(AddString0.strip())<1):#AddString0為空字符不需要再添加任何字符了
print('Empty AddString,No need to add to : '+ FileNameString0.encode('ascii','ignore'))
return True
else:
AddString=AddString0.strip().lower()
FileNameString=FileNameString0.strip().lower()
if(len(FileNameString)<=len(AddString)):
return False
else:
if(FileNameString[0:(len(AddString)-1)]==AddString[0:(len(AddString)-1)]):
return True
else:
return False
DirCounter=0;
# 循環(huán)#硬盤的電影電視劇所有目錄下的文件
for FileDirectory in FileDirectoryList:
FileNamesList=os.listdir(FileDirectory)
AddString =AddStringList[DirCounter]
DirCounter=DirCounter+1
# 循環(huán)重新命名文件
for filenamei in FileNamesList:
#已經(jīng)加過的文件名不再添加字符了
if HasAddString(AddString,filenamei):
print(filenamei.encode('ascii','ignore')+' : ALready Added Header String!')
else:
# 首先連接字符串
RefinedFileName=AddString+filenamei
# 可以重新命名了
OldFileName=os.path.join(FileDirectory,filenamei)
NewFileName=os.path.join(FileDirectory,RefinedFileName)
RenameFileName(OldFileName,NewFileName)
print(filenamei.encode('ascii','ignore')+' : Add Header String, OK!')
對(duì)文件名的修改有特殊要求的,可以將StringRegexReplace函數(shù)用上.
運(yùn)行本文實(shí)例后可以看到下面的電視劇文件名看起來就舒服多了:

希望本文所述實(shí)例對(duì)大家的Python程序設(shè)計(jì)能有所幫助。
- 使用Python多線程爬蟲爬取電影天堂資源
- 基于python實(shí)現(xiàn)的抓取騰訊視頻所有電影的爬蟲
- 編寫Python爬蟲抓取豆瓣電影TOP100及用戶頭像的方法
- Python抓取電影天堂電影信息的代碼
- python實(shí)現(xiàn)根據(jù)用戶輸入從電影網(wǎng)站獲取影片信息的方法
- python正則表達(dá)式爬取貓眼電影top100
- 使用python實(shí)現(xiàn)抓取騰訊視頻所有電影的爬蟲
- python使用requests模塊實(shí)現(xiàn)爬取電影天堂最新電影信息
- Python爬取APP下載鏈接的實(shí)現(xiàn)方法
- Python3.6實(shí)現(xiàn)根據(jù)電影名稱(支持電視劇名稱),獲取下載鏈接的方法
相關(guān)文章
python使用tkinter實(shí)現(xiàn)自定義多參數(shù)對(duì)話框
Tkinter模塊是Python標(biāo)準(zhǔn)庫中的一部分,用于創(chuàng)建圖形用戶界面(GUI)應(yīng)用程序,它提供了一組工具和組件,用于創(chuàng)建窗口、按鈕、文本框等用戶界面元素,并且可以響應(yīng)用戶的輸入,本文將給大家講講python如何使用tkinter實(shí)現(xiàn)自定義多參數(shù)對(duì)話框2023-08-08
Python3 queue隊(duì)列模塊詳細(xì)介紹
queue是python中的標(biāo)準(zhǔn)庫,俗稱隊(duì)列。這篇文章給大家介紹了Python3 queue隊(duì)列模塊,包括模塊中的常用方法及構(gòu)造函數(shù),需要的朋友參考下吧2018-01-01
pytorch中的named_parameters()和parameters()
這篇文章主要介紹了pytorch中的named_parameters()和parameters()使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-09-09
Pytorch中的 torch.distributions庫詳解
這篇文章主要介紹了Pytorch中的 torch.distributions庫,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-02-02
Python基于similarities實(shí)現(xiàn)文本語義相似度計(jì)算和文本匹配搜索
similarities?實(shí)現(xiàn)了多種相似度計(jì)算、匹配搜索算法,支持文本、圖像,python3開發(fā),下面我們就來看看如何使用similarities實(shí)現(xiàn)文本語義相似度計(jì)算和文本匹配搜索吧2024-03-03

