Python不規(guī)范的日期字符串處理類(lèi)
我分析了形如19920203、199203、1992.02.03、1992.02、1992-02-03、1992-02、920203時(shí)間格式特征,列出了正則表達(dá)式如下:
^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$
當(dāng)然這個(gè)表達(dá)式還不是很完善,只能做簡(jiǎn)單的切割,不能判斷日期的合法性,關(guān)于日期是否合法,我還是交給Python的時(shí)間功能來(lái)處理吧。
根據(jù)上面的正則表達(dá)式,我寫(xiě)的DateParser類(lèi)如下:
import re
import datetime
# ***************************************************
# *
# * Description: 非標(biāo)準(zhǔn)的日期字符串處理
# * Author: wangye <pcn88 at hotmail dot com>
# *
# ***************************************************
class DateParser(object):
def __init__(self):
self.pattern = re.compile(
r'^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$'
)
def __cutDate(self, date, flags):
y = date.year
m = date.month if flags[1] else 1
d = date.day if flags[2] else 1
return datetime.date(y, m, d)
def __mergeFlags(self, flags1, flags2):
l = []
length = min(len(flags1), len(flags2))
for i in range(0, length):
if flags1[i] and flags2[i]:
l.append(True)
else:
l.append(False)
return l
def parse(self, strdate):
"""
描述:時(shí)間解析方法。
參數(shù):strdate 要分析的時(shí)間字符串,比如目標(biāo)時(shí)間類(lèi)型datetime(1992, 2, 3)
可以被解析的是下述字符串之一:
19920203
199203
1992.02.03
1992.02
1992-02-03
1992-02
920203
返回值:
如果成功
元組(datetime, flags),其中datetime表示轉(zhuǎn)換完成的合法時(shí)間,
flags是標(biāo)志位,表示有效位數(shù),比如199202實(shí)際轉(zhuǎn)換了年和月,日沒(méi)有,
但是本函數(shù)將默認(rèn)返回1日,但是flags將表示為(True, True, False),
前面兩個(gè)True分別表示年和月被轉(zhuǎn)換,最后一個(gè)False表示日沒(méi)有被轉(zhuǎn)換。
如果失敗
返回None。
"""
m = self.pattern.match(strdate)
flags = [False, False, False]
if m:
matches = list(m.groups())
flags = list(map(lambda x:True if x!=None else False, matches))
results = list(map(lambda x:int(x) if x!=None else 1, matches))
# results = list(map(lambda x:1 if x==None else x, results))
if results[0]<100:
if results[0]>9:
results[0] += 1900
else:
results[0] += 2000
return (datetime.date(results[0], results[1], results[2]), flags)
else:
return None
def convert(self, strdate, format):
"""
描述:轉(zhuǎn)換日期為指定格式。
參數(shù):strdate 同parse方法的strdate參數(shù)。
format Python時(shí)間格式標(biāo)識(shí),同datetime.date.strftime格式化標(biāo)識(shí)。
返回值:
如果成功,返回指定format格式的時(shí)間字符串。
如果失敗,返回None。
"""
date = self.parse(strdate)
if date:
date = date[0]
return datetime.date.strftime(date, format)
else:
return None
def compare(self, strdate1, strdate2):
"""
描述:比較兩個(gè)日期。
參數(shù):strdate1 和 strdate2 同parse方法的strdate參數(shù)
返回值:
可以是下列值之一
-4 strdate1 無(wú)效, strdate2 有效
-3 strdate1 有效, strdate2 無(wú)效
-2 strdate1 和 strdate2 無(wú)效
-1 strdate1 < strdate2
0 strdate1 = strdate2
1 strdate1 > strdate2
"""
date1,flags1 = self.parse(strdate1)
date2,flags2 = self.parse(strdate2)
if date1 == None and date2 != None:
return -4
if date1 != None and date2 == None:
return -3
elif date1 == None and date2 == None:
return -2
flags = self.__mergeFlags(flags1, flags2)
date1 = self.__cutDate(date1, flags)
date2 = self.__cutDate(date2, flags)
if date1>date2:
return 1
elif date1<date2:
return -1
else:
return 0
下面舉幾個(gè)例子供大家參考:
>>> DateParser().parse("19860126")
(datetime.date(1986, 1, 26), [True, True, True])
>>> DateParser().parse("199111")
(datetime.date(1991, 11, 1), [True, True, False])
>>> DateParser().parse("1991")
(datetime.date(1919, 9, 1), [True, True, True])
>>> DateParser().parse("8511")
(datetime.date(1985, 11, 1), [True, True, False])
>>> DateParser().convert("19911101", "%Y * %m * %d")
'1991 * 11 * 01'
>>> DateParser().convert("1990.1.01", "%Y.%m.%d")
'1990.01.01'
>>> DateParser().compare("1992.2", "19922")
0
>>> DateParser().compare("1992.2", "1956.03.1")
1
相關(guān)文章
利用Tkinter(python3.6)實(shí)現(xiàn)一個(gè)簡(jiǎn)單計(jì)算器
這篇文章主要給大家介紹了關(guān)于利用Tkinter(python3.6)實(shí)現(xiàn)一個(gè)簡(jiǎn)單計(jì)算器的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。2017-12-12Python中Wxpython實(shí)現(xiàn)剪切、復(fù)制、粘貼和文件打開(kāi)示例
我們?cè)赑ython開(kāi)發(fā)中中,可以使用WxPython庫(kù)來(lái)創(chuàng)建GUI應(yīng)用程序,并實(shí)現(xiàn)剪切、復(fù)制、粘貼和文件打開(kāi)功能,本文就來(lái)介紹一下,感興趣的可以了解一下2024-03-03如何使用 Python 中的功能和庫(kù)創(chuàng)建 n-gram的過(guò)程
在計(jì)算語(yǔ)言學(xué)中,n-gram 對(duì)于語(yǔ)言處理、上下文和語(yǔ)義分析非常重要,本文將討論如何使用 Python 中的功能和庫(kù)創(chuàng)建 n-gram,感興趣的朋友一起看看吧2023-09-09Python實(shí)現(xiàn)GUI計(jì)算器(附源碼)
這篇文章主要為大家詳細(xì)介紹了如何利用Python語(yǔ)言實(shí)現(xiàn)GUI計(jì)算器,可執(zhí)行復(fù)雜運(yùn)算,文中的示例代碼講解詳細(xì),具有一定的借鑒價(jià)值,需要的可以參考一下2022-11-11Python編寫(xiě)帶選項(xiàng)的命令行程序方法
今天小編就為大家分享一篇Python編寫(xiě)帶選項(xiàng)的命令行程序方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-08-08python中的內(nèi)置函數(shù)max()和min()及mas()函數(shù)的高級(jí)用法
這篇文章主要介紹了python中的內(nèi)置函數(shù)max()和min()的相關(guān)知識(shí)及python中內(nèi)置函數(shù)max()的高級(jí)用法,需要的朋友可以參考下2018-03-03