Pandas中的日期時間date處理小結
更新時間:2025年04月26日 10:30:53 作者:請一直在路上
Pandas提供了強大的日期和時間處理功能,本文主要介紹了Pandas中的日期時間date處理小結,具有一定的參考價值,感興趣的可以了解一下
Pandas提供了強大的日期和時間處理功能,這對于時間序列分析至關重要。本教程將介紹Pandas中處理日期時間的主要方法。包括:
- 日期時間數(shù)據(jù)的創(chuàng)建和轉換
- 日期時間屬性的提取
- 時間差計算和日期運算
- 重采樣和頻率轉換
- 時區(qū)處理
- 基于日期時間的索引操作
Pandas中的日期時間類型
時間戳(timestamp)
:表示的是一個特定的時刻,比如 2008 年 8 月 8 日下午午 8:00。時間周期(period)
:引用特定開始和結束點之間的時間長度;例如,2015 年。時間段通常引用時間間隔的特殊情況,其中每個間隔具有統(tǒng)一的長度并且不重疊(例如,構成每天的 24 小時長的時間段)。時間增量或間隔(timedelta)
:引用確切的時間長度(例如,間隔為 22.56 秒)。
1. 創(chuàng)建日期時間數(shù)據(jù)
1.1 使用to_datetime()函數(shù)
import pandas as pd # 將字符串轉換為datetime date_str = ['2023-01-01', '2023-01-02', '2023-01-03'] dates = pd.to_datetime(date_str) print(dates)
1.2 創(chuàng)建日期范圍
# 創(chuàng)建日期范圍 date_range = pd.date_range('2023-01-01', periods=5, freq='D') print(date_range) # 帶有時區(qū)的日期范圍 date_range_tz = pd.date_range('2023-01-01', periods=5, freq='D', tz='Asia/Shanghai') print(date_range_tz)
2. 訪問日期時間屬性
# 創(chuàng)建示例DataFrame df = pd.DataFrame({ 'date': pd.date_range('2023-01-01', periods=5, freq='D'), 'value': [10, 20, 30, 40, 50] }) # 提取年、月、日等屬性 df['year'] = df['date'].dt.year df['month'] = df['date'].dt.month df['day'] = df['date'].dt.day df['day_of_week'] = df['date'].dt.dayofweek # 周一=0, 周日=6 df['day_name'] = df['date'].dt.day_name() df['is_weekend'] = df['date'].dt.dayofweek >= 5 print(df)
3. 日期時間運算
3.1 時間差計算
# 計算時間差 df['date_diff'] = df['date'] - df['date'].shift(1) print(df[['date', 'date_diff']]) # 使用Timedelta進行時間運算 df['date_plus_2days'] = df['date'] + pd.Timedelta(days=2) df['date_plus_3hours'] = df['date'] + pd.Timedelta(hours=3) print(df)
3.2 日期比較
# 日期比較 start_date = pd.to_datetime('2023-01-02') df['after_start_date'] = df['date'] > start_date print(df[['date', 'after_start_date']])
4. 重采樣和時間頻率轉換
# 創(chuàng)建示例時間序列數(shù)據(jù) ts = pd.Series( [1, 2, 3, 4, 5], index=pd.date_range('2023-01-01', periods=5, freq='D') ) # 降采樣(低頻) - 計算每周平均值 weekly = ts.resample('W').mean() print("Weekly resample:\n", weekly) # 升采樣(高頻) - 填充缺失值 hourly = ts.resample('H').ffill() print("Hourly resample (forward fill):\n", hourly.head(10)) # 只顯示前10行
5. 時區(qū)處理
# 本地化時區(qū) ts = pd.Series( [1, 2, 3], index=pd.date_range('2023-01-01', periods=3, freq='D') ) ts = ts.tz_localize('UTC') print("UTC timezone:\n", ts) # 時區(qū)轉換 ts_shanghai = ts.tz_convert('Asia/Shanghai') print("Shanghai timezone:\n", ts_shanghai)
6. 日期時間索引操作
# 設置日期為索引 df.set_index('date', inplace=True) # 按年份切片 print(df.loc['2023']) # 按月份切片 print(df.loc['2023-01']) # 按日期范圍切片 print(df.loc['2023-01-02':'2023-01-04'])
7. 實際應用示例
# 讀取包含日期時間的數(shù)據(jù) # 假設有一個CSV文件包含日期列 # df = pd.read_csv('data.csv', parse_dates=['date_column']) # 處理缺失日期 full_date_range = pd.date_range(start=df.index.min(), end=df.index.max(), freq='D') df = df.reindex(full_date_range) # 填充缺失值 df['value'] = df['value'].fillna(method='ffill') # 前向填充 # 計算滾動平均值 df['7_day_avg'] = df['value'].rolling(window='7D').mean() print(df.head(10))
8. 高級技巧
8.1 自定義工作日歷
from pandas.tseries.offsets import CustomBusinessDay from pandas.tseries.holiday import USFederalHolidayCalendar # 使用美國聯(lián)邦假日日歷 us_bd = CustomBusinessDay(calendar=USFederalHolidayCalendar()) date_range = pd.date_range('2023-01-01', periods=10, freq=us_bd) print("US business days only:\n", date_range)
8.2 季度數(shù)據(jù)處理
# 創(chuàng)建季度數(shù)據(jù) quarterly = pd.Series( [100, 200, 300, 400], index=pd.date_range('2023-01-01', periods=4, freq='Q') ) # 季度開始和結束日期 print("Quarter start:\n", quarterly.index) print("Quarter end:\n", quarterly.index + pd.offsets.QuarterEnd())
到此這篇關于Pandas中的日期時間date處理小結的文章就介紹到這了,更多相關Pandas 日期時間date內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python的numpy庫下的幾個小函數(shù)的用法(小結)
這篇文章主要介紹了Python的numpy庫下的幾個小函數(shù)的用法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-07-07python向xls寫入數(shù)據(jù)(包括合并,邊框,對齊,列寬)
這篇文章主要介紹了python向xls寫入數(shù)據(jù)(包括合并,邊框,對齊,列寬),幫助大家更好的利用python處理表格,感興趣的朋友可以了解下2021-02-02掌握python polars庫進行高效高速的數(shù)據(jù)處理。
這篇文章主要介紹了python polars庫進行高效高速的數(shù)據(jù)處理技巧詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01Python3實現(xiàn)并發(fā)檢驗代理池地址的方法
這篇文章主要介紹了Python3實現(xiàn)并發(fā)檢驗代理池地址的方法,實例分析了Python3基于線程的代理檢驗操作相關技巧,需要的朋友可以參考下2016-09-09driver = webdriver.Chrome()報錯問題及解決
這篇文章主要介紹了driver = webdriver.Chrome()報錯問題及解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-02-02