利用numpy和pandas處理csv文件中的時間方法
環(huán)境:numpy,pandas,python3
在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的過程中,對于處理預(yù)測,回歸問題,有時候變量是時間,需要進(jìn)行合適的轉(zhuǎn)換處理后才能進(jìn)行學(xué)習(xí)分析,關(guān)于時間的變量如下所示,利用pandas和numpy對csv文件中時間進(jìn)行處理。
date (UTC) Price 01/01/2015 0:00 48.1 01/01/2015 1:00 47.33 01/01/2015 2:00 42.27
#coding:utf-8 import datetime import pandas as pd import numpy as np import pickle #用pandas將時間轉(zhuǎn)為標(biāo)準(zhǔn)格式 dateparse = lambda dates: pd.datetime.strptime(dates,'%d/%m/%Y %H:%M') #將時間欄合并,并轉(zhuǎn)為標(biāo)準(zhǔn)時間格式 rawdata = pd.read_csv('RealMarketPriceDataPT.csv',parse_dates={'timeline':['date','(UTC)']},date_parser=dateparse) #定義一個將時間轉(zhuǎn)為數(shù)字的函數(shù),s為字符串 def datestr2num(s): #toordinal()將時間格式字符串轉(zhuǎn)為數(shù)字 return datetime.datetime.strptime(s,'%Y-%m-%d %H:%M:%S').toordinal() x = [] y = [] new_date = [] for i in range(rawdata.shape[0]): x_convert = int(datestr2num(str(rawdata.ix[i,0]))) new_date.append(x_convert) y_convert = rawdata.ix[i,1].astype(np.float32) x.append(x_convert) y.append(y_convert) x = np.array(x).astype(np.float32) """ with open('price.pickle','wb') as f: pickle.dump((x,y),f) """ print(datetime.datetime.fromordinal(new_date[0]),'------>>>>>>',new_date[0]) print(datetime.datetime.fromordinal(new_date[10]),'------>>>>>>',new_date[10]) print(datetime.datetime.fromordinal(new_date[20]),'------>>>>>>',new_date[20]) print(datetime.datetime.fromordinal(new_date[30]),'------>>>>>>',new_date[30]) print(datetime.datetime.fromordinal(new_date[40]),'------>>>>>>',new_date[40]) print(datetime.datetime.fromordinal(new_date[50]),'------>>>>>>',new_date[50])
結(jié)果
將csv文件中的時間欄合并為一列,并轉(zhuǎn)為方便數(shù)據(jù)分析的float或int類型
以上這篇利用numpy和pandas處理csv文件中的時間方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
分析總結(jié)Python數(shù)據(jù)化運(yùn)營KMeans聚類
本文主要以 Python 使用 Keans 進(jìn)行聚類分析的簡單舉例應(yīng)用介紹聚類分析,它是探索性數(shù)據(jù)挖掘的主要任務(wù),也是統(tǒng)計數(shù)據(jù)分析的常用技術(shù),用于許多領(lǐng)域2021-08-08python批量獲取html內(nèi)body內(nèi)容的實(shí)例
今天小編就為大家分享一篇python批量獲取html內(nèi)body內(nèi)容的實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01Python通過wordcloud庫實(shí)現(xiàn)將單詞生成詞云
Python的wordcloud庫是一個用于生成詞云的Python包,它可以將一段文本中出現(xiàn)頻率高的單詞按其出現(xiàn)頻率大小以及顏色深淺排列成一個詞云圖形,從而更好地展示文本中的信息,你可以使用wordcloud庫來生成各種類型的詞云,本文就介紹了如何生成心型詞云2023-06-06如何利用Python實(shí)現(xiàn)自動打卡簽到的實(shí)踐
簽到,都是規(guī)律性的操作,何嘗不寫一個程序加到Windows實(shí)現(xiàn)自動簽到呢,本文就主要介紹了如何利用Python實(shí)現(xiàn)自動打卡簽到的實(shí)踐,具有一定的參考價值,感興趣的可以了解一下2021-12-12Django中數(shù)據(jù)庫的數(shù)據(jù)關(guān)系:一對一,一對多,多對多
今天小編就為大家分享一篇關(guān)于Django中數(shù)據(jù)庫的數(shù)據(jù)關(guān)系:一對一,一對多,多對多,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2018-10-10GitHub?AI編程工具copilot在Pycharm的應(yīng)用
最近聽說github出了一種最新的插件叫做copilot,這篇文章主要給大家介紹了關(guān)于GitHub?AI編程工具copilot在Pycharm的應(yīng)用,目前感覺確實(shí)不錯,建議大家也去使用,需要的朋友可以參考下2022-04-04