欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

如何用pandas讀取一個文件或某個文件夾下所有文件

 更新時間:2024年02月01日 10:25:23   作者:旺仔的算法coding筆記  
這篇文章主要介紹了如何用pandas讀取一個文件或某個文件夾下所有文件問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

pandas讀取一個文件或某個文件夾下所有文件

讀取一個文件

直接用文件路徑。

如果是讀取某個文件夾下的所有文件,注意用os.path,逐個讀取文件,把新讀取到的Dataframe進(jìn)行concate操作到總的Dataframe中去。

詳細(xì)請見代碼。

 
character_list =['1010011_i_u_prov',  '9010081_i_b_location']
#這是讀取一個文件的,
# data=pd.read_csv('../data/10line_of_part-00000',sep='\t',header=None)
# 如果讀取所有文件呢?如下
 
file_dir="../data/dt=20200807"
all_file_list=os.listdir(file_dir)
for single_file in all_file_list:
    # 逐個讀取 
    single_data_frame=pd.read_csv(
            os.path.join(file_dir,single_file),sep='\t',header=None)
	if single_file ==all_file_list[0]:
		all_data_frame=single_data_frame
	else:  #進(jìn)行concat操作       
         all_data_frame=pd.concat([all_data_frame,
                    single_data_frame],ignore_index=True)
 
# data.columns=character_list,給dataframe的屬性重新命名。
all_data_frame.columns=character_list

備注:

data數(shù)據(jù)是從sql中select出來的結(jié)果。

注意:

分隔符要用\t,不然會報錯!

pandas讀取多個文件并合并到一起

先把文件位置放到一起,讀取文件,再concat。

subdir=‘store'

file_names = []#存文件名
file_names.append(test1.csv')#繼續(xù)添加文件名

csv_paths = []#存文件位置
for file_name in file_names:
    csv_path = join( '..','csv', subdir, file_name)#文件位置
    csv_paths.append(csv_path)
    break

df_csvs = []
for csv_path in csv_paths:
    df_tmp = pd.read_csv('%s' % csv_path, low_memory=False)
    df_csvs.append(df_tmp)
    
df_total = pd.concat(df_csvs)#合并成一個dataframe

#小技巧 非必須

#如列名為a.uid想改為uid 用以下方法操作

df_total.columns = [s[2:] for s in df_total.columns]
df_total.shape

總結(jié)

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 用Python監(jiān)控你的朋友都在瀏覽哪些網(wǎng)站?

    用Python監(jiān)控你的朋友都在瀏覽哪些網(wǎng)站?

    今天教各位小伙伴一個黑科技,用Python監(jiān)控你的朋友都在瀏覽哪些網(wǎng)站,文中有非常詳細(xì)的介紹,對正在學(xué)習(xí)python的小伙伴們很有幫助,需要的朋友可以參考下
    2021-05-05
  • 詳解如何通過Python制作一個密碼生成器

    詳解如何通過Python制作一個密碼生成器

    定期更換密碼是一種非常重要的安全措施,這種做法可以有效地保護(hù)你的賬戶和個人信息不受黑客和網(wǎng)絡(luò)攻擊者的侵害。所以本文就來用Python制作一個密碼生成器吧
    2023-05-05
  • Python通過內(nèi)置函數(shù)和自寫算法DFS實現(xiàn)排列組合

    Python通過內(nèi)置函數(shù)和自寫算法DFS實現(xiàn)排列組合

    這篇文章主要介紹了Python通過內(nèi)置函數(shù)和自寫算法DFS實現(xiàn)排列組合,排列組合是數(shù)學(xué)中的一種常見的計算方法,用于求出從給定的元素中選取若干個元素的所有可能的排列或組合。在Python中,有多種方式可以實現(xiàn)排列組合的計算,需要的朋友可以參考下
    2023-05-05
  • python使用技巧-查找文件?

    python使用技巧-查找文件?

    這篇文章主要分享的是python使用技巧查找文件,下面我們就來介紹針對python查找文件的相關(guān)內(nèi)容,需要的小伙伴可以參考一下
    2022-02-02
  • python基于?Web?實現(xiàn)?m3u8?視頻播放的實例

    python基于?Web?實現(xiàn)?m3u8?視頻播放的實例

    這篇文章主要介紹了python基于?Web?實現(xiàn)?m3u8?視頻播放的實例的相關(guān)資料,需要的朋友可以參考下
    2023-06-06
  • Python如何聲明以管理員方式運行(附實戰(zhàn)案例)

    Python如何聲明以管理員方式運行(附實戰(zhàn)案例)

    由于Windows的安全機制,Python寫的腳本缺少了管理員權(quán)限,運行就會受到一些限制,這篇文章主要介紹了Python如何聲明以管理員方式運行的相關(guān)資料,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2025-04-04
  • 總結(jié)Python編程中三條常用的技巧

    總結(jié)Python編程中三條常用的技巧

    這篇文章主要介紹了總結(jié)Python編程中三條常用的技巧,包括JSON格式的轉(zhuǎn)換、else語句的活用和setdefault方法的使用,需要的朋友可以參考下
    2015-05-05
  • numpy中數(shù)組拼接、數(shù)組合并方法總結(jié)(append(),?concatenate,?hstack,?vstack,?column_stack,?row_stack,?np.r_,?np.c_等)

    numpy中數(shù)組拼接、數(shù)組合并方法總結(jié)(append(),?concatenate,?hstack,?vstack

    numpy庫是一個高效處理多維數(shù)組的工具,可以在進(jìn)行邊寫的數(shù)組計算上進(jìn)行一系列的操作,下面這篇文章主要給大家介紹了關(guān)于numpy中數(shù)組拼接、數(shù)組合并方法(append(),?concatenate,?hstack,?vstack,?column_stack,?row_stack,?np.r_,?np.c_等)的相關(guān)資料,需要的朋友可以參考下
    2022-08-08
  • Python如何查看并打印matplotlib中所有的colormap(cmap)類型

    Python如何查看并打印matplotlib中所有的colormap(cmap)類型

    這篇文章主要介紹了Python如何查看并打印matplotlib中所有的colormap(cmap)類型,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-11-11
  • 如何用python實現(xiàn)一個HTTP連接池

    如何用python實現(xiàn)一個HTTP連接池

    這篇文章主要介紹了如何用python實現(xiàn)一個HTTP連接池的步驟,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2021-01-01

最新評論