欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas數(shù)據(jù)探索之合并數(shù)據(jù)示例詳解

 更新時(shí)間:2023年10月08日 11:53:36   作者:海貍大大  
這篇文章主要為大家介紹了pandas數(shù)據(jù)探索之合并數(shù)據(jù)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪

用pandas探索你的數(shù)據(jù)-合并數(shù)據(jù)

在數(shù)據(jù)處理和分析中,數(shù)據(jù)的合并是一項(xiàng)關(guān)鍵任務(wù)。Pandas 提供了豐富的工具來(lái)處理不同來(lái)源的數(shù)據(jù),并將它們合并成一個(gè)更大的數(shù)據(jù)集。在這篇文章中,我們將深入探討 Pandas 中兩個(gè)重要的數(shù)據(jù)合并函數(shù):pd.concat() 和 pd.merge()

首先,我們將通過(guò)一系列的步驟和示例來(lái)學(xué)習(xí)如何使用這些函數(shù)。然后,我們將深入解釋每個(gè)函數(shù)的詳細(xì)用法,包括參數(shù)和常見(jiàn)的用例。無(wú)論您是數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師還是對(duì)數(shù)據(jù)處理感興趣的任何人,這篇文章都將為您提供處理和合并數(shù)據(jù)的實(shí)用技能。

探索虛擬姓名數(shù)據(jù)

步驟1 導(dǎo)入必要的庫(kù)

# 運(yùn)行以下代碼
import numpy as np
import pandas as pd

步驟2 按照如下的元數(shù)據(jù)內(nèi)容創(chuàng)建數(shù)據(jù)框

# 運(yùn)行以下代碼
raw_data_1 = {
        'subject_id': ['1', '2', '3', '4', '5'],
        'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 
        'last_name': ['Anderson', 'Ackerman', 'Ali', 'Aoni', 'Atiches']}
raw_data_2 = {
        'subject_id': ['4', '5', '6', '7', '8'],
        'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 
        'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}
raw_data_3 = {
        'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'],
        'test_id': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}

步驟3 將上述的數(shù)據(jù)框分別命名為data1, data2, data3

# 運(yùn)行以下代碼
data1 = pd.DataFrame(raw_data_1, columns = ['subject_id', 'first_name', 'last_name'])
data2 = pd.DataFrame(raw_data_2, columns = ['subject_id', 'first_name', 'last_name'])
data3 = pd.DataFrame(raw_data_3, columns = ['subject_id','test_id'])

步驟4 將data1和data2兩個(gè)數(shù)據(jù)框按照行的維度進(jìn)行合并

命名為all_data

# 運(yùn)行以下代碼
all_data = pd.concat([data1, data2])
all_data

style scoped

.dataframe tbody tr th:only-of-type {
    vertical-align: middle;
}
.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}
subject_idfirst_namelast_name
01AlexAnderson
12AmyAckerman
23AllenAli
34AliceAoni
45AyoungAtiches
04BillyBonder
15BrianBlack
26BranBalwner
37BryceBrice
48BettyBtisan

步驟5 將data1和data2兩個(gè)數(shù)據(jù)框按照列的維度進(jìn)行合并

命名為all_data_col

# 運(yùn)行以下代碼
all_data_col = pd.concat([data1, data2], axis = 1)
all_data_col

style scoped

.dataframe tbody tr th:only-of-type {
    vertical-align: middle;
}
.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}
subject_idfirst_namelast_namesubject_idfirst_namelast_name
01AlexAnderson4BillyBonder
12AmyAckerman5BrianBlack
23AllenAli6BranBalwner
34AliceAoni7BryceBrice
45AyoungAtiches8BettyBtisan

步驟6 打印data3

# 運(yùn)行以下代碼
data3

style scoped

.dataframe tbody tr th:only-of-type {
    vertical-align: middle;
}
.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}
subject_idtest_id
0151
1215
2315
3461
4516
5714
6815
791
81061
91116

步驟7 按照subject_id的值對(duì)all_data和data3作合并

# 運(yùn)行以下代碼
pd.merge(all_data, data3, on='subject_id')

style scoped

.dataframe tbody tr th:only-of-type {
    vertical-align: middle;
}
.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}
subject_idfirst_namelast_nametest_id
01AlexAnderson51
12AmyAckerman15
23AllenAli15
34AliceAoni61
44BillyBonder61
55AyoungAtiches16
65BrianBlack16
77BryceBrice14
88BettyBtisan15

步驟8 對(duì)data1和data2按照subject_id作連接

# 運(yùn)行以下代碼
pd.merge(data1, data2, on='subject_id', how='inner')

style scoped

.dataframe tbody tr th:only-of-type {
    vertical-align: middle;
}
.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}
subject_idfirst_name_xlast_name_xfirst_name_ylast_name_y
04AliceAoniBillyBonder
15AyoungAtichesBrianBlack

步驟9 找到 data1 和 data2 合并之后的所有匹配結(jié)果

# 運(yùn)行以下代碼
pd.merge(data1, data2, on='subject_id', how='outer')

style scoped

.dataframe tbody tr th:only-of-type {
    vertical-align: middle;
}
.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}
subject_idfirst_name_xlast_name_xfirst_name_ylast_name_y
01AlexAndersonNaNNaN
12AmyAckermanNaNNaN
23AllenAliNaNNaN
34AliceAoniBillyBonder
45AyoungAtichesBrianBlack
56NaNNaNBranBalwner
67NaNNaNBryceBrice
78NaNNaNBettyBtisan

總結(jié)

在本練習(xí)中,我們使用Pandas進(jìn)行了合并操作,主要涉及以下要點(diǎn):

  • 使用pd.concat函數(shù)可以按行維度合并兩個(gè)數(shù)據(jù)框。例如,將data1data2合并為all_data,使用pd.concat([data1, data2])。
  • 使用pd.concat函數(shù)的axis參數(shù)可以按列維度合并兩個(gè)數(shù)據(jù)框。例如,將data1data2按列維度合并為all_data_col,使用pd.concat([data1, data2], axis=1)。
  • 使用pd.merge函數(shù)可以按照指定的列(如subject_id)對(duì)兩個(gè)數(shù)據(jù)框進(jìn)行合并。例如,按照subject_id對(duì)all_datadata3合并,使用pd.merge(all_data, data3, on='subject_id')。
  • 在合并操作中,可以使用how參數(shù)指定合并的方式,包括inner(內(nèi)連接,保留兩個(gè)數(shù)據(jù)框的交集)、outer(外連接,保留兩個(gè)數(shù)據(jù)框的并集)等。
  • 合并操作可以幫助我們根據(jù)共享的列值將不同數(shù)據(jù)框中的信息整合在一起,從而進(jìn)行更復(fù)雜的數(shù)據(jù)分析和處理。

pd.concat() 是 Pandas 中用于合并數(shù)據(jù)的函數(shù)之一,它通常用于按行或列方向?qū)⒍鄠€(gè)數(shù)據(jù)框連接在一起。以下是對(duì) pd.concat() 函數(shù)的詳細(xì)解釋:

pd.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)

參數(shù)說(shuō)明:

  • objs:要合并的對(duì)象,通常是一個(gè)包含多個(gè)數(shù)據(jù)框的列表或元組。
  • axis:指定合并的方向,可以是 0(默認(rèn),按行方向)或 1(按列方向)。
  • join:指定合并時(shí)的連接方式,可以是 'outer'(默認(rèn),取并集)或 'inner'(取交集)。
  • ignore_index:如果為 True,則在合并時(shí)重置索引,默認(rèn)為 False,保留原始索引。
  • keys:創(chuàng)建一個(gè)層次化索引,用于標(biāo)識(shí)每個(gè)原始數(shù)據(jù)框的來(lái)源。
  • levels:指定多層索引的級(jí)別名稱。
  • names:為多層索引的級(jí)別指定名稱。
  • verify_integrity:如果為 True,則檢查合并后的數(shù)據(jù)是否唯一,如果有重復(fù)的索引,將引發(fā)異常,默認(rèn)為 False。
  • sort:如果為 True,則對(duì)合并后的數(shù)據(jù)進(jìn)行排序,默認(rèn)為 False。
  • copy:如果為 True,則復(fù)制數(shù)據(jù)而不修改原始對(duì)象,默認(rèn)為 True

pd.concat() 返回一個(gè)合并后的新數(shù)據(jù)框,不會(huì)修改原始數(shù)據(jù)框。

使用示例:

合并兩個(gè)數(shù)據(jù)框按行方向(默認(rèn)方式):

result = pd.concat([df1, df2])

合并兩個(gè)數(shù)據(jù)框按列方向:

result = pd.concat([df1, df2], axis=1)

創(chuàng)建多層索引:

result = pd.concat([df1, df2], keys=['df1', 'df2'])

重置索引:

result = pd.concat([df1, df2], ignore_index=True)

pd.concat() 是一個(gè)非常有用的函數(shù),用于在數(shù)據(jù)處理中將多個(gè)數(shù)據(jù)框合并在一起,以便進(jìn)行分析和操作。

pd.merge() 是 Pandas 中用于合并數(shù)據(jù)的函數(shù)之一,它通常用于將兩個(gè)數(shù)據(jù)框(DataFrame)按照指定的列或索引進(jìn)行連接操作。以下是對(duì) pd.merge() 函數(shù)的詳細(xì)解釋:

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

參數(shù)說(shuō)明:

  • left:左側(cè)的數(shù)據(jù)框(DataFrame)。
  • right:右側(cè)的數(shù)據(jù)框(DataFrame)。
  • how:連接方式,可選值有 'left'(左連接,默認(rèn)),'right'(右連接),'outer'(外連接),'inner'(內(nèi)連接)。
  • on:連接列名,如果左右兩側(cè)的數(shù)據(jù)框都有相同列名,可以使用這個(gè)參數(shù)指定列名進(jìn)行連接。
  • left_on:左側(cè)數(shù)據(jù)框的連接列名,用于指定左側(cè)數(shù)據(jù)框的連接列。
  • right_on:右側(cè)數(shù)據(jù)框的連接列名,用于指定右側(cè)數(shù)據(jù)框的連接列。
  • left_index:如果為 True,則使用左側(cè)數(shù)據(jù)框的索引進(jìn)行連接。
  • right_index:如果為 True,則使用右側(cè)數(shù)據(jù)框的索引進(jìn)行連接。
  • sort:如果為 True,則在連接之前對(duì)數(shù)據(jù)進(jìn)行排序,默認(rèn)為 False。
  • suffixes:如果左右兩側(cè)數(shù)據(jù)框有相同列名,可以使用 suffixes 參數(shù)添加后綴以區(qū)分這些列,默認(rèn)為 ('_x', '_y')。
  • copy:如果為 True,則復(fù)制數(shù)據(jù)而不修改原始對(duì)象,默認(rèn)為 True。
  • indicator:如果為 True,則在結(jié)果中添加一個(gè)特殊的列 _merge,用于表示每行的合并方式,默認(rèn)為 False
  • validate:用于驗(yàn)證連接操作的有效性,可選值有 'one_to_one','one_to_many','many_to_one','many_to_many'

pd.merge() 返回一個(gè)合并后的新數(shù)據(jù)框,不會(huì)修改原始數(shù)據(jù)框。

使用示例:

內(nèi)連接兩個(gè)數(shù)據(jù)框,使用相同列名連接:

result = pd.merge(left_df, right_df, on='key_column', how='inner')

左連接兩個(gè)數(shù)據(jù)框,指定左側(cè)數(shù)據(jù)框的連接列和右側(cè)數(shù)據(jù)框的連接列:

result = pd.merge(left_df, right_df, left_on='left_key', right_on='right_key', how='left')

連接時(shí)使用左側(cè)數(shù)據(jù)框的索引:

result = pd.merge(left_df, right_df, left_index=True, right_on='key_column', how='inner')

添加后綴以區(qū)分相同列名的列:

result = pd.merge(left_df, right_df, on='key_column', suffixes=('_left', '_right'))

pd.merge() 是一個(gè)強(qiáng)大的數(shù)據(jù)連接工具,可用于合并不同來(lái)源的數(shù)據(jù),進(jìn)行數(shù)據(jù)分析和處理。根據(jù)不同的連接需求,可以選擇不同的連接方式和參數(shù)。

以上就是pandas數(shù)據(jù)探索之合并數(shù)據(jù)示例詳解的詳細(xì)內(nèi)容,更多關(guān)于pandas合并數(shù)據(jù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • 詳解python 字符串和日期之間轉(zhuǎn)換 StringAndDate

    詳解python 字符串和日期之間轉(zhuǎn)換 StringAndDate

    這篇文章主要介紹了python 字符串和日期之間轉(zhuǎn)換 StringAndDate簡(jiǎn)單實(shí)例的相關(guān)資料,需要的朋友可以參考下
    2017-05-05
  • 手把手教你實(shí)現(xiàn)Python重試超時(shí)裝飾器

    手把手教你實(shí)現(xiàn)Python重試超時(shí)裝飾器

    這篇文章主要為大家介紹了實(shí)現(xiàn)Python重試超時(shí)裝飾器教程示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步早日升職加薪
    2023-05-05
  • 基于Python編寫一個(gè)寶石消消樂(lè)小游戲

    基于Python編寫一個(gè)寶石消消樂(lè)小游戲

    快過(guò)年回家啦用,本文將為大家介紹一個(gè)用python編寫的寶石消消樂(lè)游戲用來(lái)哄小朋友,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以學(xué)習(xí)一下
    2022-01-01
  • Pycharm學(xué)習(xí)教程(6) Pycharm作為Vim編輯器使用

    Pycharm學(xué)習(xí)教程(6) Pycharm作為Vim編輯器使用

    這篇文章主要為大家詳細(xì)介紹了最全的Pycharm學(xué)習(xí)教程第六篇,Pycharm作為Vim編輯器使用,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2017-05-05
  • Pytorch四維Tensor轉(zhuǎn)圖片并保存方式(維度順序調(diào)整)

    Pytorch四維Tensor轉(zhuǎn)圖片并保存方式(維度順序調(diào)整)

    這篇文章主要介紹了Pytorch四維Tensor轉(zhuǎn)圖片并保存方式(維度順序調(diào)整),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-12-12
  • Python定時(shí)執(zhí)行程序問(wèn)題(schedule)

    Python定時(shí)執(zhí)行程序問(wèn)題(schedule)

    這篇文章主要介紹了Python定時(shí)執(zhí)行程序問(wèn)題(schedule),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-04-04
  • Django使用rest_framework寫出API

    Django使用rest_framework寫出API

    這篇文章主要介紹了Django使用rest_framework寫出API,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-05-05
  • python中如何讀取xlsx文件

    python中如何讀取xlsx文件

    這篇文章主要介紹了python中如何讀取xlsx文件問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • Python控制臺(tái)獲取輸入與常見(jiàn)的正則表達(dá)式用法

    Python控制臺(tái)獲取輸入與常見(jiàn)的正則表達(dá)式用法

    這篇文章主要給大家介紹了關(guān)于Python控制臺(tái)獲取輸入與常見(jiàn)的正則表達(dá)式用法的相關(guān)資料,在Python編程中,控制臺(tái)輸入和正則表達(dá)式是兩個(gè)重要而實(shí)用的概念,文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2023-12-12
  • 使用pycharm設(shè)置控制臺(tái)不換行的操作方法

    使用pycharm設(shè)置控制臺(tái)不換行的操作方法

    今天小編就為大家分享一篇使用pycharm設(shè)置控制臺(tái)不換行的操作方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-01-01

最新評(píng)論