numpy和pandas中數(shù)組的合并、拉直和重塑實(shí)例
合并
在numpy中合并兩個(gè)array
numpy中可以通過concatenate,參數(shù)axis=0表示在垂直方向上合并兩個(gè)數(shù)組,等價(jià)于np.vstack;參數(shù)axis=1表示在水平方向上合并兩個(gè)數(shù)組,等價(jià)于np.hstack。
垂直方向:
np.concatenate([arr1,arr2],axis=0) np.vstack([arr1,arr2])
水平方向:
np.concatenate([arr1,arr2],axis=1) np.hstack([arr1,arr2])
import numpy as np
import pandas as pd
arr1=np.ones((3,5))
arr1
Out[5]:
array([[ 1., 1., 1., 1., 1.],
[ 1., 1., 1., 1., 1.],
[ 1., 1., 1., 1., 1.]])
arr2=np.random.randn(15).reshape(arr1.shape)
arr2
Out[8]:
array([[-0.09666833, 1.47064828, -1.94608976, 0.2651279 , -0.32894787],
[ 1.01187699, 0.39171167, 1.49607091, 0.79216196, 0.33246644],
[ 1.71266238, 0.86650837, 0.77830394, -0.90519422, 1.55410056]])
np.concatenate([arr1,arr2],axis=0) #在縱軸上合并
Out[9]:
array([[ 1. , 1. , 1. , 1. , 1. ],
[ 1. , 1. , 1. , 1. , 1. ],
[ 1. , 1. , 1. , 1. , 1. ],
[-0.09666833, 1.47064828, -1.94608976, 0.2651279 , -0.32894787],
[ 1.01187699, 0.39171167, 1.49607091, 0.79216196, 0.33246644],
[ 1.71266238, 0.86650837, 0.77830394, -0.90519422, 1.55410056]])
np.concatenate([arr1,arr2],axis=1) #在橫軸上合并
Out[10]:
array([[ 1. , 1. , 1. , ..., -1.94608976,
0.2651279 , -0.32894787],
[ 1. , 1. , 1. , ..., 1.49607091,
0.79216196, 0.33246644],
[ 1. , 1. , 1. , ..., 0.77830394,
-0.90519422, 1.55410056]])
在pandas中合并兩個(gè)DataFrame
pandas中通過concat方法實(shí)現(xiàn)合并,指定參數(shù)axis=0 或者 axis=1,在縱軸和橫軸上合并兩個(gè)數(shù)組。與numpy不同,這里的兩個(gè)dataframe要放在一個(gè)列表中,即[frame1,frame2]
from pandas import DataFrame frame1=DataFrame([[1,2,3],[4,5,6]]) frame2=DataFrame([[7,8,9],[10,11,12]]) pd.concat([frame1,frame2], ignore_index=True) # 合并的數(shù)組是一個(gè)可迭代的列表。 Out[25]: 0 1 2 0 1 2 3 1 4 5 6 0 7 8 9 1 10 11 12 pd.concat([frame1,frame2], axis=1, ignore_index=True) Out[27]: 0 1 2 3 4 5 0 1 2 3 7 8 9 1 4 5 6 10 11 12
拉直和重塑
拉直即把一個(gè)二維的array變成一個(gè)一維的array。默認(rèn)情況下,Numpy數(shù)組是按行優(yōu)先順序創(chuàng)建。在空間方面,這就意味著,對于一個(gè)二維數(shù)字,每行中的數(shù)據(jù)項(xiàng)是存放在內(nèi)在中相鄰的位置上的。另一種順序是列優(yōu)先。
由于歷史原因,行優(yōu)先和列優(yōu)先又分別被稱為C和Fortran順序。在Numpy中,可以通過關(guān)鍵字參數(shù)order=‘C' 和order=‘F' 來實(shí)現(xiàn)行優(yōu)先和列優(yōu)先。
拉直:
arr=np.arange(15).reshape(3,-1)
arr
Out[29]:
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
arr.ravel('F') #按照列優(yōu)先,扁平化。
Out[30]: array([ 0, 5, 10, ..., 4, 9, 14])
arr.ravel('C') # 默認(rèn)順序。#按照行優(yōu)先,扁平化。
Out[31]: array([ 0, 1, 2, ..., 12, 13, 14])
重塑:
Fortran順序重塑后按列拉直和原數(shù)據(jù)按列拉直一樣。
arr.reshape((5,3),order='F')
Out[32]:
array([[ 0, 11, 8],
[ 5, 2, 13],
[10, 7, 4],
[ 1, 12, 9],
[ 6, 3, 14]])
C順序重塑后按行拉直和原數(shù)據(jù)按行拉直一樣。
arr.reshape((5,3),order='C')
Out[33]:
array([[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8],
[ 9, 10, 11],
[12, 13, 14]])
以上這篇numpy和pandas中數(shù)組的合并、拉直和重塑實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Tensorflow高性能數(shù)據(jù)優(yōu)化增強(qiáng)工具Pipeline使用詳解
這篇文章主要為大家介紹了Tensorflow高性能數(shù)據(jù)優(yōu)化增強(qiáng)工具Pipeline使用詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-11-11
Python基于tkinter canvas實(shí)現(xiàn)圖片裁剪功能
這篇文章主要介紹了Python基于tkinter canvas實(shí)現(xiàn)圖片裁剪功能,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11
python使用urlparse分析網(wǎng)址中域名的方法
這篇文章主要介紹了python使用urlparse分析網(wǎng)址中域名的方法,涉及Python使用urlparse模塊操作URL的技巧,需要的朋友可以參考下2015-04-04
關(guān)于Python 中的時(shí)間處理包datetime和arrow的方法詳解
這篇文章主要介紹了關(guān)于Python 中的時(shí)間處理包datetime和arrow的相關(guān)知識,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03
python虛擬機(jī)pyc文件結(jié)構(gòu)的深入理解
這篇文章主要為大家介紹了python虛擬機(jī)之pyc文件結(jié)構(gòu)的深入探究理解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03
python遞歸調(diào)用中的坑:打印有值, 返回卻None
這篇文章主要介紹了python遞歸調(diào)用中的坑:打印有值, 返回卻None,本文通過問題分析給出解決方法,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03

