快捷導(dǎo)航

利用Python讀取Excel表內(nèi)容的詳細(xì)過程

更新時(shí)間：2022年10月17日 14:48:53 作者：WYKB_Mr_Q

python有多種方式可以去讀取excel文檔的內(nèi)容,下面這篇文章主要給大家介紹了利用Python讀取Excel表內(nèi)容的詳細(xì)過程,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下

用python讀取excel表中的數(shù)據(jù)

假如說有如下一張存儲(chǔ)了數(shù)據(jù)的excel表，其中x1-x6是特征，y_label是特征對(duì)應(yīng)的類別標(biāo)簽。我們想要使用python對(duì)以下數(shù)據(jù)進(jìn)行數(shù)據(jù)分析，那么第一步就要先把excel表中的數(shù)據(jù)讀取出來才行。這里我們主要使用到了python中的pandas庫(kù)。

首先確定excel表存放的路徑所在，比如我的路徑是 ‘E:\relate_code\svm\dataset\data.xlsx’.

import pandas as pd

file_path = r'E:\relate_code\svm\dataset\data.xlsx'   # r對(duì)路徑進(jìn)行轉(zhuǎn)義，windows需要
raw_data = pd.read_excel(file_path, header=0)  # header=0表示第一行是表頭，就自動(dòng)去除了
print(raw_data)

這樣就可以取出數(shù)據(jù)了，輸出見下圖?？梢钥闯?，這里就沒有表中的x1等表頭信息了。

但是，最左邊這里還有0-169這些行號(hào)額外信息，咱們可以用以下命令只要里面的有用信息，并保存到數(shù)組中。

data = raw_data.values     # 只提取表中信息
print(data)

輸出結(jié)果：

這時(shí)候數(shù)據(jù)就都讀進(jìn)來了，并且存儲(chǔ)為了數(shù)組形式。咱們可以選擇想要的數(shù)據(jù)，比如想把x和y分開，畢竟一個(gè)是特征，另一個(gè)是標(biāo)簽，這時(shí)候可以使用以下代碼。

features = data[:, 0:6]  # 由于是二維數(shù)組，所以第一個(gè)冒號(hào)表示選擇所有行，之后0：6表示只要前六列的數(shù)據(jù)
labels = data[:, -1]     # 標(biāo)簽只要最后一列

1、還可以對(duì)特征進(jìn)行選擇，假如只要第四列的特征也可以使用：

feature_4 = data[: 3:4]  # 這樣得出的數(shù)組依然是二維數(shù)組，便于后續(xù)特征操作

2、如果不想要第四個(gè)特征，其它都想要，也可以這樣使用，需要用到numpy庫(kù)：

import numpy as np

feature1_3 = data[:, 0:3]   # 取前三列特征
feature5_6 = data[:, 4:6]   # 取第5，第6列特征
feature_choose = np.hstack(feature1_3, feature5_6)   # 對(duì)兩份特征進(jìn)行特征拼接

這里再多說一下，np.hstack（）函數(shù)和 np.vstack（）函數(shù)：

這里是np.vstack()函數(shù)。主要是進(jìn)行豎直堆疊，使用這個(gè)函數(shù)的時(shí)候要保證兩個(gè)數(shù)組列數(shù)是一致的（都是三列），得出的結(jié)果如下。

import numpy as np

arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([7, 8, 9])
print(np.vstack((arr1, arr2)))

下面是np.hstack()函數(shù)，主要是進(jìn)行水平堆疊，使用這個(gè)函數(shù)的時(shí)候要保證行數(shù)是一致的（都是兩行）。

import numpy as np

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
print(np.hstack((arr1, arr2)))

就先介紹到這里吧，下一篇文章介紹機(jī)器學(xué)習(xí)的代碼使用！

總結(jié)

到此這篇關(guān)于利用Python讀取Excel表內(nèi)容的文章就介紹到這了,更多相關(guān)Python讀取Excel表內(nèi)容內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

利用Python讀取Excel表內(nèi)容的詳細(xì)過程

目錄

用python讀取excel表中的數(shù)據(jù)

這里再多說一下，np.hstack（）函數(shù)和 np.vstack（）函數(shù)：

總結(jié)

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具