欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python使用xlsx和pandas處理Excel表格的操作步驟

 更新時間:2023年01月04日 11:23:47   作者:水w  
python的神器pandas庫就可以非常方便地處理excel,csv,矩陣,表格 等數(shù)據(jù),下面這篇文章主要給大家介紹了關(guān)于python使用xlsx和pandas處理Excel表格的操作步驟,文中通過圖文介紹的非常詳細,需要的朋友可以參考下

一、使用xls和xlsx處理Excel表格

xls是excel2003及以前版本所生成的文件格式;
xlsx是excel2007及以后版本所生成的文件格式;
(excel 2007之后版本可以打開上述兩種格式,但是excel2013只能打開xls格式);

1.1 用openpyxl模塊打開Excel文檔,查看所有sheet表

openpyxl.load_workbook()函數(shù)接受文件名,返回一個workbook數(shù)據(jù)類型的值。這個workbook對象代表這個Excel文件,這個有點類似File對象代表一個打開的文本文件。  

workbook = xlrd2.open_workbook("1.xlsx")  # 返回一個workbook數(shù)據(jù)類型的值
sheets = workbook.sheet_names()
print(sheets)
# 結(jié)果:
# ['Sheet1', 'Sheet2']

或者

workbook = openpyxl.load_workbook("1.xlsx")	    # 返回一個workbook數(shù)據(jù)類型的值
print(workbook.sheetnames)	    # 打印Excel表中的所有表
 
# 結(jié)果:
# ['Sheet1', 'Sheet2']

1.2 通過sheet名稱獲取表格

workbook = openpyxl.load_workbook("數(shù)據(jù)源總表(1).xlsx")	    # 返回一個workbook數(shù)據(jù)類型的值
print(workbook.sheetnames)	    # 打印Excel表中的所有表
sheet = workbook['Sheet1']  # 獲取指定sheet表
print(sheet)
 
# 結(jié)果:
# ['Sheet1', 'Sheet2']
# <Worksheet "Sheet1">

1.3 獲取活動表的獲取行數(shù)和列數(shù)

方法1:自己寫一個for循環(huán)

方法2:使用

  • sheet.max_row 獲取行數(shù)
  • sheet.max_column 獲取列數(shù)
workbook = openpyxl.load_workbook("數(shù)據(jù)源總表(1).xlsx")	    # 返回一個workbook數(shù)據(jù)類型的值
print(workbook.sheetnames)	    # 打印Excel表中的所有表
sheet = workbook['1、基本情況']  # 獲取指定sheet表
print(sheet)
print('rows', sheet.max_row, 'column', sheet.max_column)    # 獲取行數(shù)和列數(shù)

? 讀取xlsx文件錯誤:xlrd.biffh.XLRDError: Excel xlsx file; not supported

運行代碼時,會出現(xiàn)以下報錯。

xlrd.biffh.XLRDError: Excel xlsx file; not supported

(1)檢查第三方庫xlrd的版本:

我這里的版本為xlrd2.0.1最新版本,問題就出在這里,我們需要卸載最新版本,安裝舊版本,卸載安裝過程如下。

(2)在File-Settings下的Project-Python Interpreter中重新按照舊版本xlrd2,

按照上述步驟卸載xlrd后再安裝xlrd2后,

可以看到錯誤解決了。

二、使用pandas讀取xlsx

pyCharm pip安裝pandas庫,請移步到python之 pyCharm pip安裝pandas庫失敗_水w的博客-CSDN博客_pandas安裝失敗

2.1 讀取數(shù)據(jù)

import pandas as pd
#1.讀取前n行所有數(shù)據(jù)
df1=pd.read_excel('d1.xlsx')#讀取xlsx中的第一個sheet
 
data1=df1.head(10)    #讀取前10行所有數(shù)據(jù)
data2=df1.values    #list【】  相當于一個矩陣,以行為單位
#data2=df.values()   報錯:TypeError: 'numpy.ndarray' object is not callable
print("獲取到所有的值:\n{0}".format(data1))#格式化輸出
print("獲取到所有的值:\n{0}".format(data2))
 
#2.讀取特定行特定列
data3=df1.iloc[0].values    #讀取第一行所有數(shù)據(jù)
data4=df1.iloc[1,1]    #讀取指定行列位置數(shù)據(jù):讀?。?,1)位置的數(shù)據(jù)
data5=df1.iloc[[1,2]].values    #讀取指定多行:讀取第一行和第二行所有數(shù)據(jù)
data6=df1.iloc[:,[0]].values    #讀取指定列的所有行數(shù)據(jù):讀取第一列所有數(shù)據(jù)
 
print("數(shù)據(jù):\n{0}".format(data3))
print("數(shù)據(jù):\n{0}".format(data4))
print("數(shù)據(jù):\n{0}".format(data5))
print("數(shù)據(jù):\n{0}".format(data6))
 
#3.獲取xlsx文件行號、列號
print("輸出行號列表{}".format(df1.index.values))    #獲取所有行的編號:0、1、2、3、4
print("輸出列標題{}".format(df1.columns.values))    #也就是每列的第一個元素
 
#4.將xlsx數(shù)據(jù)轉(zhuǎn)換為字典
data=[]
for i in df1.index.values:    #獲取行號的索引,并對其遍歷
    #根據(jù)i來獲取每一行指定的數(shù)據(jù),并用to_dict轉(zhuǎn)成字典
    row_data=df1.loc[i,['id','name','class','data','score',]].to_dict()
    data.append(row_data)
print("最終獲取到的數(shù)據(jù)是:{0}".format(data))
 
#iloc和loc的區(qū)別:iloc根據(jù)行號來索引,loc根據(jù)index來索引。
#所以1,2,3應該用iloc,4應該有l(wèi)oc

讀取特定的某幾列的數(shù)據(jù):

import pandas as pd
 
file_path = r'int.xlsx'   # r對路徑進行轉(zhuǎn)義,windows需要
df = pd.read_excel(file_path, header=0, usecols=[3, 4])  # header=0表示第一行是表頭,就自動去除了, 指定讀取第3和4列

2.2 使用pandas查找兩個列表中相同的元素

解決:查找兩個列表中相同的元素,可以把列表轉(zhuǎn)為元祖/集合,進行交運算。

import pandas as pd
 
file_path = r'int.xlsx'   # r對路徑進行轉(zhuǎn)義,windows需要
df = pd.read_excel(file_path, header=0, usecols=[3, 4])  # header=0表示第一行是表頭,就自動去除了, 指定讀取第3和4列
i, o = list(df['i']), list(df['o'])
in_links, out_links = [], []
 
a = set(in_links)   # 轉(zhuǎn)成元祖
b = set(out_links)
c = (a & b)  # 集合c和b中都包含了的元素
print(a, '\n', b)
print('兩個列表中相同的元素是:', list(c))

? 解決ValueError: Excel file format cannot be determined, you must specify an engine manually.

報錯:我在使用python的pandas讀取表格的數(shù)據(jù),但是報錯了,

import pandas as pd
 
file_path = 'intersection.xlsx'   # r對路徑進行轉(zhuǎn)義,windows需要
df = pd.read_excel(file_path, header=0, usecols=[0])  # header=0表示第一行是表頭,就自動去除了, 指定讀取第1列
print(df)

問題:問題在于原表格格式可能有些問題。

解決:最直接的辦法就是把表格的內(nèi)容復制到一個自己新建的表格中,然后改成之前表格的路徑,

然后再安裝這個openpyxl第三方庫。

pip install openpyxl

重新運行代碼,

ok,問題解決。

? 解決but no encoding declared; see https://python.org/dev/peps/pep-0263/ for details

報錯

but no encoding declared; see https://python.org/dev/peps/pep-0263/ for details

問題:xxx文件里有中文字符。

解決:在py文件的代碼第一行 加上,

# -*-coding:utf8 -*-

? 解決MatplotlibDeprecationWarning: Support for FigureCanvases without a required_interactive_framework attribute was deprecated in Matplotlib 3.6 and will be removed two minor releases later.

報錯:在使用pandas讀取文件時,顯示錯誤。

MatplotlibDeprecationWarning: Support for FigureCanvases without a required_interactive_framework attribute was deprecated in Matplotlib 3.6 and will be removed two minor releases later.

問題:matplotlib3.2以后就把mpl-data分離出去了 。

解決:卸載原來的版本,安裝3.1版本。

pip uninstall matplotlib  # 卸載原來的版本
pip install matplotlib==3.1.1 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com  # 安裝3.1版本

總結(jié)

到此這篇關(guān)于python使用xlsx和pandas處理Excel表格的文章就介紹到這了,更多相關(guān)python xlsx和pandas處理Excel表格內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python爬蟲之重放攻擊原理實例詳解

    Python爬蟲之重放攻擊原理實例詳解

    重放攻擊是一種網(wǎng)絡(luò)攻擊方式,攻擊者通過截獲合法用戶的請求,并將其重新發(fā)送,以模擬合法用戶的行為,在Python爬蟲領(lǐng)域,了解重放攻擊的原理和防范方法至關(guān)重要,本文將深入介紹重放攻擊的概念、示例代碼演示以及防范措施,幫助大家更好地理解和應對這一威脅
    2023-12-12
  • python通配符之glob模塊的使用詳解

    python通配符之glob模塊的使用詳解

    這篇文章主要介紹了python通配符之glob模塊的使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • 簡單了解python高階函數(shù)map/reduce

    簡單了解python高階函數(shù)map/reduce

    這篇文章主要介紹了簡單了解python高階函數(shù)map/reduce,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-06-06
  • Python數(shù)據(jù)結(jié)構(gòu)與算法之圖的最短路徑(Dijkstra算法)完整實例

    Python數(shù)據(jù)結(jié)構(gòu)與算法之圖的最短路徑(Dijkstra算法)完整實例

    這篇文章主要介紹了Python數(shù)據(jù)結(jié)構(gòu)與算法之圖的最短路徑(Dijkstra算法),結(jié)合完整實例形式分析了Python圖的最短路徑算法相關(guān)原理與實現(xiàn)技巧,需要的朋友可以參考下
    2017-12-12
  • python讀取圖片并修改格式與大小的方法

    python讀取圖片并修改格式與大小的方法

    這篇文章主要為大家詳細介紹了python讀取圖片并修改格式與大小的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-07-07
  • Python應用自動化部署工具Fabric原理及使用解析

    Python應用自動化部署工具Fabric原理及使用解析

    這篇文章主要介紹了Python應用自動化部署工具Fabric原理及使用解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-11-11
  • python中通過selenium簡單操作及元素定位知識點總結(jié)

    python中通過selenium簡單操作及元素定位知識點總結(jié)

    在本篇文章里小編給大家整理的是關(guān)于python中通過selenium簡單操作及元素定位的知識點,有需要的朋友們可以學習下。
    2019-09-09
  • Python編程學習之如何判斷3個數(shù)的大小

    Python編程學習之如何判斷3個數(shù)的大小

    這篇文章主要給大家介紹了關(guān)于Python編程學習之如何判斷3個數(shù)的大小的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用Python具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧
    2019-08-08
  • Python線程同步的實現(xiàn)代碼

    Python線程同步的實現(xiàn)代碼

    本文介紹了threading 模塊提供的線程同步原語包括:Lock、RLock、Condition、Event、Semaphore等對象。對大家的學習具有一定的參考學習價值,需要的朋友可以參考下
    2018-10-10
  • python庫lxml在linux和WIN系統(tǒng)下的安裝

    python庫lxml在linux和WIN系統(tǒng)下的安裝

    這篇內(nèi)容我們給大家分享了lxml在WIN和LINUX系統(tǒng)下的簡單快速安裝過程,有興趣的朋友參考學習下。
    2018-06-06

最新評論