欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python從csv文件中讀取數(shù)據(jù)及提取數(shù)據(jù)的方法

 更新時間:2021年11月04日 16:37:38   作者:施施吖  
這篇文章主要介紹了Python從csv文件中讀取數(shù)據(jù)并提取數(shù)據(jù)的方法,文中通過多種方法給大家講解獲取指定列的數(shù)據(jù),并存入一個數(shù)組中,每種方法通過實例代碼給大家介紹的非常詳細,需要的朋友參考下吧

數(shù)據(jù)保存在csv文件中

在這里插入圖片描述

1.從csv文件中讀取數(shù)據(jù)

參數(shù)header=None的有無

(1)沒有header=None——直接將csv表中的第一行當作表頭

# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv")
print(data)

打印結果為:

在這里插入圖片描述

(2)有header=None——自動添加第一行當作表頭

# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv",header=None)
print(data)

打印結果為:

在這里插入圖片描述

2.數(shù)據(jù)切割

(這里根據(jù)csv表的格式,將header=None不寫)

(1)獲取所有列,并存入一個數(shù)組中

# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv")
# print(data)
# ①獲取所有列,并存入一個數(shù)組中
import numpy as np
data = np.array(data)
print(data) # 用戶編號  性別  年齡(歲)  年收入(元)  是否購買
# [[15624510        1       19    19000        0]
#  [15810944        1       35    20000        0]
#  [15668575        2       26    43000        0]
#  [15603246        2       27    57000        0]
#  [  ...          ...      ...    ...       ...]]

(2)獲取指定列的數(shù)據(jù),并存入一個數(shù)組中
方法一:從csv文件獲取data,data[ ] ——需要考慮數(shù)據(jù)的維度問題

# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv")
print(data) # 用戶編號  性別  年齡(歲)  年收入(元)  是否購買
# (1)獲取第1列,并存入一個數(shù)組中
import numpy as np
col_1 = data["用戶編號"]  #獲取一列,用一維數(shù)據(jù)
data_1 = np.array(col_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
#  15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
#  15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
#  15705113 15631159 15792818 15633531 15744529]

# (2)獲取第1,2列
col_12 = data[["用戶編號","性別"]]  #獲取兩列,要用二維數(shù)據(jù)
data_12 = np.array(col_12)
print(data_12)
# [[15624510        1]
#  [15810944        1]
#  [15668575        2]
#  [15603246        2]
#  [  ...          ..]]

方法二:usecols=[ ] —— 直接寫入獲取的列數(shù)

import pandas as pd
import numpy as np
data_1 = pd.read_csv("data1.csv",usecols=["用戶編號"])
data_1 = np.array(data_1)
print(data_1)
# [[15624510]
#  [15810944]
#  [15668575]
#  [15603246]
#  [  ...   ]]

# (2)如獲取第1,2列
data_12 = pd.read_csv("data1.csv",usecols=["用戶編號","性別"])
data_12 = np.array(data_12)
print(data_12)
# [[15624510        1]
#  [15810944        1]
#  [15668575        2]
#  [15603246        2]
#  [  ...          ..]]

方法三:iloc[ ] ——實質(zhì)就是切片操作

import pandas as pd
import numpy as np
data = pd.read_csv("data1.csv")
# (1)獲取第1列
data_1 = data.iloc[:,0]
data_1 =np.array(data_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
#  15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
#  15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
#  15705113 15631159 15792818 15633531 15744529]

# (2)獲取第1,2列
data_12 = data.iloc[:,0:2]
data_12 = np.array(data_12)
print(data_12)
# [[15624510        1]
#  [15810944        1]
#  [15668575        2]
#  [15603246        2]
#  [  ...          ..]]

# 獲取最后兩列
data_last = data.iloc[:,-2:]
data_last = np.array(data_last)
print(data_last)
# [[ 19000        0]
#  [ 20000        0]
#  [ 26    43000        0]
#  [ 27    57000        0]
#  [ ...    ...       ...]]

到此這篇關于Python從csv文件中讀取數(shù)據(jù)并提取數(shù)據(jù)的方法的文章就介紹到這了,更多相關Python csv文件中讀取數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • python中time模塊指定格式時間字符串轉(zhuǎn)為時間戳

    python中time模塊指定格式時間字符串轉(zhuǎn)為時間戳

    本文主要介紹了python中time模塊指定格式時間字符串轉(zhuǎn)為時間戳,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-02-02
  • Python中super()的理解以及應用場景實例

    Python中super()的理解以及應用場景實例

    在python中關于類的定義可以分為兩種:老式類&新式類,在新式類中有這么一種方法super( ),下面這篇文章主要給大家介紹了關于Python中super()的理解以及應用場景的相關資料,需要的朋友可以參考下
    2021-09-09
  • Python捕獲異常堆棧信息的幾種方法(小結)

    Python捕獲異常堆棧信息的幾種方法(小結)

    這篇文章主要介紹了Python捕獲異常堆棧信息的幾種方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-05-05
  • PySpark和RDD對象最新詳解

    PySpark和RDD對象最新詳解

    Spark是一款分布式的計算框架,用于調(diào)度成百上千的服務器集群,計算TB、PB乃至EB級別的海量數(shù)據(jù),PySpark是由Spark官方開發(fā)的Python語言第三方庫,本文重點介紹PySpark和RDD對象,感興趣的朋友一起看看吧
    2023-01-01
  • Python實戰(zhàn)之利用Geopandas算出每個省面積

    Python實戰(zhàn)之利用Geopandas算出每個省面積

    GeoPandas是一個基于pandas,針對地理數(shù)據(jù)做了特別支持的第三方模塊。本文將利用GeoPandas計算出每個省的面積,感興趣的小伙伴快跟隨小編一起學習一下吧
    2021-12-12
  • django xadmin action兼容自定義model權限教程

    django xadmin action兼容自定義model權限教程

    這篇文章主要介紹了django xadmin action兼容自定義model權限教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • Python Thread虛假喚醒概念與防范詳解

    Python Thread虛假喚醒概念與防范詳解

    這篇文章主要介紹了Python Thread虛假喚醒概念與防范,虛假喚醒是一種現(xiàn)象,它只會出現(xiàn)在多線程環(huán)境中,指的是在多線程環(huán)境下,多個線程等待在同一個條件上,等到條件滿足時,所有等待的線程都被喚醒,但由于多個線程執(zhí)行的順序不同
    2023-02-02
  • Python xlrd excel文件操作代碼實例

    Python xlrd excel文件操作代碼實例

    這篇文章主要介紹了Python xlrd excel文件操作代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-03-03
  • Django 中間鍵和上下文處理器的使用

    Django 中間鍵和上下文處理器的使用

    這篇文章主要介紹了Django 中間鍵和上下文處理器的使用,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2019-03-03
  • python魔法方法之__setattr__()

    python魔法方法之__setattr__()

    這篇文章主要介紹了python魔法方法之__setattr__(),python提供了諸多的魔法方法,其中__setattr__()方法主要用于類實例進行屬性賦值,接下來請和小編一起進入文章來了解更多相關內(nèi)容吧
    2022-03-03

最新評論