欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python數(shù)據(jù)處理的三個(gè)實(shí)用技巧分享

 更新時(shí)間:2022年04月01日 11:45:01   作者:Python學(xué)習(xí)與數(shù)據(jù)挖掘  
數(shù)據(jù)處理無(wú)所不在,掌握常用技巧,事半功倍。這篇文章將使用Pandas開(kāi)展數(shù)據(jù)處理分析,總結(jié)其中常用、好用的數(shù)據(jù)分析技巧,感興趣的可以學(xué)習(xí)一下

我使用的 Pandas 版本如下,順便也導(dǎo)入 Pandas 庫(kù)。

>>> import pandas as pd
>>> pd.__version__
'0.25.1'

在開(kāi)始前先確保解釋器和數(shù)據(jù)集在同一目錄下:

>>> import os
>>> os.chdir('D://source/dataset') # 這是我的數(shù)據(jù)集所在目錄
>>> os.listdir() # 確認(rèn)此目錄已經(jīng)存在 IMDB-Movie-Data 數(shù)據(jù)集
['drinksbycountry.csv', 'IMDB-Movie-Data.csv', 'movietweetings', 'titanic_eda_data.csv', 'titanic_train_data.csv']

準(zhǔn)備工作就位后,正式開(kāi)始數(shù)據(jù)處理技巧之旅。

1 Pandas 移除某列

導(dǎo)入數(shù)據(jù)

>>> df = pd.read_csv("IMDB-Movie-Data.csv")
>>> df.head(1) # 導(dǎo)入并顯示第一行
? ?Rank ? ? ? ? ? ? ? ? ? ?Title ? ? ? ? ? ? ? ? ? ?Genre ?... ? Votes Revenue (Millions) Metascore
0 ? ? 1 ?Guardians of the Galaxy ?Action,Adventure,Sci-Fi ?... ?757074 ? ? ? ? ? ? 333.13 ? ? ?76.0

[1 rows x 12 columns]

使用 pop 方法移除指定列:

>>> meta = df.pop("Title").to_frame() # 移除 Title 列

確認(rèn)是否已被移除:

>>> df.head(1) # df 變?yōu)?11列
? ?Rank ? ? ? ? ? ? ? ? ? ?Genre ?... Revenue (Millions) Metascore
0 ? ? 1 ?Action,Adventure,Sci-Fi ?... ? ? ? ? ? ? 333.13 ? ? ?76.0

[1 rows x 11 columns]

2 統(tǒng)計(jì)標(biāo)題單詞數(shù)

pop 后得到 meta,顯示 meta 前 3 行:

>>> meta.head(3)
                     Title
0  Guardians of the Galaxy
1               Prometheus
2                    Split

標(biāo)題是由單詞組成,中間用空格分隔。

# .str.count(" ") + 1 得到單詞個(gè)數(shù) 
>>> meta["words_count"] = meta["Title"].str.count(" ") + 1 
>>> meta.head(3) # words_count 列代表單詞個(gè)數(shù)
                     Title  words_count
0  Guardians of the Galaxy            4
1               Prometheus            1
2                    Split            1

3 Genre 頻次統(tǒng)計(jì)

下面統(tǒng)計(jì)電影 Genre 的頻次,

>>> vc = df["Genre"].value_counts()

下面顯示電影 Genre 的 Top5 ,最高頻為出現(xiàn) 50 次的 Action,Adventure,Sci-Fi 類(lèi),次之為 48 次的 Drama 類(lèi):

>>> vc.head()
Action,Adventure,Sci-Fi    50
Drama                      48
Comedy,Drama,Romance       35
Comedy                     32
Drama,Romance              31
Name: Genre, dtype: int64

展示 Top5 的餅狀圖:

>>> import matplotlib.pyplot as plt
>>> vc[:5].plot(kind='pie')
<matplotlib.axes._subplots.AxesSubplot object at 0x000001D65B114948>
>>> plt.show()

到此這篇關(guān)于Python數(shù)據(jù)處理的三個(gè)實(shí)用技巧分享的文章就介紹到這了,更多相關(guān)Python 數(shù)據(jù)處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 怎么使用pipenv管理你的python項(xiàng)目

    怎么使用pipenv管理你的python項(xiàng)目

    本篇文章主要介紹了怎么使用pipenv管理你的python項(xiàng)目,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2018-03-03
  • Python中用startswith()函數(shù)判斷字符串開(kāi)頭的教程

    Python中用startswith()函數(shù)判斷字符串開(kāi)頭的教程

    這篇文章主要介紹了Python中用startswith()函數(shù)判斷字符串開(kāi)頭的教程,startswith()函數(shù)的使用是Python學(xué)習(xí)中的基礎(chǔ)知識(shí),本文列舉了一些不同情況下的使用結(jié)果,需要的朋友可以參考下
    2015-04-04
  • 解決windows下命令行執(zhí)行python3失效,會(huì)打開(kāi)應(yīng)用商店問(wèn)題

    解決windows下命令行執(zhí)行python3失效,會(huì)打開(kāi)應(yīng)用商店問(wèn)題

    這篇文章主要介紹了解決windows下命令行執(zhí)行python3失效,會(huì)打開(kāi)應(yīng)用商店問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • Random 在 Python 中的使用方法

    Random 在 Python 中的使用方法

    random() 方法返回隨機(jī)生成的一個(gè)實(shí)數(shù),它在[0,1)范圍內(nèi)。這篇文章主要介紹了Random 在 Python 中的使用方法,需要的朋友可以參考下
    2018-08-08
  • Python?return函數(shù)返回值類(lèi)型和幫助函數(shù)使用教程

    Python?return函數(shù)返回值類(lèi)型和幫助函數(shù)使用教程

    這篇文章主要為大家介紹了Python?return函數(shù)返回值類(lèi)型和幫助函數(shù)使用教程詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-06-06
  • 用Python實(shí)現(xiàn)流星雨效果的方法詳解

    用Python實(shí)現(xiàn)流星雨效果的方法詳解

    這篇文章主要為大家介紹了Python實(shí)現(xiàn)流星雨效果的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助<BR>
    2021-12-12
  • Python實(shí)現(xiàn)監(jiān)視程序的內(nèi)存使用情況

    Python實(shí)現(xiàn)監(jiān)視程序的內(nèi)存使用情況

    我們使用Python和它的數(shù)據(jù)處理庫(kù)套件進(jìn)行大量數(shù)據(jù)處理時(shí)候,可能使用了大量的計(jì)算資源,那么如何監(jiān)視程序的內(nèi)存使用情況就顯得尤為重要,下面我們就來(lái)了解一下具體實(shí)現(xiàn)方法吧
    2023-12-12
  • Django如何實(shí)現(xiàn)內(nèi)容緩存示例詳解

    Django如何實(shí)現(xiàn)內(nèi)容緩存示例詳解

    緩存對(duì)于大家來(lái)說(shuō)應(yīng)該都不陌生,下面這篇文章主要給大家介紹了關(guān)于Django如何實(shí)現(xiàn)內(nèi)容緩存的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。
    2017-09-09
  • python實(shí)現(xiàn)自動(dòng)網(wǎng)頁(yè)截圖并裁剪圖片

    python實(shí)現(xiàn)自動(dòng)網(wǎng)頁(yè)截圖并裁剪圖片

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)自動(dòng)網(wǎng)頁(yè)截圖并裁剪圖片,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-07-07
  • Python集合基本概念與相關(guān)操作實(shí)例分析

    Python集合基本概念與相關(guān)操作實(shí)例分析

    這篇文章主要介紹了Python集合基本概念與相關(guān)操作,結(jié)合實(shí)例形式分析了Python集合的功能、原理、基本使用方法及操作注意事項(xiàng),需要的朋友可以參考下
    2019-10-10

最新評(píng)論