欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python入門之后再看點(diǎn)什么好?

 更新時(shí)間:2018年03月05日 14:54:28   作者:劉志軍  
看完了基礎(chǔ)書,甚至看兩遍了,但自己寫的時(shí)候還是沒(méi)思路,我該怎么辦?這篇文章主要介紹了Python入門之后再看點(diǎn)什么好,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下

不止一次在微信、知乎有讀者朋友跑過(guò)來(lái)問(wèn):看完了基礎(chǔ)書,甚至看兩遍了,但自己寫的時(shí)候還是沒(méi)思路,我該怎么辦?

編程在我看來(lái)就是一門手藝活,絕不是簡(jiǎn)單通過(guò)看書就能學(xué)會(huì)的,跟學(xué)游泳、學(xué)車、學(xué)鋼琴一個(gè)道理,沒(méi)別的,掌握了最基本的理論之后就是干,只有通過(guò)大量的練習(xí)、實(shí)戰(zhàn)才能掌握編程這門技能,之后再回過(guò)來(lái)頭來(lái)繼續(xù)深入理論

這個(gè)問(wèn)題在知識(shí)星球也同樣被問(wèn),于是在那里我們?cè)O(shè)了每日一題的專題,每周會(huì)出三道題給大家,做完之后要求提交到 GitHub,我會(huì)統(tǒng)一對(duì)代碼進(jìn)行 review。這些題一般都是出自于一些真實(shí)應(yīng)用場(chǎng)景,通過(guò)這種方式來(lái)提高編程水平。

下面這道題我們?cè)谛乔蛑械牡谌},在你往下翻之前,不妨梳理下你的編程思路。

題目:

統(tǒng)計(jì)一個(gè)文件中每個(gè)單詞出現(xiàn)的次數(shù),列出出現(xiàn)頻率最多的5個(gè)單詞。

前言:

這道題在實(shí)際應(yīng)用場(chǎng)景中使用比較廣泛,記得哪里看到說(shuō)李笑來(lái)就利用他的編程技能出版過(guò)一本背單詞的暢銷書,統(tǒng)計(jì)歷年來(lái)四六級(jí)、托??荚囍谐霈F(xiàn)的高頻詞匯,學(xué)生根據(jù)詞頻來(lái)記單詞,這種方式深受大家喜歡。這就是一個(gè)把編程技能用來(lái)解決實(shí)際問(wèn)題的典型場(chǎng)景。

所以,哪怕你不是程序員,如果能掌握編程技能的話,也能給你的工作帶來(lái)極大的便利。

另外,在做數(shù)據(jù)分析時(shí),那些詞云效果本質(zhì)上都是基于詞頻統(tǒng)計(jì)來(lái)控制字體的大小,如果你能熟練運(yùn)用Python中的知識(shí)來(lái)解決問(wèn)題的話,那說(shuō)明你真正入門Python了。

分析:

本題主要考察以下幾個(gè)方面的知識(shí)點(diǎn):

1、如何正確讀寫文件

在 Python 中讀寫文件可以使用內(nèi)置函數(shù)open(),而 open 函數(shù)在python2 和 python3 中有一定的區(qū)別,比如 Python 中可以指定讀寫文件的編碼格式,而 Python 則不可以,為了同時(shí)兼容2和3,我們通常會(huì)使用io模塊下面的 open 函數(shù),大家可以查文檔搞清楚它們之間的區(qū)別,培養(yǎng)主動(dòng)學(xué)習(xí)能力和查資料的習(xí)慣。

另外一點(diǎn)是讀寫文件完成之后是需要關(guān)閉文件描述符的,除了可以使用 try...except...finally的語(yǔ)法之后,我們還可以使用更優(yōu)雅的 with … as 的語(yǔ)法來(lái)自動(dòng)關(guān)閉文件。

2、如何對(duì)數(shù)據(jù)進(jìn)行排序

sorted函數(shù)是一個(gè)使用頻率很高的內(nèi)置函數(shù),它的用法也很強(qiáng)大,因?yàn)樗梢酝ㄟ^(guò)指定參數(shù) key 來(lái)進(jìn)行自定義排序,也就意味著你不僅可以對(duì)數(shù)字排序、對(duì)字母排序、還可以對(duì)列表、字典、自定義的對(duì)象進(jìn)行排序,你只需要要告訴 sorted 函數(shù)的排序規(guī)則是什么,比如一個(gè)people對(duì)象,我既可以根據(jù)年齡排序也可以根據(jù)身高體重來(lái)排序,所以這個(gè)函數(shù)時(shí)非常靈活的,另外,對(duì)于列表對(duì)象有自帶的 sort 方法,如果能區(qū)分清楚 list.sort 與 sorted 之間區(qū)別那說(shuō)明你已經(jīng)能靈活運(yùn)用了。

3、匿名函數(shù)的使用

剛說(shuō)了sorted函數(shù)可以指定一個(gè)參數(shù)來(lái)控制排序的規(guī)則,這個(gè)參數(shù)可以是一個(gè)函數(shù),這種場(chǎng)景往往匿名函數(shù),就是我們常說(shuō)的lambda函數(shù)顯得很應(yīng)景。

4、字典類型的運(yùn)用

做詞頻統(tǒng)計(jì),用字典無(wú)疑是最合適的數(shù)據(jù)類型,單詞作為字典的key, 單詞出現(xiàn)的次數(shù)作為字典的 value,很方便地就記錄好了每個(gè)單詞的頻率,字典很像我們的電話本,每個(gè)名字關(guān)聯(lián)一個(gè)電話號(hào)碼。另外,字典最大的特點(diǎn)就是它的查詢速度會(huì)非???。理想情況下時(shí)間復(fù)雜度為O(1),我是說(shuō)理想情況,如果你想深入了解字典的話,建議看看這篇文章。Python中提供了豐富的數(shù)據(jù)結(jié)構(gòu),要懂得根據(jù)應(yīng)用場(chǎng)景正確選擇合適的數(shù)據(jù)類型

5、正則表達(dá)式的運(yùn)用

處理文本、字符串,正則表達(dá)式簡(jiǎn)直是神器,無(wú)論是做數(shù)據(jù)爬蟲還是表單驗(yàn)證使用非常廣泛,當(dāng)然,正則表達(dá)式并不是 Python 特有的東西,所有編程語(yǔ)言都支持,我們除了學(xué)習(xí)正則表達(dá)式的基本規(guī)則之外就是Python中的re模塊提供的各種函數(shù)了,只有熟悉了API 我們才能運(yùn)用到實(shí)際場(chǎng)景中去。關(guān)于正則表達(dá)式推薦一篇文章:Python正則表達(dá)式操作指南

以上5點(diǎn),每個(gè)點(diǎn)都可以整理出一篇文章出來(lái)

實(shí)現(xiàn):

分析完之后,我們實(shí)現(xiàn)起來(lái)其實(shí)是非常快的。所以我們?cè)谀玫揭粋€(gè)需求的時(shí)候,首先肯定是把需求弄清楚,想想大概可以用哪些技術(shù)來(lái)實(shí)現(xiàn),隨后才是動(dòng)手寫代碼,其實(shí)我們?cè)诠ぷ魃?,真正寫代碼的時(shí)間還不到一半。

# -*- coding:utf-8 -*-
import io
import re

class Counter:
 def __init__(self, path):
 """
 :param path: 文件路徑
 """
 self.mapping = dict()
 with io.open(path, encoding="utf-8") as f:
 data = f.read()
 words = [s.lower() for s in re.findall("\w+", data)]
 for word in words:
 self.mapping[word] = self.mapping.get(word, 0) + 1

 def most_common(self, n):
 assert n > 0, "n should be large than 0"
 return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]

if __name__ == '__main__':
 most_common_5 = Counter("importthis.txt").most_common(5)
 for item in most_common_5:
 print(item)
#注:這里的文件是以Python之禪的19條格言保存到文本中進(jìn)行統(tǒng)計(jì)的。

打印結(jié)果:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

總結(jié)

當(dāng)然,實(shí)現(xiàn)方法不是唯一的。比如Python模塊本身就提供了一個(gè)collections.Counter的類,它繼承自dict類,就是用于做統(tǒng)計(jì)的,細(xì)心的你可能發(fā)現(xiàn)了,我實(shí)現(xiàn)的這個(gè)Counter和collections下面那個(gè)Counter很像,其實(shí)這就是造輪子,造輪子可以鍛煉我們的編程思維,當(dāng)然在工作上有現(xiàn)成的東西就沒(méi)必要自己造輪子了,除非你有信心做得更好。你也可以思考假如Python沒(méi)有提供Counter這個(gè)工具,你該怎么做。

另外,該模塊還提供一個(gè)有序的字典對(duì)象 OrderedDict,使用它可以免去我們手動(dòng)排序的操作。對(duì)于上面提及的知識(shí)點(diǎn)你是否都了然于心了,如果回答是的話,恭喜你,我想你應(yīng)該掌握差不多了,進(jìn)階吧,如果你還有很多不清楚的地方,那么需要你更多的總結(jié)、練習(xí)。

來(lái)源:python之禪

你眼中的Python大牛 應(yīng)該都有這份書單

Python書單 不將就

不可錯(cuò)過(guò)的十本Python好書

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python獲取DLL和EXE文件版本號(hào)的方法

    Python獲取DLL和EXE文件版本號(hào)的方法

    這篇文章主要介紹了Python獲取DLL和EXE文件版本號(hào)的方法,實(shí)例分析了Python獲取系統(tǒng)文件信息的技巧,需要的朋友可以參考下
    2015-03-03
  • Windows系統(tǒng)下實(shí)現(xiàn)pycharm運(yùn)行.sh文件(本地運(yùn)行和打開(kāi)服務(wù)器終端)

    Windows系統(tǒng)下實(shí)現(xiàn)pycharm運(yùn)行.sh文件(本地運(yùn)行和打開(kāi)服務(wù)器終端)

    PyCharm是Python開(kāi)發(fā)的高效率IDE,但是很多時(shí)候需要同時(shí)開(kāi)發(fā)Bash(shell)腳本,下面這篇文章主要給大家介紹了關(guān)于Windows系統(tǒng)下實(shí)現(xiàn)pycharm運(yùn)行.sh文件(本地運(yùn)行和打開(kāi)服務(wù)器終端)的相關(guān)資料,需要的朋友可以參考下
    2022-09-09
  • 在python中計(jì)算ssim的方法(與Matlab結(jié)果一致)

    在python中計(jì)算ssim的方法(與Matlab結(jié)果一致)

    這篇文章主要介紹了在python中計(jì)算ssim的方法(與Matlab結(jié)果一致),本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-12-12
  • pycharm創(chuàng)建django項(xiàng)目出現(xiàn)路徑錯(cuò)誤問(wèn)題

    pycharm創(chuàng)建django項(xiàng)目出現(xiàn)路徑錯(cuò)誤問(wèn)題

    在PyCharm中創(chuàng)建Django項(xiàng)目時(shí),若使用之前項(xiàng)目的環(huán)境編譯器,且已修改其根目錄,則新建項(xiàng)目路徑可能出錯(cuò)。解決辦法是在設(shè)置中選擇Project,通過(guò)齒輪圖標(biāo)進(jìn)入Show?All,選擇編譯器路徑,點(diǎn)擊筆形圖修改Development?configuration的Root?path為/,以確保新項(xiàng)目能正確創(chuàng)建
    2024-09-09
  • 使用Tkinter制作信息提示框

    使用Tkinter制作信息提示框

    這篇文章主要介紹了使用Tkinter制作信息提示框的相關(guān)資料,需要的朋友可以參考下
    2020-02-02
  • Python下線程之間的共享和釋放示例

    Python下線程之間的共享和釋放示例

    這篇文章主要用示例簡(jiǎn)單介紹了Python下線程之間的共享和釋放,線程一直是Python開(kāi)發(fā)者中的熱點(diǎn)問(wèn)題,需要的朋友可以參考下
    2015-05-05
  • Python 反轉(zhuǎn)字符串(reverse)的方法小結(jié)

    Python 反轉(zhuǎn)字符串(reverse)的方法小結(jié)

    這篇文章主要介紹了Python 反轉(zhuǎn)字符串(reverse)的方法小結(jié),需要的朋友可以參考下
    2018-02-02
  • Python使用MD5加密字符串示例

    Python使用MD5加密字符串示例

    這篇文章主要介紹了Python使用MD5加密字符串示例,對(duì)一些可能出現(xiàn)的錯(cuò)誤點(diǎn)上本文也給出提醒,需要的朋友可以參考下
    2014-08-08
  • python imutils包基本概念及使用

    python imutils包基本概念及使用

    python imutils包可以很簡(jiǎn)潔的調(diào)用opencv接口,輕松實(shí)現(xiàn)圖像的平移,旋轉(zhuǎn),縮放,骨架化等操作,對(duì)python imutils包基本概念及使用方法感興趣的朋友一起看看吧
    2021-07-07
  • 使用Pandas計(jì)算系統(tǒng)客戶名稱的相似度

    使用Pandas計(jì)算系統(tǒng)客戶名稱的相似度

    在日常業(yè)務(wù)處理中,我們經(jīng)常會(huì)面臨將不同系統(tǒng)中的數(shù)據(jù)進(jìn)行匹配和比對(duì)的情況,本文將介紹如何使用Python的Pandas庫(kù)來(lái)處理這個(gè)問(wèn)題,需要的可以參考一下
    2023-07-07

最新評(píng)論