Python語言進(jìn)階知識點(diǎn)總結(jié)
數(shù)據(jù)結(jié)構(gòu)和算法
算法:解決問題的方法和步驟
評價(jià)算法的好壞:漸近時(shí)間復(fù)雜度和漸近空間復(fù)雜度。
漸近時(shí)間復(fù)雜度的大O標(biāo)記:
- 常量時(shí)間復(fù)雜度 - 布隆過濾器 / 哈希存儲
- 對數(shù)時(shí)間復(fù)雜度 - 折半查找(二分查找)
- 線性時(shí)間復(fù)雜度 - 順序查找 / 桶排序
- 對數(shù)線性時(shí)間復(fù)雜度 - 高級排序算法(歸并排序、快速排序)
- 平方時(shí)間復(fù)雜度 - 簡單排序算法(選擇排序、插入排序、冒泡排序)
- 立方時(shí)間復(fù)雜度 - Floyd算法 / 矩陣乘法運(yùn)算
- 幾何級數(shù)時(shí)間復(fù)雜度 - 漢諾塔
- 階乘時(shí)間復(fù)雜度 - 旅行經(jīng)銷商問題 - NP
排序算法(選擇、冒泡和歸并)和查找算法(順序和折半)
def select_sort(origin_items, comp=lambda x, y: x < y): """簡單選擇排序""" items = origin_items[:] for i in range(len(items) - 1): min_index = i for j in range(i + 1, len(items)): if comp(items[j], items[min_index]): min_index = j items[i], items[min_index] = items[min_index], items[i] return items def bubble_sort(origin_items, comp=lambda x, y: x > y): """高質(zhì)量冒泡排序(攪拌排序)""" items = origin_items[:] for i in range(len(items) - 1): swapped = False for j in range(i, len(items) - 1 - i): if comp(items[j], items[j + 1]): items[j], items[j + 1] = items[j + 1], items[j] swapped = True if swapped: swapped = False for j in range(len(items) - 2 - i, i, -1): if comp(items[j - 1], items[j]): items[j], items[j - 1] = items[j - 1], items[j] swapped = True if not swapped: break return items def merge_sort(items, comp=lambda x, y: x <= y): """歸并排序(分治法)""" if len(items) < 2: return items[:] mid = len(items) // 2 left = merge_sort(items[:mid], comp) right = merge_sort(items[mid:], comp) return merge(left, right, comp) def merge(items1, items2, comp): """合并(將兩個(gè)有序的列表合并成一個(gè)有序的列表)""" items = [] index, index2 = 0, 0 while index1 < len(items1) and index2 < len(items2): if comp(items1[index1], items2[index2]): items.append(items1[index1]) index1 += 1 else: items.append(items2[index2]) index2 += 1 items += items1[index1:] items += items2[index2:] return items def seq_search(items, key): """順序查找""" for index, item in enumerate(items): if item == key: return index return -1 def bin_search(items, key): """折半查找""" start, end = 0, len(items) - 1 while start <= end: mid = (start + end) // 2 if key > items[mid]: start = mid + 1 elif key < items[mid]: end = mid - 1 else: return mid return -1
使用生成式(推導(dǎo)式)語法
prices = { 'AAPL': 191.88, 'GOOG': 1186.96, 'IBM': 149.24, 'ORCL': 48.44, 'ACN': 166.89, 'FB': 208.09, 'SYMC': 21.29 } # 用股票價(jià)格大于100元的股票構(gòu)造一個(gè)新的字典 prices2 = {key: value for key, value in prices.items() if value > 100} print(prices2)
說明:生成式(推導(dǎo)式)可以用來生成列表、集合和字典。
嵌套的列表
names = ['關(guān)羽', '張飛', '趙云', '馬超', '黃忠'] courses = ['語文', '數(shù)學(xué)', '英語'] # 錄入五個(gè)學(xué)生三門課程的成績 # 錯(cuò)誤 - 參考http://pythontutor.com/visualize.html#mode=edit # scores = [[None] * len(courses)] * len(names) scores = [[None] * len(courses) for _ in range(len(names))] for row, name in enumerate(names): for col, course in enumerate(courses): scores[row][col] = float(input(f'請輸入{name}的{course}成績: ')) print(scores)
Python Tutor - VISUALIZE CODE AND GET LIVE HELP
heapq、itertools等的用法
""" 從列表中找出最大的或最小的N個(gè)元素 堆結(jié)構(gòu)(大根堆/小根堆) """ import heapq list1 = [34, 25, 12, 99, 87, 63, 58, 78, 88, 92] list2 = [ {'name': 'IBM', 'shares': 100, 'price': 91.1}, {'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}, {'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'ACME', 'shares': 75, 'price': 115.65} ] print(heapq.nlargest(3, list1)) print(heapq.nsmallest(3, list1)) print(heapq.nlargest(2, list2, key=lambda x: x['price'])) print(heapq.nlargest(2, list2, key=lambda x: x['shares'])) """ 迭代工具 - 排列 / 組合 / 笛卡爾積 """ import itertools itertools.permutations('ABCD') itertools.combinations('ABCDE', 3) itertools.product('ABCD', '123')
collections模塊下的工具類
""" 找出序列中出現(xiàn)次數(shù)最多的元素 """ from collections import Counter words = [ 'look', 'into', 'my', 'eyes', 'look', 'into', 'my', 'eyes', 'the', 'eyes', 'the', 'eyes', 'the', 'eyes', 'not', 'around', 'the', 'eyes', "don't", 'look', 'around', 'the', 'eyes', 'look', 'into', 'my', 'eyes', "you're", 'under' ] counter = Counter(words) print(counter.most_common(3))
常用算法:
- 窮舉法 - 又稱為暴力破解法,對所有的可能性進(jìn)行驗(yàn)證,直到找到正確答案。
- 貪婪法 - 在對問題求解時(shí),總是做出在當(dāng)前看來是最好的選擇,不追求最優(yōu)解,快速找到滿意解。
- 分治法 - 把一個(gè)復(fù)雜的問題分成兩個(gè)或更多的相同或相似的子問題,再把子問題分成更小的子問題,直到可以直接求解的程度,最后將子問題的解進(jìn)行合并得到原問題的解。
- 回溯法 - 回溯法又稱為試探法,按選優(yōu)條件向前搜索,當(dāng)搜索到某一步發(fā)現(xiàn)原先選擇并不優(yōu)或達(dá)不到目標(biāo)時(shí),就退回一步重新選擇。
- 動(dòng)態(tài)規(guī)劃 - 基本思想也是將待求解問題分解成若干個(gè)子問題,先求解并保存這些子問題的解,避免產(chǎn)生大量的重復(fù)運(yùn)算。
窮舉法例子:百錢百雞和五人分魚。
# 公雞5元一只 母雞3元一只 小雞1元三只 # 用100元買100只雞 問公雞/母雞/小雞各多少只 for x in range(20): for y in range(33): z = 100 - x - y if 5 * x + 3 * y + z // 3 == 100 and z % 3 == 0: print(x, y, z) # A、B、C、D、E五人在某天夜里合伙捕魚 最后疲憊不堪各自睡覺 # 第二天A第一個(gè)醒來 他將魚分為5份 扔掉多余的1條 拿走自己的一份 # B第二個(gè)醒來 也將魚分為5份 扔掉多余的1條 拿走自己的一份 # 然后C、D、E依次醒來也按同樣的方式分魚 問他們至少捕了多少條魚 fish = 1 while True: total = fish enough = True for _ in range(5): if (total - 1) % 5 == 0: total = (total - 1) // 5 * 4 else: enough = False break if enough: print(fish) break fish += 1
貪婪法例子:假設(shè)小偷有一個(gè)背包,最多能裝20公斤贓物,他闖入一戶人家,發(fā)現(xiàn)如下表所示的物品。很顯然,他不能把所有物品都裝進(jìn)背包,所以必須確定拿走哪些物品,留下哪些物品。
名稱 | 價(jià)格(美元) | 重量(kg) |
---|---|---|
電腦 | 200 | 20 |
收音機(jī) | 20 | 4 |
鐘 | 175 | 10 |
花瓶 | 50 | 2 |
書 | 10 | 1 |
油畫 | 90 | 9 |
""" 貪婪法:在對問題求解時(shí),總是做出在當(dāng)前看來是最好的選擇,不追求最優(yōu)解,快速找到滿意解。 輸入: 20 6 電腦 200 20 收音機(jī) 20 4 鐘 175 10 花瓶 50 2 書 10 1 油畫 90 9 """ class Thing(object): """物品""" def __init__(self, name, price, weight): self.name = name self.price = price self.weight = weight @property def value(self): """價(jià)格重量比""" return self.price / self.weight def input_thing(): """輸入物品信息""" name_str, price_str, weight_str = input().split() return name_str, int(price_str), int(weight_str) def main(): """主函數(shù)""" max_weight, num_of_things = map(int, input().split()) all_things = [] for _ in range(num_of_things): all_things.append(Thing(*input_thing())) all_things.sort(key=lambda x: x.value, reverse=True) total_weight = 0 total_price = 0 for thing in all_things: if total_weight + thing.weight <= max_weight: print(f'小偷拿走了{(lán)thing.name}') total_weight += thing.weight total_price += thing.price print(f'總價(jià)值: {total_price}美元') if __name__ == '__main__': main()
分治法例子:快速排序。
""" 快速排序 - 選擇樞軸對元素進(jìn)行劃分,左邊都比樞軸小右邊都比樞軸大 """ def quick_sort(origin_items, comp=lambda x, y: x <= y): items = origin_items[:] _quick_sort(items, 0, len(items) - 1, comp) return items def _quick_sort(items, start, end, comp): if start < end: pos = _partition(items, start, end, comp) _quick_sort(items, start, pos - 1, comp) _quick_sort(items, pos + 1, end, comp) def _partition(items, start, end, comp): pivot = items[end] i = start - 1 for j in range(start, end): if comp(items[j], pivot): i += 1 items[i], items[j] = items[j], items[i] items[i + 1], items[end] = items[end], items[i + 1] return i + 1
回溯法例子:騎士巡邏。
""" 遞歸回溯法:叫稱為試探法,按選優(yōu)條件向前搜索,當(dāng)搜索到某一步,發(fā)現(xiàn)原先選擇并不優(yōu)或達(dá)不到目標(biāo)時(shí),就退回一步重新選擇,比較經(jīng)典的問題包括騎士巡邏、八皇后和迷宮尋路等。 """ import sys import time SIZE = 5 total = 0 def print_board(board): for row in board: for col in row: print(str(col).center(4), end='') print() def patrol(board, row, col, step=1): if row >= 0 and row < SIZE and \ col >= 0 and col < SIZE and \ board[row][col] == 0: board[row][col] = step if step == SIZE * SIZE: global total total += 1 print(f'第{total}種走法: ') print_board(board) patrol(board, row - 2, col - 1, step + 1) patrol(board, row - 1, col - 2, step + 1) patrol(board, row + 1, col - 2, step + 1) patrol(board, row + 2, col - 1, step + 1) patrol(board, row + 2, col + 1, step + 1) patrol(board, row + 1, col + 2, step + 1) patrol(board, row - 1, col + 2, step + 1) patrol(board, row - 2, col + 1, step + 1) board[row][col] = 0 def main(): board = [[0] * SIZE for _ in range(SIZE)] patrol(board, SIZE - 1, SIZE - 1) if __name__ == '__main__': main()
動(dòng)態(tài)規(guī)劃例子1:斐波拉切數(shù)列。(不使用動(dòng)態(tài)規(guī)劃將會是幾何級數(shù)復(fù)雜度)
""" 動(dòng)態(tài)規(guī)劃 - 適用于有重疊子問題和最優(yōu)子結(jié)構(gòu)性質(zhì)的問題 使用動(dòng)態(tài)規(guī)劃方法所耗時(shí)間往往遠(yuǎn)少于樸素解法(用空間換取時(shí)間) """ def fib(num, temp={}): """用遞歸計(jì)算Fibonacci數(shù)""" if num in (1, 2): return 1 try: return temp[num] except KeyError: temp[num] = fib(num - 1) + fib(num - 2) return temp[num]
動(dòng)態(tài)規(guī)劃例子2:子列表元素之和的最大值。(使用動(dòng)態(tài)規(guī)劃可以避免二重循環(huán))
說明:子列表指的是列表中索引(下標(biāo))連續(xù)的元素構(gòu)成的列表;列表中的元素是int類型,可能包含正整數(shù)、0、負(fù)整數(shù);程序輸入列表中的元素,輸出子列表元素求和的最大值,例如:
輸入:1 -2 3 5 -3 2
輸出:8
輸入:0 -2 3 5 -1 2
輸出:9
輸入:-9 -2 -3 -5 -3
輸出:-2
def main(): items = list(map(int, input().split())) size = len(items) overall, partial = {}, {} overall[size - 1] = partial[size - 1] = items[size - 1] for i in range(size - 2, -1, -1): partial[i] = max(items[i], partial[i + 1] + items[i]) overall[i] = max(partial[i], overall[i + 1]) print(overall[0]) if __name__ == '__main__': main()
函數(shù)的使用方式
將函數(shù)視為“一等公民”
函數(shù)可以賦值給變量
函數(shù)可以作為函數(shù)的參數(shù)
函數(shù)可以作為函數(shù)的返回值
高階函數(shù)的用法(filter、map以及它們的替代品)
items1 = list(map(lambda x: x ** 2, filter(lambda x: x % 2, range(1, 10)))) items2 = [x ** 2 for x in range(1, 10) if x % 2]
位置參數(shù)、可變參數(shù)、關(guān)鍵字參數(shù)、命名關(guān)鍵字參數(shù)
參數(shù)的元信息(代碼可讀性問題)
匿名函數(shù)和內(nèi)聯(lián)函數(shù)的用法(lambda函數(shù))
閉包和作用域問題
Python搜索變量的LEGB順序(Local --> Embedded --> Global --> Built-in)
global和nonlocal關(guān)鍵字的作用
global:聲明或定義全局變量(要么直接使用現(xiàn)有的全局作用域的變量,要么定義一個(gè)變量放到全局作用域)。
nonlocal:聲明使用嵌套作用域的變量(嵌套作用域必須存在該變量,否則報(bào)錯(cuò))。
裝飾器函數(shù)(使用裝飾器和取消裝飾器)
例子:輸出函數(shù)執(zhí)行時(shí)間的裝飾器。
def record_time(func): """自定義裝飾函數(shù)的裝飾器""" @wraps(func) def wrapper(*args, **kwargs): start = time() result = func(*args, **kwargs) print(f'{func.__name__}: {time() - start}秒') return result return wrapper
如果裝飾器不希望跟print函數(shù)耦合,可以編寫帶參數(shù)的裝飾器。
from functools import wraps from time import time def record(output): """自定義帶參數(shù)的裝飾器""" def decorate(func): @wraps(func) def wrapper(*args, **kwargs): start = time() result = func(*args, **kwargs) output(func.__name__, time() - start) return result return wrapper return decorate from functools import wraps from time import time class Record(): """自定義裝飾器類(通過__call__魔術(shù)方法使得對象可以當(dāng)成函數(shù)調(diào)用)""" def __init__(self, output): self.output = output def __call__(self, func): @wraps(func) def wrapper(*args, **kwargs): start = time() result = func(*args, **kwargs) self.output(func.__name__, time() - start) return result return wrapper
說明:由于對帶裝飾功能的函數(shù)添加了@wraps裝飾器,可以通過func.__wrapped__方式獲得被裝飾之前的函數(shù)或類來取消裝飾器的作用。
例子:用裝飾器來實(shí)現(xiàn)單例模式。
from functools import wraps def singleton(cls): """裝飾類的裝飾器""" instances = {} @wraps(cls) def wrapper(*args, **kwargs): if cls not in instances: instances[cls] = cls(*args, **kwargs) return instances[cls] return wrapper @singleton class President(): """總統(tǒng)(單例類)""" pass
說明:上面的代碼中用到了閉包(closure),不知道你是否已經(jīng)意識到了。還沒有一個(gè)小問題就是,上面的代碼并沒有實(shí)現(xiàn)線程安全的單例,如果要實(shí)現(xiàn)線程安全的單例應(yīng)該怎么做呢?
from functools import wraps from threading import Lock def singleton(cls): """線程安全的單例裝飾器""" instances = {} locker = Lock() @wraps(cls) def wrapper(*args, **kwargs): if cls not in instances: with locker: if cls not in instances: instances[cls] = cls(*args, **kwargs) return instances[cls] return wrapper
面向?qū)ο笙嚓P(guān)知識
三大支柱:封裝、繼承、多態(tài)
例子:工資結(jié)算系統(tǒng)。
""" 月薪結(jié)算系統(tǒng) - 部門經(jīng)理每月15000 程序員每小時(shí)200 銷售員1800底薪加銷售額5%提成 """ from abc import ABCMeta, abstractmethod class Employee(metaclass=ABCMeta): """員工(抽象類)""" def __init__(self, name): self.name = name @abstractmethod def get_salary(self): """結(jié)算月薪(抽象方法)""" pass class Manager(Employee): """部門經(jīng)理""" def get_salary(self): return 15000.0 class Programmer(Employee): """程序員""" def __init__(self, name, working_hour=0): self.working_hour = working_hour super().__init__(name) def get_salary(self): return 200.0 * self.working_hour class Salesman(Employee): """銷售員""" def __init__(self, name, sales=0.0): self.sales = sales super().__init__(name) def get_salary(self): return 1800.0 + self.sales * 0.05 class EmployeeFactory(): """創(chuàng)建員工的工廠(工廠模式 - 通過工廠實(shí)現(xiàn)對象使用者和對象之間的解耦合)""" @staticmethod def create(emp_type, *args, **kwargs): """創(chuàng)建員工""" emp_type = emp_type.upper() emp = None if emp_type == 'M': emp = Manager(*args, **kwargs) elif emp_type == 'P': emp = Programmer(*args, **kwargs) elif emp_type == 'S': emp = Salesman(*args, **kwargs) return emp def main(): """主函數(shù)""" emps = [ EmployeeFactory.create('M', '曹操'), EmployeeFactory.create('P', '荀彧', 120), EmployeeFactory.create('P', '郭嘉', 85), EmployeeFactory.create('S', '典韋', 123000), ] for emp in emps: print('%s: %.2f元' % (emp.name, emp.get_salary())) if __name__ == '__main__': main()
類與類之間的關(guān)系
is-a關(guān)系:繼承
has-a關(guān)系:關(guān)聯(lián) / 聚合 / 合成
use-a關(guān)系:依賴
例子:撲克游戲。
""" 經(jīng)驗(yàn):符號常量總是優(yōu)于字面常量,枚舉類型是定義符號常量的最佳選擇 """ from enum import Enum, unique import random @unique class Suite(Enum): """花色""" SPADE, HEART, CLUB, DIAMOND = range(4) def __lt__(self, other): return self.value < other.value class Card(): """牌""" def __init__(self, suite, face): """初始化方法""" self.suite = suite self.face = face def show(self): """顯示牌面""" suites = ['♠️', '♥️', '♣️', '♦️'] faces = ['', 'A', '2', '3', '4', '5', '6', '7', '8', '9', '10', 'J', 'Q', 'K'] return f'{suites[self.suite.value]} {faces[self.face]}' def __str__(self): return self.show() def __repr__(self): return self.show() class Poker(): """撲克""" def __init__(self): self.index = 0 self.cards = [Card(suite, face) for suite in Suite for face in range(1, 14)] def shuffle(self): """洗牌(隨機(jī)亂序)""" random.shuffle(self.cards) self.index = 0 def deal(self): """發(fā)牌""" card = self.cards[self.index] self.index += 1 return card @property def has_more(self): return self.index < len(self.cards) class Player(): """玩家""" def __init__(self, name): self.name = name self.cards = [] def get_one(self, card): """摸一張牌""" self.cards.append(card) def sort(self, comp=lambda card: (card.suite, card.face)): """整理手上的牌""" self.cards.sort(key=comp) def main(): """主函數(shù)""" poker = Poker() poker.shuffle() players = [Player('東邪'), Player('西毒'), Player('南帝'), Player('北丐')] while poker.has_more: for player in players: player.get_one(poker.deal()) for player in players: player.sort() print(player.name, end=': ') print(player.cards) if __name__ == '__main__': main()
對象的復(fù)制(深復(fù)制/深拷貝/深度克隆和淺復(fù)制/淺拷貝/影子克?。?/p>
垃圾回收、循環(huán)引用和弱引用
Python使用了自動(dòng)化內(nèi)存管理,這種管理機(jī)制以引用計(jì)數(shù)為基礎(chǔ),同時(shí)也引入了標(biāo)記-清除和分代收集兩種機(jī)制為輔的策略。
typedef struct_object { /* 引用計(jì)數(shù) */ int ob_refcnt; /* 對象指針 */ struct_typeobject *ob_type; } PyObject; /* 增加引用計(jì)數(shù)的宏定義 */ #define Py_INCREF(op) ((op)->ob_refcnt++) /* 減少引用計(jì)數(shù)的宏定義 */ #define Py_DECREF(op) \ //減少計(jì)數(shù) if (--(op)->ob_refcnt != 0) \ ; \ else \ __Py_Dealloc((PyObject *)(op))
導(dǎo)致引用計(jì)數(shù)+1的情況:
- 對象被創(chuàng)建,例如a = 23
- 對象被引用,例如b = a
- 對象被作為參數(shù),傳入到一個(gè)函數(shù)中,例如f(a)
- 對象作為一個(gè)元素,存儲在容器中,例如list1 = [a, a]
導(dǎo)致引用計(jì)數(shù)-1的情況:
- 對象的別名被顯式銷毀,例如del a
- 對象的別名被賦予新的對象,例如a = 24
- 一個(gè)對象離開它的作用域,例如f函數(shù)執(zhí)行完畢時(shí),f函數(shù)中的局部變量(全局變量不會)
- 對象所在的容器被銷毀,或從容器中刪除對象
引用計(jì)數(shù)可能會導(dǎo)致循環(huán)引用問題,而循環(huán)引用會導(dǎo)致內(nèi)存泄露,如下面的代碼所示。為了解決這個(gè)問題,Python中引入了“標(biāo)記-清除”和“分代收集”。在創(chuàng)建一個(gè)對象的時(shí)候,對象被放在第一代中,如果在第一代的垃圾檢查中對象存活了下來,該對象就會被放到第二代中,同理在第二代的垃圾檢查中對象存活下來,該對象就會被放到第三代中。
# 循環(huán)引用會導(dǎo)致內(nèi)存泄露 - Python除了引用技術(shù)還引入了標(biāo)記清理和分代回收 # 在Python 3.6以前如果重寫__del__魔術(shù)方法會導(dǎo)致循環(huán)引用處理失效 # 如果不想造成循環(huán)引用可以使用弱引用 list1 = [] list2 = [] list1.append(list2) list2.append(list1)
以下情況會導(dǎo)致垃圾回收:
- 調(diào)用gc.collect()
- gc模塊的計(jì)數(shù)器達(dá)到閥值
- 程序退出
如果循環(huán)引用中兩個(gè)對象都定義了__del__方法,gc模塊不會銷毀這些不可達(dá)對象,因?yàn)間c模塊不知道應(yīng)該先調(diào)用哪個(gè)對象的__del__方法,這個(gè)問題在Python 3.6中得到了解決。
也可以通過weakref模塊構(gòu)造弱引用的方式來解決循環(huán)引用的問題。
魔法屬性和方法(請參考《Python魔法方法指南》)
有幾個(gè)小問題請大家思考:
- 自定義的對象能不能使用運(yùn)算符做運(yùn)算?
- 自定義的對象能不能放到set中?能去重嗎?
- 自定義的對象能不能作為dict的鍵?
- 自定義的對象能不能使用上下文語法?
混入(Mixin)
例子:自定義字典限制只有在指定的key不存在時(shí)才能在字典中設(shè)置鍵值對。
class SetOnceMappingMixin(): """自定義混入類""" __slots__ = () def __setitem__(self, key, value): if key in self: raise KeyError(str(key) + ' already set') return super().__setitem__(key, value) class SetOnceDict(SetOnceMappingMixin, dict): """自定義字典""" pass my_dict= SetOnceDict() try: my_dict['username'] = 'jackfrued' my_dict['username'] = 'hellokitty' except KeyError: pass print(my_dict)
元編程和元類
例子:用元類實(shí)現(xiàn)單例模式
import threading class SingletonMeta(type): """自定義元類""" def __init__(cls, *args, **kwargs): cls.__instance = None cls.__lock = threading.Lock() super().__init__(*args, **kwargs) def __call__(cls, *args, **kwargs): if cls.__instance is None: with cls.__lock: if cls.__instance is None: cls.__instance = super().__call__(*args, **kwargs) return cls.__instance class President(metaclass=SingletonMeta): """總統(tǒng)(單例類)""" pass
面向?qū)ο笤O(shè)計(jì)原則
- 單一職責(zé)原則 (SRP)- 一個(gè)類只做該做的事情(類的設(shè)計(jì)要高內(nèi)聚)
- 開閉原則 (OCP)- 軟件實(shí)體應(yīng)該對擴(kuò)展開發(fā)對修改關(guān)閉
- 依賴倒轉(zhuǎn)原則(DIP)- 面向抽象編程(在弱類型語言中已經(jīng)被弱化)
- 里氏替換原則(LSP) - 任何時(shí)候可以用子類對象替換掉父類對象
- 接口隔離原則(ISP)- 接口要小而專不要大而全(Python中沒有接口的概念)
- 合成聚合復(fù)用原則(CARP) - 優(yōu)先使用強(qiáng)關(guān)聯(lián)關(guān)系而不是繼承關(guān)系復(fù)用代碼
- 最少知識原則(迪米特法則,LoD)- 不要給沒有必然聯(lián)系的對象發(fā)消息
說明:上面加粗的字母放在一起稱為面向?qū)ο蟮腟OLID原則。
GoF設(shè)計(jì)模式
- 創(chuàng)建型模式:單例、工廠、建造者、原型
- 結(jié)構(gòu)型模式:適配器、門面(外觀)、代理
- 行為型模式:迭代器、觀察者、狀態(tài)、策略
例子:可插拔的哈希算法。
class StreamHasher(): """哈希摘要生成器(策略模式)""" def __init__(self, alg='md5', size=4096): self.size = size alg = alg.lower() self.hasher = getattr(__import__('hashlib'), alg.lower())() def __call__(self, stream): return self.to_digest(stream) def to_digest(self, stream): """生成十六進(jìn)制形式的摘要""" for buf in iter(lambda: stream.read(self.size), b''): self.hasher.update(buf) return self.hasher.hexdigest() def main(): """主函數(shù)""" hasher1 = StreamHasher() with open('Python-3.7.1.tgz', 'rb') as stream: print(hasher1.to_digest(stream)) hasher2 = StreamHasher('sha1') with open('Python-3.7.1.tgz', 'rb') as stream: print(hasher2(stream)) if __name__ == '__main__': main()
迭代器和生成器
和迭代器相關(guān)的魔術(shù)方法(__iter__和__next__)
兩種創(chuàng)建生成器的方式(生成器表達(dá)式和yield關(guān)鍵字)
def fib(num): """生成器""" a, b = 0, 1 for _ in range(num): a, b = b, a + b yield a class Fib(object): """迭代器""" def __init__(self, num): self.num = num self.a, self.b = 0, 1 self.idx = 0 def __iter__(self): return self def __next__(self): if self.idx < self.num: self.a, self.b = self.b, self.a + self.b self.idx += 1 return self.a raise StopIteration()
并發(fā)編程
Python中實(shí)現(xiàn)并發(fā)編程的三種方案:多線程、多進(jìn)程和異步I/O。并發(fā)編程的好處在于可以提升程序的執(zhí)行效率以及改善用戶體驗(yàn);壞處在于并發(fā)的程序不容易開發(fā)和調(diào)試,同時(shí)對其他程序來說它并不友好。
多線程:Python中提供了Thread類并輔以Lock、Condition、Event、Semaphore和Barrier。Python中有GIL來防止多個(gè)線程同時(shí)執(zhí)行本地字節(jié)碼,這個(gè)鎖對于CPython是必須的,因?yàn)镃Python的內(nèi)存管理并不是線程安全的,因?yàn)镚IL的存在多線程并不能發(fā)揮CPU的多核特性。
""" 面試題:進(jìn)程和線程的區(qū)別和聯(lián)系? 進(jìn)程 - 操作系統(tǒng)分配內(nèi)存的基本單位 - 一個(gè)進(jìn)程可以包含一個(gè)或多個(gè)線程 線程 - 操作系統(tǒng)分配CPU的基本單位 并發(fā)編程(concurrent programming) 1. 提升執(zhí)行性能 - 讓程序中沒有因果關(guān)系的部分可以并發(fā)的執(zhí)行 2. 改善用戶體驗(yàn) - 讓耗時(shí)間的操作不會造成程序的假死 """ import glob import os import threading from PIL import Image PREFIX = 'thumbnails' def generate_thumbnail(infile, size, format='PNG'): """生成指定圖片文件的縮略圖""" file, ext = os.path.splitext(infile) file = file[file.rfind('/') + 1:] outfile = f'{PREFIX}/{file}_{size[0]}_{size[1]}.{ext}' img = Image.open(infile) img.thumbnail(size, Image.ANTIALIAS) img.save(outfile, format) def main(): """主函數(shù)""" if not os.path.exists(PREFIX): os.mkdir(PREFIX) for infile in glob.glob('images/*.png'): for size in (32, 64, 128): # 創(chuàng)建并啟動(dòng)線程 threading.Thread( target=generate_thumbnail, args=(infile, (size, size)) ).start() if __name__ == '__main__': main()
多個(gè)線程競爭資源的情況
""" 多線程程序如果沒有競爭資源處理起來通常也比較簡單 當(dāng)多個(gè)線程競爭臨界資源的時(shí)候如果缺乏必要的保護(hù)措施就會導(dǎo)致數(shù)據(jù)錯(cuò)亂 說明:臨界資源就是被多個(gè)線程競爭的資源 """ import time import threading from concurrent.futures import ThreadPoolExecutor class Account(object): """銀行賬戶""" def __init__(self): self.balance = 0.0 self.lock = threading.Lock() def deposit(self, money): # 通過鎖保護(hù)臨界資源 with self.lock: new_balance = self.balance + money time.sleep(0.001) self.balance = new_balance class AddMoneyThread(threading.Thread): """自定義線程類""" def __init__(self, account, money): self.account = account self.money = money # 自定義線程的初始化方法中必須調(diào)用父類的初始化方法 super().__init__() def run(self): # 線程啟動(dòng)之后要執(zhí)行的操作 self.account.deposit(self.money) def main(): """主函數(shù)""" account = Account() # 創(chuàng)建線程池 pool = ThreadPoolExecutor(max_workers=10) futures = [] for _ in range(100): # 創(chuàng)建線程的第1種方式 # threading.Thread( # target=account.deposit, args=(1, ) # ).start() # 創(chuàng)建線程的第2種方式 # AddMoneyThread(account, 1).start() # 創(chuàng)建線程的第3種方式 # 調(diào)用線程池中的線程來執(zhí)行特定的任務(wù) future = pool.submit(account.deposit, 1) futures.append(future) # 關(guān)閉線程池 pool.shutdown() for future in futures: future.result() print(account.balance) if __name__ == '__main__': main()
修改上面的程序,啟動(dòng)5個(gè)線程向賬戶中存錢,5個(gè)線程從賬戶中取錢,取錢時(shí)如果余額不足就暫停線程進(jìn)行等待。為了達(dá)到上述目標(biāo),需要對存錢和取錢的線程進(jìn)行調(diào)度,在余額不足時(shí)取錢的線程暫停并釋放鎖,而存錢的線程將錢存入后要通知取錢的線程,使其從暫停狀態(tài)被喚醒??梢允褂胻hreading模塊的Condition來實(shí)現(xiàn)線程調(diào)度,該對象也是基于鎖來創(chuàng)建的,代碼如下所示:
""" 多個(gè)線程競爭一個(gè)資源 - 保護(hù)臨界資源 - 鎖(Lock/RLock) 多個(gè)線程競爭多個(gè)資源(線程數(shù)>資源數(shù)) - 信號量(Semaphore) 多個(gè)線程的調(diào)度 - 暫停線程執(zhí)行/喚醒等待中的線程 - Condition """ from concurrent.futures import ThreadPoolExecutor from random import randint from time import sleep import threading class Account(): """銀行賬戶""" def __init__(self, balance=0): self.balance = balance lock = threading.Lock() self.condition = threading.Condition(lock) def withdraw(self, money): """取錢""" with self.condition: while money > self.balance: self.condition.wait() new_balance = self.balance - money sleep(0.001) self.balance = new_balance def deposit(self, money): """存錢""" with self.condition: new_balance = self.balance + money sleep(0.001) self.balance = new_balance self.condition.notify_all() def add_money(account): while True: money = randint(5, 10) account.deposit(money) print(threading.current_thread().name, ':', money, '====>', account.balance) sleep(0.5) def sub_money(account): while True: money = randint(10, 30) account.withdraw(money) print(threading.current_thread().name, ':', money, '<====', account.balance) sleep(1) def main(): account = Account() with ThreadPoolExecutor(max_workers=10) as pool: for _ in range(5): pool.submit(add_money, account) pool.submit(sub_money, account) if __name__ == '__main__': main()
多進(jìn)程:多進(jìn)程可以有效的解決GIL的問題,實(shí)現(xiàn)多進(jìn)程主要的類是Process,其他輔助的類跟threading模塊中的類似,進(jìn)程間共享數(shù)據(jù)可以使用管道、套接字等,在multiprocessing模塊中有一個(gè)Queue類,它基于管道和鎖機(jī)制提供了多個(gè)進(jìn)程共享的隊(duì)列。下面是官方文檔上關(guān)于多進(jìn)程和進(jìn)程池的一個(gè)示例。
""" 多進(jìn)程和進(jìn)程池的使用 多線程因?yàn)镚IL的存在不能夠發(fā)揮CPU的多核特性 對于計(jì)算密集型任務(wù)應(yīng)該考慮使用多進(jìn)程 time python3 example22.py real 0m11.512s user 0m39.319s sys 0m0.169s 使用多進(jìn)程后實(shí)際執(zhí)行時(shí)間為11.512秒,而用戶時(shí)間39.319秒約為實(shí)際執(zhí)行時(shí)間的4倍 這就證明我們的程序通過多進(jìn)程使用了CPU的多核特性,而且這臺計(jì)算機(jī)配置了4核的CPU """ import concurrent.futures import math PRIMES = [ 1116281, 1297337, 104395303, 472882027, 533000389, 817504243, 982451653, 112272535095293, 112582705942171, 112272535095293, 115280095190773, 115797848077099, 1099726899285419 ] * 5 def is_prime(n): """判斷素?cái)?shù)""" if n % 2 == 0: return False sqrt_n = int(math.floor(math.sqrt(n))) for i in range(3, sqrt_n + 1, 2): if n % i == 0: return False return True def main(): """主函數(shù)""" with concurrent.futures.ProcessPoolExecutor() as executor: for number, prime in zip(PRIMES, executor.map(is_prime, PRIMES)): print('%d is prime: %s' % (number, prime)) if __name__ == '__main__': main()
說明:多線程和多進(jìn)程的比較。
以下情況需要使用多線程:
- 程序需要維護(hù)許多共享的狀態(tài)(尤其是可變狀態(tài)),Python中的列表、字典、集合都是線程安全的,所以使用線程而不是進(jìn)程維護(hù)共享狀態(tài)的代價(jià)相對較小。
- 程序會花費(fèi)大量時(shí)間在I/O操作上,沒有太多并行計(jì)算的需求且不需占用太多的內(nèi)存。
以下情況需要使用多進(jìn)程:
- 程序執(zhí)行計(jì)算密集型任務(wù)(如:字節(jié)碼操作、數(shù)據(jù)處理、科學(xué)計(jì)算)。
- 程序的輸入可以并行的分成塊,并且可以將運(yùn)算結(jié)果合并。
- 程序在內(nèi)存使用方面沒有任何限制且不強(qiáng)依賴于I/O操作(如:讀寫文件、套接字等)。
異步處理:從調(diào)度程序的任務(wù)隊(duì)列中挑選任務(wù),該調(diào)度程序以交叉的形式執(zhí)行這些任務(wù),我們并不能保證任務(wù)將以某種順序去執(zhí)行,因?yàn)閳?zhí)行順序取決于隊(duì)列中的一項(xiàng)任務(wù)是否愿意將CPU處理時(shí)間讓位給另一項(xiàng)任務(wù)。異步任務(wù)通常通過多任務(wù)協(xié)作處理的方式來實(shí)現(xiàn),由于執(zhí)行時(shí)間和順序的不確定,因此需要通過回調(diào)式編程或者future對象來獲取任務(wù)執(zhí)行的結(jié)果。Python 3通過asyncio模塊和await和async關(guān)鍵字(在Python 3.7中正式被列為關(guān)鍵字)來支持異步處理。
""" 異步I/O - async / await """ import asyncio def num_generator(m, n): """指定范圍的數(shù)字生成器""" yield from range(m, n + 1) async def prime_filter(m, n): """素?cái)?shù)過濾器""" primes = [] for i in num_generator(m, n): flag = True for j in range(2, int(i ** 0.5 + 1)): if i % j == 0: flag = False break if flag: print('Prime =>', i) primes.append(i) await asyncio.sleep(0.001) return tuple(primes) async def square_mapper(m, n): """平方映射器""" squares = [] for i in num_generator(m, n): print('Square =>', i * i) squares.append(i * i) await asyncio.sleep(0.001) return squares def main(): """主函數(shù)""" loop = asyncio.get_event_loop() future = asyncio.gather(prime_filter(2, 100), square_mapper(1, 100)) future.add_done_callback(lambda x: print(x.result())) loop.run_until_complete(future) loop.close() if __name__ == '__main__': main()
說明:上面的代碼使用get_event_loop函數(shù)獲得系統(tǒng)默認(rèn)的事件循環(huán),通過gather函數(shù)可以獲得一個(gè)future對象,future對象的add_done_callback可以添加執(zhí)行完成時(shí)的回調(diào)函數(shù),loop對象的run_until_complete方法可以等待通過future對象獲得協(xié)程執(zhí)行結(jié)果。
Python中有一個(gè)名為aiohttp的三方庫,它提供了異步的HTTP客戶端和服務(wù)器,這個(gè)三方庫可以跟asyncio模塊一起工作,并提供了對Future對象的支持。Python 3.6中引入了async和await來定義異步執(zhí)行的函數(shù)以及創(chuàng)建異步上下文,在Python 3.7中它們正式成為了關(guān)鍵字。下面的代碼異步的從5個(gè)URL中獲取頁面并通過正則表達(dá)式的命名捕獲組提取了網(wǎng)站的標(biāo)題。
import asyncio import re import aiohttp PATTERN = re.compile(r'\<title\>(?P<title>.*)\<\/title\>') async def fetch_page(session, url): async with session.get(url, ssl=False) as resp: return await resp.text() async def show_title(url): async with aiohttp.ClientSession() as session: html = await fetch_page(session, url) print(PATTERN.search(html).group('title')) def main(): urls = ('https://www.python.org/', 'https://git-scm.com/', 'https://www.jd.com/', 'https://www.taobao.com/', 'https://www.douban.com/') loop = asyncio.get_event_loop() tasks = [show_title(url) for url in urls] loop.run_until_complete(asyncio.wait(tasks)) loop.close() if __name__ == '__main__': main()
說明:異步I/O與多進(jìn)程的比較。
當(dāng)程序不需要真正的并發(fā)性或并行性,而是更多的依賴于異步處理和回調(diào)時(shí),asyncio就是一種很好的選擇。如果程序中有大量的等待與休眠時(shí),也應(yīng)該考慮asyncio,它很適合編寫沒有實(shí)時(shí)數(shù)據(jù)處理需求的Web應(yīng)用服務(wù)器。
Python還有很多用于處理并行任務(wù)的三方庫,例如:joblib、PyMP等。實(shí)際開發(fā)中,要提升系統(tǒng)的可擴(kuò)展性和并發(fā)性通常有垂直擴(kuò)展(增加單個(gè)節(jié)點(diǎn)的處理能力)和水平擴(kuò)展(將單個(gè)節(jié)點(diǎn)變成多個(gè)節(jié)點(diǎn))兩種做法??梢酝ㄟ^消息隊(duì)列來實(shí)現(xiàn)應(yīng)用程序的解耦合,消息隊(duì)列相當(dāng)于是多線程同步隊(duì)列的擴(kuò)展版本,不同機(jī)器上的應(yīng)用程序相當(dāng)于就是線程,而共享的分布式消息隊(duì)列就是原來程序中的Queue。消息隊(duì)列(面向消息的中間件)的最流行和最標(biāo)準(zhǔn)化的實(shí)現(xiàn)是AMQP(高級消息隊(duì)列協(xié)議),AMQP源于金融行業(yè),提供了排隊(duì)、路由、可靠傳輸、安全等功能,最著名的實(shí)現(xiàn)包括:Apache的ActiveMQ、RabbitMQ等。
要實(shí)現(xiàn)任務(wù)的異步化,可以使用名為Celery的三方庫。Celery是Python編寫的分布式任務(wù)隊(duì)列,它使用分布式消息進(jìn)行工作,可以基于RabbitMQ或Redis來作為后端的消息代理。
相關(guān)文章
Python中__repr__和__str__區(qū)別詳解
這篇文章主要介紹了Python中__repr__和__str__區(qū)別詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11利用python將xml文件解析成html文件的實(shí)現(xiàn)方法
下面小編就為大家分享一篇利用python將xml文件解析成html文件的實(shí)現(xiàn)方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2017-12-12淺談pandas中shift和diff函數(shù)關(guān)系
下面小編就為大家分享一篇淺談pandas中shift和diff函數(shù)關(guān)系,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-04-04