Python通過future處理并發問題-CDA數據分析師官網

requests
POP20_CC = (
"CN IN US ID BR PK NG BD RU JP MX PH VN ET EG DE IR TR CD FR"
).split()
BASE_URL = 'http://flupy.org/data/flags'
DEST_DIR = 'downloads/'
def save_flag(img,filename):
path = os.path.join(DEST_DIR,filename)
with open(path,'wb') as fp:
fp.write(img)
def get_flag(cc):
url = "{}/{cc}/{cc}.gif".format(BASE_URL,cc=cc.lower())
resp = requests.get(url)
return resp.content
def show(text):
print(text,end=" ")
sys.stdout.flush()
def download_many(cc_list):
for cc in sorted(cc_list):
image = get_flag(cc)
show(cc)
save_flag(image,cc.lower()+".gif")
return len(cc_list)
def main(download_many):
t0 = time.time()
count = download_many(POP20_CC)
elapsed = time.time()-t0
msg = "\n{} flags downloaded in {:.2f}s"
print(msg.format(count,elapsed))
if __name__ == '__main__':
main(download_many)

例子2：通過future方式實現，這里對上面的部分代碼進行了復用
from concurrent import futures
from flags import save_flag, get_flag, show, main
MAX_WORKERS = 20
def download_one(cc):
image = get_flag(cc)
show(cc)
save_flag(image, cc.lower()+".gif")
return cc
def download_many(cc_list):
workers = min(MAX_WORKERS,len(cc_list))
with futures.ThreadPoolExecutor(workers) as executor:
res = executor.map(download_one, sorted(cc_list))
return len(list(res))
if __name__ == '__main__':
main(download_many)

分別運行三次，兩者的平均速度：13.67和1.59s，可以看到差別還是非常大的。

future

future是concurrent.futures模塊和asyncio模塊的重要組件

從python3.4開始標準庫中有兩個名為Future的類：concurrent.futures.Future和asyncio.Future
這兩個類的作用相同：兩個Future類的實例都表示可能完成或者尚未完成的延遲計算。與Twisted中的Deferred類、Tornado框架中的Future類的功能類似

注意：通常情況下自己不應該創建future，而是由并發框架(concurrent.futures或asyncio)實例化

原因：future表示終將發生的事情，而確定某件事情會發生的唯一方式是執行的時間已經安排好，因此只有把某件事情交給concurrent.futures.Executor子類處理時，才會創建concurrent.futures.Future實例。
如：Executor.submit()方法的參數是一個可調用的對象，調用這個方法后會為傳入的可調用對象排定時間，并返回一個

future

客戶端代碼不能應該改變future的狀態，并發框架在future表示的延遲計算結束后會改變期物的狀態，我們無法控制計算何時結束。

這兩種future都有.done()方法，這個方法不阻塞，返回值是布爾值，指明future鏈接的可調用對象是否已經執行?？蛻舳舜a通常不會詢問future是否運行結束，而是會等待通知。因此兩個Future類都有.add_done_callback()方法，這個方法只有一個參數，類型是可調用的對象，future運行結束后會調用指定的可調用對象。

.result()方法是在兩個Future類中的作用相同：返回可調用對象的結果，或者重新拋出執行可調用的對象時拋出的異常。但是如果future沒有運行結束，result方法在兩個Futrue類中的行為差別非常大。

對concurrent.futures.Future實例來說，調用.result()方法會阻塞調用方所在的線程，直到有結果可返回，此時，result方法可以接收可選的timeout參數，如果在指定的時間內future沒有運行完畢，會拋出TimeoutError異常。

而asyncio.Future.result方法不支持設定超時時間，在獲取future結果最好使用yield from結構，但是concurrent.futures.Future不能這樣做

不管是asyncio還是concurrent.futures.Future都會有幾個函數是返回future，其他函數則是使用future,在最開始的例子中我們使用的Executor.map就是在使用future，返回值是一個迭代器，迭代器的__next__方法調用各個future的result方法，因此我們得到的是各個futrue的結果，而不是future本身

關于future.as_completed函數的使用，這里我們用了兩個循環，一個用于創建并排定future,另外一個用于獲取future的結果

fromconcurrentimportfutures

fromflagsimportsave_flag, get_flag, show, main

MAX_WORKERS=20

defdownload_one(cc):

image=get_flag(cc)

show(cc)

save_flag(image, cc.lower()+".gif")

returncc

defdownload_many(cc_list):

cc_list=cc_list[:5]

with futures.ThreadPoolExecutor(max_workers=3) as executor:

to_do=[]

forccinsorted(cc_list):

future=executor.submit(download_one,cc)

to_do.append(future)

msg="Secheduled for {}:{}"

print(msg.format(cc,future))

results=[]

forfutureinfutures.as_completed(to_do):

res=future.result()

msg="{}result:{!r}"

print(msg.format(future,res))

results.append(res)

returnlen(results)

if__name__=='__main__':

main(download_many)

結果如下：

注意：Python代碼是無法控制GIL，標準庫中所有執行阻塞型IO操作的函數，在等待操作系統返回結果時都會釋放GIL.運行其他線程執行，也正是因為這樣，Python線程可以在IO密集型應用中發揮作用

以上都是concurrent.futures啟動線程，下面通過它啟動進程

concurrent.futures啟動進程

concurrent.futures中的ProcessPoolExecutor類把工作分配給多個Python進程處理，因此，如果需要做CPU密集型處理，使用這個模塊能繞開GIL，利用所有的CPU核心。

其原理是一個ProcessPoolExecutor創建了N個獨立的Python解釋器，N是系統上面可用的CPU核數。

使用方法和ThreadPoolExecutor方法一樣

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

requests python

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇區塊鏈的定義與特性

下一篇如何衡量多元線性回歸模型優劣

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

立即咨詢

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

數據分析師考試動態

CDA報考指南

數據分析學習

數據分析師資訊

CDA數據分析師證書考試體系（更新于2025年05月22日 ...

什么人適合做數據分析師

【CDA干貨】數據分析這6個環節可以使用AI，高效提升 ...

數據分析新手入門需要學習什么

【CDA干貨】一文讀懂相關性分析，在運營數據分析中 ...

【CDA干貨】小紅書美妝行業：從數據分析到策略轉化 ...

【干貨】如何用AI做Excel數據分析？這兩種方法太香 ...

2025年06月07日CDA數據分析師就業班即將開班 ...

大數據是什么_數據分析師培訓

【CDA干貨】手把手教你搭建BI可視化看板，優化電商 ...

【CDA干貨】復雜網絡&博弈論思維模型在企業實戰中的 ...

【CDA干貨】市民熱線與訴求智能數據分析案例 ...

【CDA干貨】美團外賣&騰訊qq秀數據分析改變決策案例 ...

【測評】AI+數據分析工具，手把手教你用Trae零代碼 ...

【干貨】字節大佬：別再拿“用戶流失”當玄學了，我 ...

【CDA干貨】數據資產入表案例分享

【CDA干貨】盒馬鮮生：數據驅動業務實戰案例 ...

【CDA干貨】13年國企財務：這樣使用財務數據分析模 ...

單因素方差分析結果與多重比較

【CDA干貨】13年國企財務：這樣使用財務數據分析模 ...

CDA教育閉環

常見問題

關于我們

CDA數據分析師公眾號

CDA考試中心小程序

CDA數據分析師App下載

數據分析師考試動態

CDA報考指南

數據分析學習

數據分析師資訊

CDA數據分析師證書考試體系（更新于2025年05月22日 ...

什么人適合做數據分析師

【CDA干貨】數據分析這6個環節可以使用AI，高效提升 ...

數據分析新手入門需要學習什么

【CDA干貨】一文讀懂相關性分析，在運營數據分析中 ...

【CDA干貨】小紅書美妝行業：從數據分析到策略轉化 ...

【干貨】如何用AI做Excel數據分析？這兩種方法太香 ...

2025年06月07日CDA數據分析師就業班即將開班 ...

大數據是什么_數據分析師培訓

【CDA干貨】手把手教你搭建BI可視化看板，優化電商 ...

【CDA干貨】復雜網絡&博弈論思維模型在企業實戰中的 ...

【CDA干貨】市民熱線與訴求智能數據分析案例 ...

【CDA干貨】美團外賣&騰訊qq秀數據分析改變決策案例 ...

【測評】AI+數據分析工具，手把手教你用Trae零代碼 ...

【干貨】字節大佬：別再拿“用戶流失”當玄學了，我 ...

【CDA干貨】數據資產入表案例分享

【CDA干貨】盒馬鮮生：數據驅動業務實戰案例 ...

【CDA干貨】13年國企財務：這樣使用財務數據分析模 ...

單因素方差分析結果與多重比較

【CDA干貨】13年國企財務：這樣使用財務數據分析模 ...

CDA教育閉環

常見問題

關于我們

CDA數據分析師公眾號

CDA考試中心小程序

CDA數據分析師App下載

【CDA干貨】數據分析這6個環節可以使用AI，高效提升 ...

【CDA干貨】一文讀懂相關性分析，在運營數據分析中 ...

【干貨】如何用AI做Excel數據分析？這兩種方法太香 ...

【CDA干貨】手把手教你搭建BI可視化看板，優化電商 ...

【測評】AI+數據分析工具，手把手教你用Trae零代碼 ...

【干貨】字節大佬：別再拿“用戶流失”當玄學了，我 ...