之前也寫過(guò)多線程的博客,用的是 threading ,今天來(lái)講下 python 的另外一個(gè)自帶庫(kù) concurrent 。concurrent 是在 Python3.2 中引入的,只用幾行代碼就可以編寫出線程池/進(jìn)程池,并且計(jì)算型任務(wù)效率和 mutiprocessing.pool 提供的 poll 和 ThreadPoll 相比不分伯仲,而且在 IO 型任務(wù)由于引入了 Future 的概念效率要高數(shù)倍。而 threading 的話還要自己維護(hù)相關(guān)的隊(duì)列防止死鎖,代碼的可讀性也會(huì)下降,相反 concurrent 提供的線程池卻非常的便捷,不用自己操心死鎖以及編寫線程池代碼,由于異步的概念 IO 型任務(wù)也更有優(yōu)勢(shì)。
concurrent 的確很好用,主要提供了 ThreadPoolExecutor 和 ProcessPoolExecutor 。一個(gè)多線程,一個(gè)多進(jìn)程。但 concurrent 本質(zhì)上都是對(duì) threading 和 mutiprocessing 的封裝??此脑创a可以知道,所以最底層并沒(méi)有異步。
ThreadPoolExecutor 自己提供了任務(wù)隊(duì)列,不需要自己寫了。而所謂的線程池,它只是簡(jiǎn)單的比較當(dāng)前的 threads 數(shù)量和定義的 max_workers 的大小,小于 max_workers 就允許任務(wù)創(chuàng)建線程執(zhí)行任務(wù)。
通過(guò) ThreadPoolExecutor 類創(chuàng)建線程池對(duì)象,max_workers 設(shè)置最大運(yùn)行線程數(shù)數(shù)。使用 ThreadPoolExecutor 的好處是不用擔(dān)心線程死鎖問(wèn)題,讓多線程編程更簡(jiǎn)潔。
from concurrent import futures pool = futures.ThreadPoolExecutor(max_workers = 2)
submit(self, fn, *args, **kwargs):
該方法的作用就是提交一個(gè)可執(zhí)行的回調(diào)task,它返回一個(gè)Future對(duì)象??梢钥闯龃朔椒ú粫?huì)阻塞主線程的執(zhí)行。
import requests,datetime,time from concurrent import futures def get_request(url): r = requests.get(url) print('{}:{} {}'.format(datetime.datetime.now(),url,r.status_code)) urls = ['https://www.baidu.com','https://www.tmall.com','https://www.jd.com'] pool = futures.ThreadPoolExecutor(max_workers = 2) for url in urls: task = pool.submit(get_request,url) print('{}主線程'.format(datetime.datetime.now())) time.sleep(2) # 輸出結(jié)果 2021-03-12 15:29:10.780141:主線程 2021-03-12 15:29:10.865425:https://www.baidu.com 200 2021-03-12 15:29:10.923062:https://www.tmall.com 200 2021-03-12 15:29:10.940930:https://www.jd.com 200
map(self, fn, *iterables, timeout=None, chunksize=1):
map 第二個(gè)參數(shù)是可迭代對(duì)象,比如 list、tuple 等,寫法相對(duì)簡(jiǎn)單。map 方法也不會(huì)阻塞主線程的執(zhí)行。
import requests,datetime,time from concurrent import futures def get_request(url): r = requests.get(url) print('{}:{} {}'.format(datetime.datetime.now(),url,r.status_code)) urls = ['https://www.baidu.com','https://www.tmall.com','https://www.jd.com'] pool = futures.ThreadPoolExecutor(max_workers = 2) tasks = pool.map(get_request,urls) print('{}:主線程'.format(datetime.datetime.now())) time.sleep(2) # 輸出結(jié)果 2021-03-12 16:14:04.854452:主線程 2021-03-12 16:14:04.938870:https://www.baidu.com 200 2021-03-12 16:14:05.033849:https://www.jd.com 200 2021-03-12 16:14:05.048952:https://www.tmall.com 200
如果要等待子線程執(zhí)行完之后再執(zhí)行主線程要怎么辦呢,可以通過(guò) wait 。
wait(fs, timeout=None, return_when=ALL_COMPLETED):
import requests,datetime,time from concurrent import futures def get_request(url): r = requests.get(url) print('{}:{} {}'.format(datetime.datetime.now(),url,r.status_code)) urls = ['https://www.baidu.com','https://www.tmall.com','https://www.jd.com'] pool = futures.ThreadPoolExecutor(max_workers = 2) tasks =[] for url in urls: task = pool.submit(get_request,url) tasks.append(task) futures.wait(tasks) print('{}:主線程'.format(datetime.datetime.now())) time.sleep(2) # 輸出結(jié)果 2021-03-12 16:30:13.437042:https://www.baidu.com 200 2021-03-12 16:30:13.552700:https://www.jd.com 200 2021-03-12 16:30:14.117325:https://www.tmall.com 200 2021-03-12 16:30:14.118284:主線程
as_completed(fs, timeout=None)
使用 concurrent.futures 操作 多線程/多進(jìn)程 過(guò)程中,很多函數(shù)報(bào)錯(cuò)并不會(huì)直接終止程序,而是什么都沒(méi)發(fā)生。使用 as_completed 可以捕獲異常,代碼如下
import requests,datetime,time from concurrent import futures def get_request(url): r = requests.get(url) print('{}:{} {}'.format(datetime.datetime.now(),url,r.status_code)) urls = ['www.baidu.com','https://www.tmall.com','https://www.jd.com'] # 創(chuàng)建線程池 pool = futures.ThreadPoolExecutor(max_workers = 2) tasks =[] for url in urls: task = pool.submit(get_request,url) tasks.append(task) # 異常捕獲 errors = futures.as_completed(tasks) for error in errors: # error.result() 等待子線程都完成,并拋出異常,中斷主線程 # 捕獲子線程異常,不會(huì)終止主線程繼續(xù)運(yùn)行 print(error.exception()) futures.wait(tasks) print('{}:主線程'.format(datetime.datetime.now())) time.sleep(2) # 輸出結(jié)果 Invalid URL 'www.baidu.com': No schema supplied. Perhaps you meant http://www.baidu.com? 2021-03-12 17:24:26.984933:https://www.tmall.com 200 None 2021-03-12 17:24:26.993939:https://www.jd.com 200 None 2021-03-12 17:24:26.994937:主線程
多進(jìn)程編程也類似,將 ThreadPoolExecutor 替換成 ProcessPoolExecutor 。
以上就是python基于concurrent模塊實(shí)現(xiàn)多線程的詳細(xì)內(nèi)容,更多關(guān)于python concurrent實(shí)現(xiàn)多線程的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
標(biāo)簽:衡水 駐馬店 中山 呼和浩特 江蘇 畢節(jié) 股票 湖州
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python基于concurrent模塊實(shí)現(xiàn)多線程》,本文關(guān)鍵詞 python,基于,concurrent,模塊,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。