色88久久久久高潮综合影院,成人综合久久精品色婷婷

主頁 > 知識(shí)庫 > python 多線程實(shí)現(xiàn)多任務(wù)的方法示例

python 多線程實(shí)現(xiàn)多任務(wù)的方法示例

1 多線程實(shí)現(xiàn)多任務(wù)

1.1 什么是線程？

進(jìn)程是操作系統(tǒng)分配程序執(zhí)行資源的單位，而線程是進(jìn)程的一個(gè)實(shí)體，是CPU調(diào)度和分配的單位。一個(gè)進(jìn)程肯定有一個(gè)主線程，我們可以在一個(gè)進(jìn)程里創(chuàng)建多個(gè)線程來實(shí)現(xiàn)多任務(wù)。

1.2 一個(gè)程序?qū)崿F(xiàn)多任務(wù)的方法

實(shí)現(xiàn)多任務(wù)，我們可以用幾種方法。

（1）在主進(jìn)程里面開啟多個(gè)子進(jìn)程，主進(jìn)程和多個(gè)子進(jìn)程一起處理任務(wù)。

（2）在主進(jìn)程里開啟多個(gè)子線程，主線程和多個(gè)子線程一起處理任務(wù)。

（3）在主進(jìn)程里開啟多個(gè)協(xié)程，多個(gè)協(xié)程一起處理任務(wù)。

注意：因?yàn)橛枚鄠€(gè)線程一起處理任務(wù)，會(huì)產(chǎn)生線程安全問題，所以在開發(fā)中一般使用多進(jìn)程+多協(xié)程來實(shí)現(xiàn)多任務(wù)。

1.3 多線程的創(chuàng)建方式

1.3.1 創(chuàng)建threading.Thread對(duì)象

import threading
p1 = threading.Thread(target=[函數(shù)名],args=([要傳入函數(shù)的參數(shù)]))
p1.start()  # 啟動(dòng)p1線程

我們來模擬一下多線程實(shí)現(xiàn)多任務(wù)。

假如你在用網(wǎng)易云音樂一邊聽歌一邊下載。網(wǎng)易云音樂就是一個(gè)進(jìn)程。假設(shè)網(wǎng)易云音樂內(nèi)部程序是用多線程來實(shí)現(xiàn)多任務(wù)的，網(wǎng)易云音樂開兩個(gè)子線程。一個(gè)用來緩存音樂，用于現(xiàn)在的播放。一個(gè)用來下載用戶要下載的音樂的。這時(shí)候的代碼框架是這樣的：

import threading
import time
 
def listen_music(name):
    while True:
        time.sleep(1)
        print(name,"正在播放音樂")
 
 
def download_music(name):
    while True:
        time.sleep(2)
        print(name,"正在下載音樂")
 
 
if __name__ == '__main__':
    p1 = threading.Thread(target=listen_music,args=("網(wǎng)易云音樂",))
    p2 = threading.Thread(target=download_music,args=("網(wǎng)易云音樂",))
    p1.start()
    p2.start()

輸出：

觀察上面的輸出代碼可以知道：

CPU是按照時(shí)間片輪詢的方式來執(zhí)行子線程的。cpu內(nèi)部會(huì)合理分配時(shí)間片。時(shí)間片到a程序的時(shí)候，a程序如果在休眠，就會(huì)自動(dòng)切換到b程序。

嚴(yán)謹(jǐn)來說，CPU在某個(gè)時(shí)間點(diǎn)，只在執(zhí)行一個(gè)任務(wù)，但是由于CPU運(yùn)行速度和切換速度快，因?yàn)榭雌饋硐穸鄠€(gè)任務(wù)在一起執(zhí)行而已。

1.3.2 繼承threading.Thread，并重寫run

除了上面的方法創(chuàng)建線程，還有另一種方法。可以編寫一個(gè)類，繼承threaing.Thread類，然后重寫父類的run方法。

import threading
import time
 
class MyThread(threading.Thread):
    def run(self):
        for i in range(5):
            time.sleep(1)
            print(self.name,i)
 
t1 = MyThread()
t2 = MyThread()
t3 = MyThread()
t1.start()
t2.start()
t3.start()

輸出：

運(yùn)行時(shí)無序的，說明已經(jīng)啟用了多任務(wù)。

下面是threading.Thread提供的線程對(duì)象方法和屬性：

start()：創(chuàng)建線程后通過start啟動(dòng)線程，等待CPU調(diào)度，為run函數(shù)執(zhí)行做準(zhǔn)備；
run()：線程開始執(zhí)行的入口函數(shù)，函數(shù)體中會(huì)調(diào)用用戶編寫的target函數(shù)，或者執(zhí)行被重載的run函數(shù)；
join([timeout])：阻塞掛起調(diào)用該函數(shù)的線程，直到被調(diào)用線程執(zhí)行完成或超時(shí)。通常會(huì)在主線程中調(diào)用該方法，等待其他線程執(zhí)行完成。
name、getName()setName()：線程名稱相關(guān)的操作；
ident：整數(shù)類型的線程標(biāo)識(shí)符，線程開始執(zhí)行前（調(diào)用start之前）為None；
isAlive()、is_alive()：start函數(shù)執(zhí)行之后到run函數(shù)執(zhí)行完之前都為True；
daemon、isDaemon()setDaemon()：守護(hù)線程相關(guān)；

1.4 線程何時(shí)開啟，何時(shí)結(jié)束

（1）子線程何時(shí)開啟，何時(shí)運(yùn)行當(dāng)調(diào)用thread.start()時(shí) 開啟線程，再運(yùn)行線程的代碼

（2）子線程何時(shí)結(jié)束子線程把target指向的函數(shù)中的語句執(zhí)行完畢后，或者線程中的run函數(shù)代碼執(zhí)行完畢后，立即結(jié)束當(dāng)前子線程

（3）查看當(dāng)前線程數(shù)量通過threading.enumerate()可枚舉當(dāng)前運(yùn)行的所有線程

（4）主線程何時(shí)結(jié)束所有子線程執(zhí)行完畢后，主線程才結(jié)束

示例一：

import threading
import time
  
def run():
    for i in range(5):
        time.sleep(1)
        print(i)
 
t1 = threading.Thread(target=run)
t1.start()
print("我會(huì)在哪里出現(xiàn)")

輸出：

為什么主進(jìn)程（主線程）的代碼會(huì)先出現(xiàn)呢？因?yàn)镃PU采用時(shí)間片輪詢的方式，如果輪詢到子線程，發(fā)現(xiàn)他要休眠1s，他會(huì)先去運(yùn)行主線程。所以說CPU的時(shí)間片輪詢方式可以保證CPU的最佳運(yùn)行。

那如果我想主進(jìn)程輸出的那句話運(yùn)行在結(jié)尾呢？該怎么辦呢？這時(shí)候就需要用到 join() 方法了。

1.5 線程的 join() 方法

import threading
import time
 
def run():
    for i in range(5):
        time.sleep(1)
        print(i)
 
t1 = threading.Thread(target=run)
t1.start()
t1.join()  
print("我會(huì)在哪里出現(xiàn)")

輸出：

join() 方法可以阻塞主線程（注意只能阻塞主線程，其他子線程是不能阻塞的），直到 t1 子線程執(zhí)行完，再解阻塞。

1.6 多線程共享全局變量出現(xiàn)的問題

我們開兩個(gè)子線程，全局變量是0，我們每個(gè)線程對(duì)他自加1，每個(gè)線程加一百萬次，這時(shí)候就會(huì)出現(xiàn)問題了，來，看代碼：

import threading
import time
 
num = 0
 
def work1(loop):
    global num
    for i in range(loop):
        # 等價(jià)于 num += 1
        temp = num
        num = temp + 1
    print(num)
 
 
def work2(loop):
    global num
    for i in range(loop):
        # 等價(jià)于 num += 1
        temp = num
        num = temp + 1
    print(num)
 
 
if __name__ == '__main__':
    t1 = threading.Thread(target=work1,args=(1000000,))
    t2 = threading.Thread(target=work2, args=(1000000,))
    t1.start()
    t2.start()
 
    while len(threading.enumerate()) != 1:
        time.sleep(1)
    print(num)

輸出

1459526 # 第一個(gè)子線程結(jié)束后全局變量一共加到這個(gè)數(shù)
1588806 # 第二個(gè)子線程結(jié)束后全局變量一共加到這個(gè)數(shù)
1588806 # 兩個(gè)線程都結(jié)束后，全局變量一共加到這個(gè)數(shù)

奇怪了，我不是每個(gè)線程都自加一百萬次嗎？照理來說，應(yīng)該最后的結(jié)果是200萬才對(duì)的呀。問題出在哪里呢？

我們知道CPU是采用時(shí)間片輪詢的方式進(jìn)行幾個(gè)線程的執(zhí)行。

假設(shè)我CPU先輪詢到work1()，num此時(shí)為100，在我運(yùn)行到第10行時(shí)，時(shí)間結(jié)束了！此時(shí),賦值了，但是還沒有自加！即temp=100，num=100。

然后，時(shí)間片輪詢到了work2()，進(jìn)行賦值自加。num=101了。

又回到work1()的斷點(diǎn)處，num=temp+1，temp=100，所以num=101。

就這樣！num少了一次自加！在次數(shù)多了之后，這樣的錯(cuò)誤積累在一起，結(jié)果只得到158806！

這就是線程安全問題！

1.7 互斥鎖可以彌補(bǔ)部分線程安全問題。（互斥鎖和GIL鎖是不一樣的東西?。?/h3>

當(dāng)多個(gè)線程幾乎同時(shí)修改某一個(gè)共享數(shù)據(jù)的時(shí)候，需要進(jìn)行同步控制

線程同步能夠保證多個(gè)線程安全訪問競(jìng)爭(zhēng)資源，最簡(jiǎn)單的同步機(jī)制是引入互斥鎖。

互斥鎖為資源引入一個(gè)狀態(tài)：鎖定/非鎖定

某個(gè)線程要更改共享數(shù)據(jù)時(shí)，先將其鎖定，此時(shí)資源的狀態(tài)為“鎖定”，其他線程不能更改；直到該線程釋放資源，將資源的狀態(tài)變成“非鎖定”，其他的線程才能再次鎖定該資源?；コ怄i保證了每次只有一個(gè)線程進(jìn)行寫入操作，從而保證了多線程情況下數(shù)據(jù)的正確性。

互斥鎖有三個(gè)常用步驟：

lock = threading.Lock()  # 取得鎖
lock.acquire()  # 上鎖
lock.release()  # 解鎖

下面讓我們用互斥鎖來解決上面例子的線程安全問題。

import threading
import time
 
num = 0
lock = threading.Lock()  # 取得鎖
def work1(loop):
    global num
    for i in range(loop):
        # 等價(jià)于 num += 1
        lock.acquire()  # 上鎖
        temp = num
        num = temp + 1
        lock.release()  # 解鎖
    print(num)
 
 
def work2(loop):
    global num
    for i in range(loop):
        # 等價(jià)于 num += 1
        lock.acquire()  # 上鎖
        temp = num
        num = temp + 1
        lock.release()  # 解鎖
    print(num)
 
 
if __name__ == '__main__':
    t1 = threading.Thread(target=work1,args=(1000000,))
    t2 = threading.Thread(target=work2, args=(1000000,))
    t1.start()
    t2.start()
 
    while len(threading.enumerate()) != 1:
        time.sleep(1)
    print(num)

輸出：

1945267 # 第一個(gè)子線程結(jié)束后全局變量一共加到這個(gè)數(shù)
2000000 # 第二個(gè)子線程結(jié)束后全局變量一共加到這個(gè)數(shù)
2000000 # 兩個(gè)線程都結(jié)束后，全局變量一共加到這個(gè)數(shù)

1.8 線程池ThreadPoolExecutor

從Python3.2開始，標(biāo)準(zhǔn)庫為我們提供了concurrent.futures模塊，它提供了ThreadPoolExecutor和ProcessPoolExecutor兩個(gè)類，實(shí)現(xiàn)了對(duì)threading和multiprocessing的進(jìn)一步抽象（這里主要關(guān)注線程池），不僅可以幫我們自動(dòng)調(diào)度線程，還可以做到：

主線程可以獲取某一個(gè)線程（或者任務(wù)的）的狀態(tài)，以及返回值。
當(dāng)一個(gè)線程完成的時(shí)候，主線程能夠立即知道。
讓多線程和多進(jìn)程的編碼接口一致。

1.8.1 創(chuàng)建線程池

示例：

from concurrent.futures import ThreadPoolExecutor
import time
 
# 參數(shù)times用來模擬網(wǎng)絡(luò)請(qǐng)求的時(shí)間
def get_html(times):
    time.sleep(times)
    print("get page {}s finished".format(times))
    return times
 
executor = ThreadPoolExecutor(max_workers=2)
# 通過submit函數(shù)提交執(zhí)行的函數(shù)到線程池中，submit函數(shù)立即返回，不阻塞
task1 = executor.submit(get_html, (3))
task2 = executor.submit(get_html, (2))
# done方法用于判定某個(gè)任務(wù)是否完成
print("1: ", task1.done())
# cancel方法用于取消某個(gè)任務(wù),該任務(wù)沒有放入線程池中才能取消成功
print("2: ", task2.cancel())
time.sleep(4)
print("3: ", task1.done())
# result方法可以獲取task的執(zhí)行結(jié)果
print("4: ", task1.result())

輸出：

ThreadPoolExecutor構(gòu)造實(shí)例的時(shí)候，傳入max_workers參數(shù)來設(shè)置線程池中最多能同時(shí)運(yùn)行的線程數(shù)目。
使用submit函數(shù)來提交線程需要執(zhí)行的任務(wù)（函數(shù)名和參數(shù)）到線程池中，并返回該任務(wù)的句柄（類似于文件、畫圖），注意submit()不是阻塞的，而是立即返回。
通過submit函數(shù)返回的任務(wù)句柄，能夠使用done()方法判斷該任務(wù)是否結(jié)束。上面的例子可以看出，由于任務(wù)有2s的延時(shí)，在task1提交后立刻判斷，task1還未完成，而在延時(shí)4s之后判斷，task1就完成了。
使用cancel()方法可以取消提交的任務(wù)，如果任務(wù)已經(jīng)在線程池中運(yùn)行了，就取消不了。這個(gè)例子中，線程池的大小設(shè)置為2，任務(wù)已經(jīng)在運(yùn)行了，所以取消失敗。如果改變線程池的大小為1，那么先提交的是task1，task2還在排隊(duì)等候，這是時(shí)候就可以成功取消。
使用result()方法可以獲取任務(wù)的返回值。查看內(nèi)部代碼，發(fā)現(xiàn)這個(gè)方法是阻塞的。

1.8.2 as_completed

上面雖然提供了判斷任務(wù)是否結(jié)束的方法，但是不能在主線程中一直判斷啊。有時(shí)候我們是得知某個(gè)任務(wù)結(jié)束了，就去獲取結(jié)果，而不是一直判斷每個(gè)任務(wù)有沒有結(jié)束。這是就可以使用as_completed方法一次取出所有任務(wù)的結(jié)果。

from concurrent.futures import ThreadPoolExecutor, as_completed
import time
 
# 參數(shù)times用來模擬網(wǎng)絡(luò)請(qǐng)求的時(shí)間
def get_html(times):
    time.sleep(times)
    print("get page {}s finished".format(times))
    return times
 
executor = ThreadPoolExecutor(max_workers=2)
urls = [3, 2, 4] # 并不是真的url
all_task = [executor.submit(get_html, (url)) for url in urls]
 
for future in as_completed(all_task):
    data = future.result()
    print("in main: get page {}s success".format(data))
 
# 執(zhí)行結(jié)果
# get page 2s finished
# in main: get page 2s success
# get page 3s finished
# in main: get page 3s success
# get page 4s finished
# in main: get page 4s success

as_completed()方法是一個(gè)生成器，在沒有任務(wù)完成的時(shí)候，會(huì)阻塞，在有某個(gè)任務(wù)完成的時(shí)候，會(huì)yield這個(gè)任務(wù)，就能執(zhí)行for循環(huán)下面的語句，然后繼續(xù)阻塞住，循環(huán)到所有的任務(wù)結(jié)束。從結(jié)果也可以看出，先完成的任務(wù)會(huì)先通知主線程。

1.8.3 map

除了上面的as_completed方法，還可以使用executor.map方法，但是有一點(diǎn)不同。

from concurrent.futures import ThreadPoolExecutor
import time
 
# 參數(shù)times用來模擬網(wǎng)絡(luò)請(qǐng)求的時(shí)間
def get_html(times):
    time.sleep(times)
    print("get page {}s finished".format(times))
    return times
 
executor = ThreadPoolExecutor(max_workers=2)
urls = [3, 2, 4] # 并不是真的url
 
for data in executor.map(get_html, urls):
    print("in main: get page {}s success".format(data))
# 執(zhí)行結(jié)果
# get page 2s finished
# get page 3s finished
# in main: get page 3s success
# in main: get page 2s success
# get page 4s finished
# in main: get page 4s success

使用map方法，無需提前使用submit方法，map方法與python標(biāo)準(zhǔn)庫中的map含義相同，都是將序列中的每個(gè)元素都執(zhí)行同一個(gè)函數(shù)。上面的代碼就是對(duì)urls的每個(gè)元素都執(zhí)行get_html函數(shù)，并分配各線程池。可以看到執(zhí)行結(jié)果與上面的as_completed方法的結(jié)果不同，輸出順序和urls列表的順序相同，就算2s的任務(wù)先執(zhí)行完成，也會(huì)先打印出3s的任務(wù)先完成，再打印2s的任務(wù)完成。

1.8.4 wait

wait方法可以讓主線程阻塞，直到滿足設(shè)定的要求。

from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED, FIRST_COMPLETED
import time
 
# 參數(shù)times用來模擬網(wǎng)絡(luò)請(qǐng)求的時(shí)間
def get_html(times):
    time.sleep(times)
    print("get page {}s finished".format(times))
    return times
 
executor = ThreadPoolExecutor(max_workers=2)
urls = [3, 2, 4] # 并不是真的url
all_task = [executor.submit(get_html, (url)) for url in urls]
wait(all_task, return_when=ALL_COMPLETED)
print("main")
# 執(zhí)行結(jié)果 
# get page 2s finished
# get page 3s finished
# get page 4s finished
# main

wait方法接收3個(gè)參數(shù)，等待的任務(wù)序列、超時(shí)時(shí)間以及等待條件。等待條件return_when默認(rèn)為ALL_COMPLETED，表明要等待所有的任務(wù)都結(jié)束?？梢钥吹竭\(yùn)行結(jié)果中，確實(shí)是所有任務(wù)都完成了，主線程才打印出main。等待條件還可以設(shè)置為FIRST_COMPLETED，表示第一個(gè)任務(wù)完成就停止等待。

2 多進(jìn)程實(shí)行多任務(wù)

2.1 多線程的創(chuàng)建方式

創(chuàng)建進(jìn)程的方式和創(chuàng)建線程的方式類似：

實(shí)例化一個(gè)multiprocessing.Process的對(duì)象，并傳入一個(gè)初始化函數(shù)對(duì)象（initial function )作為新建進(jìn)程執(zhí)行入口；
繼承multiprocessing.Process，并重寫run函數(shù)；

2.1.1 方式1

在開始之前，我們要知道什么是進(jìn)程。道理很簡(jiǎn)單，你平時(shí)電腦打開QQ客戶端，就是一個(gè)進(jìn)程。再打開一個(gè)QQ客戶端，又是一個(gè)進(jìn)程。那么，在python中如何用一篇代碼就可以開啟幾個(gè)進(jìn)程呢？通過一個(gè)簡(jiǎn)單的例子來演示：

import multiprocessing
import time
 
 
def task1():
    while True:
        time.sleep(1)
        print("I am task1")
 
def task2():
    while True:
        time.sleep(2)
        print("I am task2")
 
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task1)  # multiprocessing.Process創(chuàng)建了子進(jìn)程對(duì)象p1
    p2 = multiprocessing.Process(target=task2)  # multiprocessing.Process創(chuàng)建了子進(jìn)程對(duì)象p2
    p1.start()  # 子進(jìn)程p1啟動(dòng)
    p2.start()  # 子進(jìn)程p2啟動(dòng)
    print("I am main task")  # 這是主進(jìn)程的任務(wù)

輸出：

可以看到子進(jìn)程對(duì)象是由multiprocessing模塊中的Process類創(chuàng)建的。除了p1，p2兩個(gè)被創(chuàng)建的子進(jìn)程外。當(dāng)然還有主進(jìn)程。主進(jìn)程就是我們從頭到尾的代碼，包括子進(jìn)程也是由主進(jìn)程創(chuàng)建的。

注意的點(diǎn)有：

（1）首先解釋一下并發(fā)：并發(fā)就是當(dāng)任務(wù)數(shù)大于cpu核數(shù)時(shí)，通過操作系統(tǒng)的各種任務(wù)調(diào)度算法，實(shí)現(xiàn)多個(gè)任務(wù)“一起”執(zhí)行。（實(shí)際上總有一些任務(wù)不在執(zhí)行，因?yàn)榍袚Q任務(wù)相當(dāng)快，看上去想同時(shí)執(zhí)行而已。)

（2）當(dāng)是并發(fā)的情況下，子進(jìn)程與主進(jìn)程的運(yùn)行都是沒有順序的，CPU會(huì)采用時(shí)間片輪詢的方式，哪個(gè)程序先要運(yùn)行就先運(yùn)行哪個(gè)。

（3）主進(jìn)程會(huì)默認(rèn)等待所有子進(jìn)程執(zhí)行完畢后，它才會(huì)退出。所以在上面的例子中，p1，p2子進(jìn)程是死循環(huán)進(jìn)程，主進(jìn)程的最后一句代碼print("I am main task")雖然運(yùn)行完了，但是主進(jìn)程并不會(huì)關(guān)閉，他會(huì)一直等待著子進(jìn)程。

（4）主進(jìn)程默認(rèn)創(chuàng)建的是非守護(hù)進(jìn)程。注意，結(jié)合3.和5.看。

（5）但是！如果子進(jìn)程是守護(hù)進(jìn)程的話，那么主進(jìn)程運(yùn)行完最后一句代碼后，主進(jìn)程會(huì)直接關(guān)閉，不管你子進(jìn)程運(yùn)行完了沒有！

2.1.2 方式2

from multiprocessing import Process  
import os, time
 
class CustomProcess(Process):
    def __init__(self, p_name, target=None):
        # step 1: call base __init__ function()
        super(CustomProcess, self).__init__(name=p_name, target=target, args=(p_name,))
 
    def run(self):
        # step 2:
        # time.sleep(0.1)
        print("Custom Process name: %s, pid: %s "%(self.name, os.getpid()))
 
if __name__ == '__main__':
    p1 = CustomProcess("process_1")
    p1.start()
    p1.join()
    print("subprocess pid: %s"%p1.pid)
    print("current process pid: %s" % os.getpid())

輸出：

這里可以思考一下，如果像多線程一樣，存在一個(gè)全局的變量share_data，不同進(jìn)程同時(shí)訪問share_data會(huì)有問題嗎？

由于每一個(gè)進(jìn)程擁有獨(dú)立的內(nèi)存地址空間且互相隔離，因此不同進(jìn)程看到的share_data是不同的、分別位于不同的地址空間，同時(shí)訪問不會(huì)有問題。這里需要注意一下。

2.2 守護(hù)進(jìn)程

測(cè)試下：

import multiprocessing
import time
 
 
def task1():
    while True:
        time.sleep(1)
        print("I am task1")
 
def task2():
    while True:
        time.sleep(2)
        print("I am task2")
 
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task1)
    p2 = multiprocessing.Process(target=task2)
    p1.daemon = True  # 設(shè)置p1子進(jìn)程為守護(hù)進(jìn)程
    p2.daemon = True  # 設(shè)置p2子進(jìn)程為守護(hù)進(jìn)程
    p1.start()
    p2.start()
    print("I am main task")

輸出：

I am main task

輸出結(jié)果是不是有點(diǎn)奇怪。為什么p1,p2子進(jìn)程都沒有輸出的？

讓我們來整理一下思路：

創(chuàng)建p1,p2子進(jìn)程
設(shè)置p1,p2子進(jìn)程為守護(hù)進(jìn)程
p1,p2子進(jìn)程開啟
p1,p2子進(jìn)程代碼里面都有休眠時(shí)間，所以cpu為了不浪費(fèi)時(shí)間，先做主進(jìn)程后續(xù)的代碼。
執(zhí)行主進(jìn)程后續(xù)的代碼，print("I am main task")
主進(jìn)程后續(xù)的代碼執(zhí)行完成了，所以剩下的子進(jìn)程是守護(hù)進(jìn)程的，全都要關(guān)閉了。但是，如果主進(jìn)程的代碼執(zhí)行完了，有兩個(gè)子進(jìn)程，一個(gè)是守護(hù)的，一個(gè)非守護(hù)的，怎么辦呢？其實(shí)，他會(huì)等待非守護(hù)的那個(gè)子進(jìn)程運(yùn)行完，然后三個(gè)進(jìn)程一起關(guān)閉。
p1,p2還在休眠時(shí)間內(nèi)就被終結(jié)生命了，所以什么輸出都沒有。

例如，把P1設(shè)為非守護(hù)進(jìn)程：

import multiprocessing
import time
 
 
def task1():
    i = 1
    while i  5:
        time.sleep(1)
        i += 1
        print("I am task1")
 
def task2():
    while True:
        time.sleep(2)
        print("I am task2")
 
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task1)
    p2 = multiprocessing.Process(target=task2)
    p2.daemon = True  # 設(shè)置p2子進(jìn)程為守護(hù)進(jìn)程
    p1.start()
    p2.start()
    print("I am main task")

輸出：

里面涉及到兩個(gè)知識(shí)點(diǎn)：

（1）當(dāng)主進(jìn)程結(jié)束后，會(huì)發(fā)一個(gè)消息給子進(jìn)程(守護(hù)進(jìn)程)，守護(hù)進(jìn)程收到消息，則立即結(jié)束

（2）CPU是按照時(shí)間片輪詢的方式來運(yùn)行多進(jìn)程的。哪個(gè)合適的哪個(gè)運(yùn)行，如果你的子進(jìn)程里都有time.sleep。那我CPU為了不浪費(fèi)資源，肯定先去干點(diǎn)其他的事情啊。

那么，守護(hù)進(jìn)程隨時(shí)會(huì)被中斷，他的存在意義在哪里的？

其實(shí)，守護(hù)進(jìn)程主要用來做與業(yè)務(wù)無關(guān)的任務(wù)，無關(guān)緊要的任務(wù)，可有可無的任務(wù)，比如內(nèi)存垃圾回收，某些方法的執(zhí)行時(shí)間的計(jì)時(shí)等。

2.3 創(chuàng)建的子進(jìn)程要傳入?yún)?shù)

import multiprocessing
 
 
def task(a,b,*args,**kwargs):
    print("a")
    print("b")
    print(args)
    print(kwargs)
 
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task,args=(1,2,3,4,5,6),kwargs={"name":"chichung","age":23})
    p1.start()
    print("主進(jìn)程已經(jīng)運(yùn)行完最后一行代碼啦")

輸出：

子進(jìn)程要運(yùn)行的函數(shù)需要傳入變量a,b,一個(gè)元組，一個(gè)字典。我們創(chuàng)建子進(jìn)程的時(shí)候，變量a,b要放進(jìn)元組里面，task函數(shù)取的時(shí)候會(huì)把前兩個(gè)取出來，分別賦值給a,b了。

2.4 子進(jìn)程幾個(gè)常用的方法

p.start	開始執(zhí)行子線程
p.name	查看子進(jìn)程的名稱
p.pid	查看子進(jìn)程的id
p.is_alive	判斷子進(jìn)程是否存活
p.join(timeout)	阻塞主進(jìn)程，當(dāng)子進(jìn)程p運(yùn)行完畢后，再解開阻塞，讓主進(jìn)程運(yùn)行后續(xù)的代碼如果timeout=2，就是阻塞主進(jìn)程2s，這2s內(nèi)主進(jìn)程不能運(yùn)行后續(xù)的代碼。過了2s后，就算子進(jìn)程沒有運(yùn)行完畢，主進(jìn)程也能運(yùn)行后續(xù)的代碼
p.terminate	終止子進(jìn)程p的運(yùn)行

import multiprocessing
 
def task(a,b,*args,**kwargs):
    print("a")
    print("b")
    print(args)
    print(kwargs)
 
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task,args=(1,2,3,4,5,6),kwargs={"name":"chichung","age":23})
    p1.start()
    print("p1子進(jìn)程的名字：%s" % p1.name)
    print("p1子進(jìn)程的id：%d" % p1.pid)
    p1.join()
    print(p1.is_alive())

輸出：

2.5 進(jìn)程之間是不可以共享全局變量

進(jìn)程之間是不可以共享全局變量的，即使子進(jìn)程與主進(jìn)程。道理很簡(jiǎn)單，一個(gè)新的進(jìn)程，其實(shí)就是占用一個(gè)新的內(nèi)存空間，不同的內(nèi)存空間，里面的變量肯定不能夠共享的。實(shí)驗(yàn)證明如下：

示例一：

import multiprocessing
 
g_list = [123]
 
def task1():
    g_list.append("task1")
    print(g_list)
 
def task2():
    g_list.append("task2")
    print(g_list)
 
def main_process():
    g_list.append("main_processs")
    print(g_list)
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task1)
    p2 = multiprocessing.Process(target=task2)
    p1.start()
    p2.start()
    main_process()
    print("11111: ", g_list)

輸出：

[123, 'main_processs']
11111: [123, 'main_processs']
[123, 'task1']
[123, 'task2']

示例二：

import multiprocessing
import time
 
 
def task1(loop):
    global num
    for i in range(loop):
        # 等價(jià)于 num += 1
        temp = num
        num = temp + 1
    print(num)
    print("I am task1")
 
def task2(loop):
    global num
    for i in range(loop):
        # 等價(jià)于 num += 1
        temp = num
        num = temp + 1
    print(num)
    print("I am task2")
 
 
if __name__ == '__main__':
    p1 = multiprocessing.Process(target=task1, args=(100000,)  # multiprocessing.Process創(chuàng)建了子進(jìn)程對(duì)象p1
    p2 = multiprocessing.Process(target=task2, args=(100000,)  # multiprocessing.Process創(chuàng)建了子進(jìn)程對(duì)象p2
    p1.start()  # 子進(jìn)程p1啟動(dòng)
    p2.start()  # 子進(jìn)程p2啟動(dòng)
    print("I am main task")  # 這是主進(jìn)程的任務(wù)

輸出：

2.6 python進(jìn)程池：multiprocessing.pool

進(jìn)程池可以理解成一個(gè)隊(duì)列，該隊(duì)列可以容易指定數(shù)量的子進(jìn)程，當(dāng)隊(duì)列被任務(wù)占滿之后，后續(xù)新增的任務(wù)就得排隊(duì)，直到舊的進(jìn)程有任務(wù)執(zhí)行完空余出來，才會(huì)去執(zhí)行新的任務(wù)。

在利用Python進(jìn)行系統(tǒng)管理的時(shí)候，特別是同時(shí)操作多個(gè)文件目錄，或者遠(yuǎn)程控制多臺(tái)主機(jī)，并行操作可以節(jié)約大量的時(shí)間。當(dāng)被操作對(duì)象數(shù)目不大時(shí)，可以直接利用multiprocessing中的Process動(dòng)態(tài)成生多個(gè)進(jìn)程，十幾個(gè)還好，但如果是上百個(gè)，上千個(gè)目標(biāo)，手動(dòng)的去限制進(jìn)程數(shù)量卻又太過繁瑣，此時(shí)可以發(fā)揮進(jìn)程池的功效。

Pool可以提供指定數(shù)量的進(jìn)程供用戶調(diào)用，當(dāng)有新的請(qǐng)求提交到pool中時(shí)，如果池還沒有滿，那么就會(huì)創(chuàng)建一個(gè)新的進(jìn)程用來執(zhí)行該請(qǐng)求；但如果池中的進(jìn)程數(shù)已經(jīng)達(dá)到規(guī)定最大值，那么該請(qǐng)求就會(huì)等待，直到池中有進(jìn)程結(jié)束，才會(huì)創(chuàng)建新的進(jìn)程來它。

2.6.1 使用進(jìn)程池（非阻塞）

#coding: utf-8
import multiprocessing
import time
 
def func(msg):
    print("msg:", msg)
    time.sleep(3)
    print("end")
 
if __name__ == "__main__":
    pool = multiprocessing.Pool(processes = 3) # 設(shè)定進(jìn)程的數(shù)量為3
    for i in range(4):
        msg = "hello %d" %(i)
        pool.apply_async(func, (msg, ))   #維持執(zhí)行的進(jìn)程總數(shù)為processes，當(dāng)一個(gè)進(jìn)程執(zhí)行完畢后會(huì)添加新的進(jìn)程進(jìn)去
 
    print("Mark~ Mark~ Mark~~~~~~~~~~~~~~~~~~~~~~")
    pool.close()
    pool.join()   #調(diào)用join之前，先調(diào)用close函數(shù)，否則會(huì)出錯(cuò)。執(zhí)行完close后不會(huì)有新的進(jìn)程加入到pool,join函數(shù)等待所有子進(jìn)程結(jié)束
    print("Sub-process(es) done.")

輸出：

函數(shù)解釋：

apply_async(func[, args[, kwds[, callback]]]) 它是非阻塞，apply(func[, args[, kwds]])是阻塞的（理解區(qū)別，看例1例2結(jié)果區(qū)別）
close() 關(guān)閉pool，使其不在接受新的任務(wù)。
terminate() 結(jié)束工作進(jìn)程，不在處理未完成的任務(wù)。
join() 主進(jìn)程阻塞，等待子進(jìn)程的退出， join方法要在close或terminate之后使用。

apply(), apply_async()：

apply(): 阻塞主進(jìn)程, 并且一個(gè)一個(gè)按順序地執(zhí)行子進(jìn)程, 等到全部子進(jìn)程都執(zhí)行完畢后 ,繼續(xù)執(zhí)行 apply()后面主進(jìn)程的代碼
apply_async() 非阻塞異步的, 他不會(huì)等待子進(jìn)程執(zhí)行完畢, 主進(jìn)程會(huì)繼續(xù)執(zhí)行, 他會(huì)根據(jù)系統(tǒng)調(diào)度來進(jìn)行進(jìn)程切換

執(zhí)行說明：創(chuàng)建一個(gè)進(jìn)程池pool，并設(shè)定進(jìn)程的數(shù)量為3，xrange(4)會(huì)相繼產(chǎn)生四個(gè)對(duì)象[0, 1, 2, 4]，四個(gè)對(duì)象被提交到pool中，因pool指定進(jìn)程數(shù)為3，所以0、1、2會(huì)直接送到進(jìn)程中執(zhí)行，當(dāng)其中一個(gè)執(zhí)行完事后才空出一個(gè)進(jìn)程處理對(duì)象3，所以會(huì)出現(xiàn)輸出“msg: hello 3”出現(xiàn)在"end"后。因?yàn)闉榉亲枞?，主函?shù)會(huì)自己執(zhí)行自個(gè)的，不搭理進(jìn)程的執(zhí)行，所以運(yùn)行完for循環(huán)后直接輸出“mMsg: hark~ Mark~ Mark~~~~~~~~~~~~~~~~~~~~~~”，主程序在pool.join（）處等待各個(gè)進(jìn)程的結(jié)束。

2.6.2 使用進(jìn)程池（阻塞）

#coding: utf-8
import multiprocessing
import time
 
def func(msg):
    print("msg:", msg)
    time.sleep(3)
    print("end")
 
if __name__ == "__main__":
    pool = multiprocessing.Pool(processes = 3) # 設(shè)定進(jìn)程的數(shù)量為3
    for i in range(4):
        msg = "hello %d" %(i)
        pool.apply(func, (msg, ))   #維持執(zhí)行的進(jìn)程總數(shù)為processes，當(dāng)一個(gè)進(jìn)程執(zhí)行完畢后會(huì)添加新的進(jìn)程進(jìn)去
 
    print("Mark~ Mark~ Mark~~~~~~~~~~~~~~~~~~~~~~")
    pool.close()
    pool.join()   #調(diào)用join之前，先調(diào)用close函數(shù)，否則會(huì)出錯(cuò)。執(zhí)行完close后不會(huì)有新的進(jìn)程加入到pool,join函數(shù)等待所有子進(jìn)程結(jié)束
    print("Sub-process(es) done.")

輸出：

2.6.3 使用進(jìn)程池，并關(guān)注結(jié)果

import multiprocessing
import time
 
def func(msg):
    print("msg:", msg)
    time.sleep(3)
    print("end")
    return "done" + msg
 
if __name__ == "__main__":
    pool = multiprocessing.Pool(processes=4)
    result = []
    for i in range(3):
        msg = "hello %d" %(i)
        result.append(pool.apply_async(func, (msg, )))
    pool.close()
    pool.join()
    for res in result:
        print(":::", res.get())
    print("Sub-process(es) done.")

輸出：

注：get()函數(shù)得出每個(gè)返回結(jié)果的值

3 python多線程與多進(jìn)程比較

先來看兩個(gè)例子：

（1）示例一，多線程與單線程，開啟兩個(gè)python線程分別做一億次加一操作，和單獨(dú)使用一個(gè)線程做一億次加一操作：

import threading
import time
 
def tstart(arg):
    var = 0
    for i in range(100000000):
        var += 1
    print(arg, var)
 
if __name__ == '__main__':
    t1 = threading.Thread(target=tstart, args=('This is thread 1',))
    t2 = threading.Thread(target=tstart, args=('This is thread 2',))
    start_time = time.time()
    t1.start()
    t2.start()
    t1.join()
    t2.join()
    print("Two thread cost time: %s" % (time.time() - start_time))
    start_time = time.time()
    tstart("This is thread 0")
    print("Main thread cost time: %s" % (time.time() - start_time))

輸出：

上面的例子如果只開啟t1和t2兩個(gè)線程中的一個(gè)，那么運(yùn)行時(shí)間和主線程基本一致。

（2）示例二，使用兩個(gè)進(jìn)程

from multiprocessing import Process  
import os, time
 
def pstart(arg):
    var = 0
    for i in range(100000000):
        var += 1
    print(arg, var)
 
if __name__ == '__main__':
    p1 = Process(target = pstart, args = ("1", ))
    p2 = Process(target = pstart, args = ("2", ))
    start_time = time.time()
    p1.start()
    p2.start()
    p1.join()
    p2.join()
    print("Two process cost time: %s" % (time.time() - start_time))
    start_time = time.time()
    pstart("0")
    print("Current process cost time: %s" % (time.time() - start_time))

輸出：

對(duì)比分析：

雙進(jìn)程并行執(zhí)行和單進(jìn)程執(zhí)行相同的運(yùn)算代碼，耗時(shí)基本相同，雙進(jìn)程耗時(shí)會(huì)稍微多一些，可能的原因是進(jìn)程創(chuàng)建和銷毀會(huì)進(jìn)行系統(tǒng)調(diào)用，造成額外的時(shí)間開銷。

但是對(duì)于python線程，雙線程并行執(zhí)行耗時(shí)比單線程要高的多，效率相差近10倍。如果將兩個(gè)并行線程改成串行執(zhí)行，即：

import threading
import time
 
def tstart(arg):
    var = 0
    for i in range(100000000):
        var += 1
    print(arg, var)
 
if __name__ == '__main__':
    t1 = threading.Thread(target=tstart, args=('This is thread 1',))
    t2 = threading.Thread(target=tstart, args=('This is thread 2',))
    start_time = time.time()
    t1.start()
    t1.join()
    print("thread1 cost time: %s" % (time.time() - start_time))
    start_time = time.time()
    t2.start()
    t2.join()
    print("thread2 cost time: %s" % (time.time() - start_time))
    start_time = time.time()
    tstart("This is thread 0")
    print("Main thread cost time: %s" % (time.time() - start_time))

輸出：

可以看到三個(gè)線程串行執(zhí)行，每一個(gè)執(zhí)行的時(shí)間基本相同。

本質(zhì)原因雙線程是并發(fā)執(zhí)行的，而不是真正的并行執(zhí)行。原因就在于GIL鎖。

4 GIL鎖

提起python多線程就不得不提一下GIL(Global Interpreter Lock 全局解釋器鎖)，這是目前占統(tǒng)治地位的python解釋器CPython中為了保證數(shù)據(jù)安全所實(shí)現(xiàn)的一種鎖。不管進(jìn)程中有多少線程，只有拿到了GIL鎖的線程才可以在CPU上運(yùn)行，即使是多核處理器。對(duì)一個(gè)進(jìn)程而言，不管有多少線程，任一時(shí)刻，只會(huì)有一個(gè)線程在執(zhí)行。對(duì)于CPU密集型的線程，其效率不僅僅不高，反而有可能比較低。python多線程比較適用于IO密集型的程序。對(duì)于的確需要并行運(yùn)行的程序，可以考慮多進(jìn)程。

多線程對(duì)鎖的爭(zhēng)奪，CPU對(duì)線程的調(diào)度，線程之間的切換等均會(huì)有時(shí)間開銷。

5 線程和進(jìn)程比較

5.1 線程和進(jìn)程的區(qū)別

下面簡(jiǎn)單的比較一下線程與進(jìn)程

進(jìn)程是資源分配的基本單位，線程是CPU執(zhí)行和調(diào)度的基本單位；
通信/同步方式：
- 進(jìn)程：
  - 通信方式：管道，F(xiàn)IFO，消息隊(duì)列，信號(hào)，共享內(nèi)存，socket，stream流；
  - 同步方式：PV信號(hào)量，管程
- 線程：
  - 同步方式：互斥鎖，遞歸鎖，條件變量，信號(hào)量
  - 通信方式：位于同一進(jìn)程的線程共享進(jìn)程資源，因此線程間沒有類似于進(jìn)程間用于數(shù)據(jù)傳遞的通信方式，線程間的通信主要是用于線程同步。
CPU上真正執(zhí)行的是線程，線程比進(jìn)程輕量，其切換和調(diào)度代價(jià)比進(jìn)程要??；
線程間對(duì)于共享的進(jìn)程數(shù)據(jù)需要考慮線程安全問題，由于進(jìn)程之間是隔離的，擁有獨(dú)立的內(nèi)存空間資源，相對(duì)比較安全，只能通過上面列出的IPC(Inter-Process Communication)進(jìn)行數(shù)據(jù)傳輸；
系統(tǒng)有一個(gè)個(gè)進(jìn)程組成，每個(gè)進(jìn)程包含代碼段、數(shù)據(jù)段、堆空間和棧空間，以及操作系統(tǒng)共享部分，有等待，就緒和運(yùn)行三種狀態(tài)；
一個(gè)進(jìn)程可以包含多個(gè)線程，線程之間共享進(jìn)程的資源（文件描述符、全局變量、堆空間等），寄存器變量和?？臻g等是線程私有的；
操作系統(tǒng)中一個(gè)進(jìn)程掛掉不會(huì)影響其他進(jìn)程，如果一個(gè)進(jìn)程中的某個(gè)線程掛掉而且OS對(duì)線程的支持是多對(duì)一模型，那么會(huì)導(dǎo)致當(dāng)前進(jìn)程掛掉；
如果CPU和系統(tǒng)支持多線程與多進(jìn)程，多個(gè)進(jìn)程并行執(zhí)行的同時(shí)，每個(gè)進(jìn)程中的線程也可以并行執(zhí)行，這樣才能最大限度的榨取硬件的性能；

5.2 線程和進(jìn)程的上下文切換

進(jìn)程切換過程切換牽涉到非常多的東西，寄存器內(nèi)容保存到任務(wù)狀態(tài)段TSS，切換頁表，堆棧等。簡(jiǎn)單來說可以分為下面兩步：

頁全局目錄切換，使CPU到新進(jìn)程的線性地址空間尋址；
切換內(nèi)核態(tài)堆棧和硬件上下文，硬件上下文包含CPU寄存器的內(nèi)容，存放在TSS中；

線程運(yùn)行于進(jìn)程地址空間，切換過程不涉及到空間的變換，只牽涉到第二步；

5.3 使用多線程還是多進(jìn)程？

CPU密集型：程序需要占用CPU進(jìn)行大量的運(yùn)算和數(shù)據(jù)處理；適合多進(jìn)程；
I/O密集型：程序中需要頻繁的進(jìn)行I/O操作；例如網(wǎng)絡(luò)中socket數(shù)據(jù)傳輸和讀取等；適合多線程

由于python多線程并不是并行執(zhí)行，因此較適合與I/O密集型程序，多進(jìn)程并行執(zhí)行適用于CPU密集型程序；

python多線程實(shí)現(xiàn)多任務(wù)：https://www.cnblogs.com/chichung/p/9566734.html

python通過多進(jìn)程實(shí)行多任務(wù):https://www.cnblogs.com/chichung/p/9532962.html

python多線程與多進(jìn)程及其區(qū)別：https://www.cnblogs.com/yssjun/p/11302500.html

python進(jìn)程池：multiprocessing.pool：https://www.cnblogs.com/kaituorensheng/p/4465768.html

到此這篇關(guān)于python 多線程實(shí)現(xiàn)多任務(wù)的方法示例的文章就介紹到這了,更多相關(guān)python 多線程實(shí)現(xiàn)多任務(wù)的方法示例內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python非標(biāo)準(zhǔn)時(shí)間的轉(zhuǎn)換
ROS系統(tǒng)將python包編譯為可執(zhí)行文件的簡(jiǎn)單步驟
Python中rapidjson參數(shù)校驗(yàn)實(shí)現(xiàn)
Python中scrapy下載保存圖片的示例
Python動(dòng)態(tài)規(guī)劃實(shí)現(xiàn)虛擬機(jī)部署的算法思想
python方差檢驗(yàn)的含義及用法
Python函數(shù)實(shí)現(xiàn)學(xué)員管理系統(tǒng)
python調(diào)試模式無響應(yīng)解決案例

標(biāo)簽：上饒西寧潮州佳木斯珠海盤錦宜昌湖北

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《python 多線程實(shí)現(xiàn)多任務(wù)的方法示例》，本文關(guān)鍵詞 python,多,線程,實(shí)現(xiàn),多任務(wù),；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。