Go被設(shè)計(jì)為一種后臺(tái)語(yǔ)言,它通常也被用于后端程序中。服務(wù)端程序是GO語(yǔ)言最常見(jiàn)的軟件產(chǎn)品。在這我要解決的問(wèn)題是:如何干凈利落地升級(jí)正在運(yùn)行的服務(wù)端程序。
目標(biāo):
- 不關(guān)閉現(xiàn)有連接:例如我們不希望關(guān)掉已部署的運(yùn)行中的程序。但又想不受限制地隨時(shí)升級(jí)服務(wù)。
- socket連接要隨時(shí)響應(yīng)用戶請(qǐng)求:任何時(shí)刻socket的關(guān)閉可能使用戶返回'連接被拒絕'的消息,而這是不可取的。
- 新的進(jìn)程要能夠啟動(dòng)并替換掉舊的。
原理
在基于Unix的操作系統(tǒng)中,signal(信號(hào))是與長(zhǎng)時(shí)間運(yùn)行的進(jìn)程交互的常用方法.
- SIGTERM: 優(yōu)雅地停止進(jìn)程
- SIGHUP: 重啟/重新加載進(jìn)程 (例如: nginx, sshd, apache)
如果收到SIGHUP信號(hào),優(yōu)雅地重啟進(jìn)程需要以下幾個(gè)步驟:
- 服務(wù)器要拒絕新的連接請(qǐng)求,但要保持已有的連接。
- 啟用新版本的進(jìn)程
- 將socket“交給”新進(jìn)程,新進(jìn)程開(kāi)始接受新連接請(qǐng)求
- 舊進(jìn)程處理完畢后立即停止。
停止接受連接請(qǐng)求
服務(wù)器程序的共同點(diǎn):持有一個(gè)死循環(huán)來(lái)接受連接請(qǐng)求:
復(fù)制代碼 代碼如下:
for {
conn, err := listener.Accept()
// Handle connection
}
跳出這個(gè)循環(huán)的最簡(jiǎn)單方式是在socket監(jiān)聽(tīng)器上設(shè)置一個(gè)超時(shí),當(dāng)調(diào)用listener.SetTimeout(time.Now())后,listener.Accept()會(huì)立即返回一個(gè)timeout err,你可以捕獲并處理:
復(fù)制代碼 代碼如下:
for {
conn, err := listener.Accept()
if err != nil {
if nerr, ok := err.(net.Err); ok nerr.Timeout() {
fmt.Println(“Stop accepting connections”)
return
}
}
}
注意這個(gè)操作與關(guān)閉listener有所不同。這樣進(jìn)程仍在監(jiān)聽(tīng)服務(wù)器端口,但連接請(qǐng)求會(huì)被操作系統(tǒng)的網(wǎng)絡(luò)棧排隊(duì),等待一個(gè)進(jìn)程接受它們。
啟動(dòng)新進(jìn)程
Go提供了一個(gè)原始類型ForkExec來(lái)產(chǎn)生新進(jìn)程.你可以與這個(gè)新進(jìn)程共享某些消息,例如文件描述符或環(huán)境參數(shù)。
復(fù)制代碼 代碼如下:
execSpec := syscall.ProcAttr{
Env: os.Environ(),
Files: []uintptr{os.Stdin.Fd(), os.Stdout.Fd(), os.Stderr.Fd()},
}
fork, err := syscall.ForkExec(os.Args[0], os.Args, execSpec)
[…]
你會(huì)發(fā)現(xiàn)這個(gè)進(jìn)程使用完全相同的參數(shù)os.Args啟動(dòng)了一個(gè)新進(jìn)程。
發(fā)送socket到子進(jìn)程并恢復(fù)它
正如你先前看到的,你可以將文件描述符傳遞到新進(jìn)程,這需要一些UNIX魔法(一切都是文件),我們可以把socket發(fā)送到新進(jìn)程中,這樣新進(jìn)程就能夠使用它并接收及等待新的連接。
但fork-execed進(jìn)程需要知道它必須從文件中得到socket而不是新建一個(gè)(有些興許已經(jīng)在使用了,因?yàn)槲覀冞€沒(méi)斷開(kāi)已有的監(jiān)聽(tīng))。你可以按任何你希望的方法來(lái),最常見(jiàn)的是通過(guò)環(huán)境變量或命令行標(biāo)志。
復(fù)制代碼 代碼如下:
listenerFile, err := listener.File()
if err != nil {
log.Fatalln("Fail to get socket file descriptor:", err)
}
listenerFd := listenerFile.Fd()
// Set a flag for the new process start process
os.Setenv("_GRACEFUL_RESTART", "true")
execSpec := syscall.ProcAttr{
Env: os.Environ(),
Files: []uintptr{os.Stdin.Fd(), os.Stdout.Fd(), os.Stderr.Fd(), listenerFd},
}
// Fork exec the new version of your server
fork, err := syscall.ForkExec(os.Args[0], os.Args, execSpec)
然后在程序的開(kāi)始處:
復(fù)制代碼 代碼如下:
var listener *net.TCPListener
if os.Getenv("_GRACEFUL_RESTART") == "true" {
// The second argument should be the filename of the file descriptor
// however, a socker is not a named file but we should fit the interface
// of the os.NewFile function.
file := os.NewFile(3, "")
listener, err := net.FileListener(file)
if err != nil {
// handle
}
var bool ok
listener, ok = listener.(*net.TCPListener)
if !ok {
// handle
}
} else {
listener, err = newListenerWithPort(12345)
}
文件描述沒(méi)有被隨機(jī)的選擇為3,這是因?yàn)閡intptr的切片已經(jīng)發(fā)送了fork,監(jiān)聽(tīng)獲取了索引3。留意隱式聲明問(wèn)題。
最后一步,等待舊服務(wù)連接停止
到此為止,就這樣,我們已經(jīng)將其傳到另一個(gè)正在正確運(yùn)行的進(jìn)程,對(duì)于舊服務(wù)器的最后操作是等其連接關(guān)閉。由于標(biāo)準(zhǔn)庫(kù)里提供了sync.WaitGroup結(jié)構(gòu)體,用go實(shí)現(xiàn)這個(gè)功能很簡(jiǎn)單。
每次接收一個(gè)連接,在WaitGroup上加1,然后,我們?cè)谒瓿蓵r(shí)將計(jì)數(shù)器減一:
復(fù)制代碼 代碼如下:
for {
conn, err := listener.Accept()
wg.Add(1)
go func() {
handle(conn)
wg.Done()
}()
}
至于等待連接的結(jié)束,你僅需要wg.Wait(),因?yàn)闆](méi)有新的連接,我們等待wg.Done()已經(jīng)被所有正在運(yùn)行的handler調(diào)用。
Bonus: 不要無(wú)限制等待,給定限量的時(shí)間
復(fù)制代碼 代碼如下:
timeout := time.NewTimer(time.Minute)
wait := make(chan struct{})
go func() {
wg.Wait()
wait - struct{}{}
}()
select {
case -timeout.C:
return WaitTimeoutError
case -wait:
return nil
}
完整的示例
這篇文章中的代碼片段都是從這個(gè)完整的示例中提取的:https://github.com/Scalingo/go-graceful-restart-example
結(jié)論
socket傳遞配合ForkExec使用確實(shí)是一種無(wú)干擾更新進(jìn)程的有效方式,在最大時(shí)間上,新的連接會(huì)等待幾毫秒——用于服務(wù)的啟動(dòng)和恢復(fù)socket,但這個(gè)時(shí)間很短。
您可能感興趣的文章:- Go語(yǔ)言基于Socket編寫(xiě)服務(wù)器端與客戶端通信的實(shí)例
- Go語(yǔ)言實(shí)現(xiàn)socket實(shí)例
- 服務(wù)器端Go程序?qū)﹂L(zhǎng)短鏈接的處理及運(yùn)行參數(shù)的保存
- Centos5.4+Nginx-0.8.50+UWSGI-0.9.6.2+Django-1.2.3搭建高性能WEB服務(wù)器
- 在Apache服務(wù)器上同時(shí)運(yùn)行多個(gè)Django程序的方法
- 編寫(xiě)Go程序?qū)ginx服務(wù)器進(jìn)行性能測(cè)試的方法
- C++、python和go語(yǔ)言實(shí)現(xiàn)的簡(jiǎn)單客戶端服務(wù)器代碼示例
- go語(yǔ)言實(shí)現(xiàn)一個(gè)最簡(jiǎn)單的http文件服務(wù)器實(shí)例
- Go語(yǔ)言Echo服務(wù)器的方法
- Go語(yǔ)言實(shí)現(xiàn)簡(jiǎn)單Web服務(wù)器的方法
- Go語(yǔ)言服務(wù)器開(kāi)發(fā)實(shí)現(xiàn)最簡(jiǎn)單HTTP的GET與POST接口
- Go語(yǔ)言服務(wù)器開(kāi)發(fā)之客戶端向服務(wù)器發(fā)送數(shù)據(jù)并接收返回?cái)?shù)據(jù)的方法
- 剖析Go編寫(xiě)的Socket服務(wù)器模塊解耦及基礎(chǔ)模塊的設(shè)計(jì)