來做一個(gè)快速測(cè)驗(yàn)-以下代碼輸出什么?
vals := make([]int, 5)
for i := 0; i 5; i++ {
vals = append(vals, i)
}
fmt.Println(vals)
Run it on the Go Playground → https://play.golang.org/p/7PgUqBdZ6Z
如果猜到了[0 0 0 0 0 0 1 2 3 4]
,那么你是正確的。 等一下為什么不是[0 1 2 3 4]
?
如果答錯(cuò)了,也不擔(dān)心。從其他語言過渡到Go時(shí),這是一個(gè)相當(dāng)普遍的錯(cuò)誤,在本文中,我們將介紹為什么輸出不符合你的預(yù)期以及如何利用Go的細(xì)微差別來提高代碼效率。
Slices vs Arrays
在Go中,既有數(shù)組又有切片。切片和數(shù)組之間有很多區(qū)別,數(shù)組的長度是其類型的一部分,所以數(shù)組不能改變大小,而切片可以具有動(dòng)態(tài)大小,因?yàn)榍衅菙?shù)組的包裝。這是什么意思?假設(shè)我們有一個(gè)數(shù)組var a [10]int
。此數(shù)組的大小固定,無法更改。如果我們調(diào)用len(a)
,它將始終返回10,因?yàn)樵摯笮?0是該類型[10]int
的一部分。如果你在數(shù)組中需要10個(gè)以上的項(xiàng),則必須創(chuàng)建一個(gè)類型完全不同的新對(duì)象,例如var b [11] int,然后將所有值從a復(fù)制到b。
雖然在特定情況下使用具有固定大小的數(shù)組很有價(jià)值,但通常來說這并不是開發(fā)人員想要的。相反,我們希望使用與Go中的數(shù)組類似的東西,但是具有隨著時(shí)間增加長度的能力。一種簡(jiǎn)單的方法是創(chuàng)建一個(gè)比需要的數(shù)組大得多的數(shù)組,然后將該數(shù)組的子集當(dāng)作使用的數(shù)組。下面的代碼顯示了一個(gè)示例。
var vals [20]int
for i := 0; i 5; i++ {
vals[i] = i * i
}
subsetLen := 5
fmt.Println("The subset of our array has a length of:", subsetLen)
// Add a new item to our array
vals[subsetLen] = 123
subsetLen++
fmt.Println("The subset of our array has a length of:", subsetLen)
Run it on the Go Playground → https://play.golang.org/p/Np6-NEohm2
上面代碼中,我們將一個(gè)數(shù)組其大小設(shè)置為20,但是由于我們僅使用一個(gè)子集,因此我們的代碼可以假裝數(shù)組的長度為5,然后在向數(shù)組中添加新項(xiàng)后為6。
(很粗略地說)這就是切片的工作方式。它們包裝一個(gè)具有設(shè)定大小的數(shù)組,就像上一個(gè)示例中的數(shù)組具有20的設(shè)定大小一樣。它們還跟蹤程序可使用的數(shù)組子集-length
屬性,它類似于上一示例中的subsetLen
變量。
切片還具有一個(gè)容量,類似于上一個(gè)示例中數(shù)組(20)的總長度。這很有用,因?yàn)樗嬖V你子集可以增長多大之后才能不再適合支撐切片的底層數(shù)組。當(dāng)發(fā)生這種情況時(shí),將會(huì)分配一個(gè)新的數(shù)組來支撐切片,但是所有這些邏輯都隱藏在append
函數(shù)的后面。
簡(jiǎn)而言之,將slice
與append
函數(shù)結(jié)合在一起可以為我們提供一種與數(shù)組非常相似的類型,但是隨著時(shí)間的增長,它可以處理更多元素。
讓我們?cè)俅慰匆幌虑懊娴氖纠?,但是這次我們將使用切片而不是數(shù)組。
var vals []int
for i := 0; i 5; i++ {
vals = append(vals, i)
fmt.Println("The length of our slice is:", len(vals))
fmt.Println("The capacity of our slice is:", cap(vals))
}
// Add a new item to our array
vals = append(vals, 123)
fmt.Println("The length of our slice is:", len(vals))
fmt.Println("The capacity of our slice is:", cap(vals))
// Accessing items is the same as an array
fmt.Println(vals[5])
fmt.Println(vals[2])
Run it on the Go Playground →https://play.golang.org/p/M_qaNGVbC-
我們?nèi)匀豢梢韵裨L問數(shù)組一樣訪問切片中的元素,但是通過使用切片和append
函數(shù),我們不再需要考慮支持?jǐn)?shù)組的大小。通過使用len
和cap
函數(shù),我們?nèi)匀豢梢耘宄@些事情,但是我們不必太擔(dān)心它們。
考慮到這一點(diǎn),讓我們回顧一下文章開頭的測(cè)驗(yàn)代碼,看看出了什么問題。
vals := make([]int, 5)
for i := 0; i 5; i++ {
vals = append(vals, i)
}
fmt.Println(vals)
調(diào)用make
時(shí),我們最多可以傳入3個(gè)參數(shù)。第一個(gè)是我們要分配的類型,第二個(gè)是類型的長度,第三個(gè)是類型的容量(此參數(shù)是可選的)。
通過make([] int, 5),我們告訴程序要?jiǎng)?chuàng)建一個(gè)長度為5的切片,并且容量默認(rèn)為提供的長度-在這里是5。雖然這看起來似乎是我們最初想要的,但這里的重要區(qū)別是我們告訴切片要將長度和容量都設(shè)置為5,make 將切片初始化為[0 ,0 ,0 ,0 ,0]
然后繼續(xù)調(diào)用append
函數(shù),因此它將增加容量并在切片的末尾開始添加新元素。
如果在代碼中添加Println()
語句,可以看到容量的變化。
vals := make([]int, 5)
fmt.Println("Capacity was:", cap(vals))
for i := 0; i 5; i++ {
vals = append(vals, i)
fmt.Println("Capacity is now:", cap(vals))
}
fmt.Println(vals)
Run it on the Go Playground →https://play.golang.org/p/d6OUulTYM7
結(jié)果,我們最終得到了輸出[0 0 0 0 0 0 0 1 2 3 4]
而不是期望的[0 1 2 3 4]
。 我們?cè)撊绾谓鉀Q?嗯,有幾種方法可以做到這一點(diǎn),我們將介紹其中兩種,你可以擇最適合自己情況的一種。
不使用 append, 直接用索引寫入
第一個(gè)解決方法是保持make調(diào)用不變,并明確聲明要將每個(gè)元素設(shè)置為的索引。
vals := make([]int, 5)
for i := 0; i 5; i++ {
vals[i] = i
}
fmt.Println(vals)
Run it on the Go Playground → https://play.golang.org/p/d6OUulTYM7
我們?cè)O(shè)置的值恰好與我們要使用的索引相同,但是您也可以獨(dú)立跟蹤索引。 例如,如果您想獲取map的key,則可以使用以下代碼:
package main
import "fmt"
func main() {
fmt.Println(keys(map[string]struct{}{
"dog": struct{}{},
"cat": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {
ret := make([]string, len(m))
i := 0
for key := range m {
ret[i] = key
i++
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/kIKxkdX35B
這之所以行之有效,是因?yàn)槲覀冎婪祷氐那衅拇_切長度將與map的長度相同,因此我們可以使用該長度初始化切片,然后將每個(gè)元素分配給適當(dāng)?shù)乃饕?。這種方法的缺點(diǎn)是我們必須跟蹤i
,以便我們知道將每個(gè)值放入哪個(gè)索引。
這導(dǎo)致我們進(jìn)入第二種方法
使用0作為長度,并指定容量
我們更新make調(diào)用,在切片類型之后為其提供兩個(gè)參數(shù)。首先,新切片的長度將設(shè)置為0,因此我們沒有在切片中添加任何新元素。第二個(gè)參數(shù)是新切片的容量,將被設(shè)置為map參數(shù)的長度,因?yàn)槲覀冎狼衅罱K的長度就是 map 的長度。
這仍將在幕后構(gòu)造與上一個(gè)示例相同的數(shù)組,但是現(xiàn)在,當(dāng)我們調(diào)用append
時(shí),它將知道將元素放置在切片的開頭,因?yàn)榍衅拈L度為0。
package main
import "fmt"
func main() {
fmt.Println(keys(map[string]struct{}{
"dog": struct{}{},
"cat": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {
ret := make([]string, 0, len(m))
for key := range m {
ret = append(ret, key)
}
return ret
}
Run it on the Go Playground →https://play.golang.org/p/h5hVAHmqJm
使用 append 能自動(dòng)擴(kuò)容,為什么還要關(guān)心切片的容量
你可能要問的下一件事是:“如果append函數(shù)可以為我增加切片的容量,我們?yōu)槭裁催€要告訴程序一個(gè)容量?”
事實(shí)是,在大多數(shù)情況下,無需太擔(dān)心這一點(diǎn)。如果它使您的代碼復(fù)雜得多,只需使用var vals []int
初始化切片,然后讓append
函數(shù)處理繁重的工作。但是針對(duì)知道切片最終長度的情況,我們可以在初始化切片時(shí)聲明其容量,從而使程序不必執(zhí)行不必要的內(nèi)存分配。
請(qǐng)?jiān)贕o Playground上運(yùn)行以下代碼。每當(dāng)容量增加時(shí),我們的程序就需要執(zhí)行另一次內(nèi)存分配:
package main
import "fmt"
func main() {
fmt.Println(keys(map[string]struct{}{
"dog": struct{}{},
"cat": struct{}{},
"mouse": struct{}{},
"wolf": struct{}{},
"alligator": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {
var ret []string
fmt.Println(cap(ret))
for key := range m {
ret = append(ret, key)
fmt.Println(cap(ret))
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/fDbAxtAjLF
現(xiàn)在將切片預(yù)設(shè)容量后將其與上面相同的代碼進(jìn)行比較:
package main
import "fmt"
func main() {
fmt.Println(keys(map[string]struct{}{
"dog": struct{}{},
"cat": struct{}{},
"mouse": struct{}{},
"wolf": struct{}{},
"alligator": struct{}{},
}))
}
func keys(m map[string]struct{}) []string {
ret := make([]string, 0, len(m))
fmt.Println(cap(ret))
for key := range m {
ret = append(ret, key)
fmt.Println(cap(ret))
}
return ret
}
Run it on the Go Playground → https://play.golang.org/p/nwT8X9-7eQ
在第一個(gè)代碼示例中,我們的容量從0開始,然后增加到1、2、4,最后是8,這意味著我們必須在5個(gè)不同的時(shí)間分配一個(gè)新數(shù)組,此外,最后一個(gè)數(shù)組用于支持我們slice
的容量為8,大于我們最終需要的容量。 另一方面,我們的第二個(gè)示例以相同的容量(5)開始和結(jié)束,并且只需要在keys()
函數(shù)開始時(shí)分配一次即可。我們還避免浪費(fèi)任何額外的內(nèi)存。
不要過度優(yōu)化
通常不鼓勵(lì)任何人擔(dān)心像這樣的次要優(yōu)化,但是在確實(shí)很明顯最終大小應(yīng)該是多少的情況下,強(qiáng)烈建議為切片設(shè)置適當(dāng)?shù)娜萘炕蜷L度。
它不僅有助于提高應(yīng)用程序的性能,而且還可以通過明確說明輸入大小和輸出大小之間的關(guān)系來幫助理清代碼。
本文并不是要對(duì)切片或數(shù)組之間的差異進(jìn)行詳盡的討論,而只是要簡(jiǎn)要介紹容量和長度如何影響切片以及它們?cè)诓煌鉀Q方案中的作用。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:- go語言求任意類型切片的長度操作
- Go語言切片前或中間插入項(xiàng)與內(nèi)置copy()函數(shù)詳解
- golang中切片copy復(fù)制和等號(hào)復(fù)制的區(qū)別介紹
- go語言中切片與內(nèi)存復(fù)制 memcpy 的實(shí)現(xiàn)操作
- go語言中的二維切片賦值
- go語言中切片的長度和容量的區(qū)別