头图

书接上回,容器数据类型是指一种数据结构、或者抽象数据类型,其实例为其他类的对象。 或者说得更具体一点,它是以一种遵循特定访问规则的方法来存储对象。 容器的大小取决于其包含的基础数据对象(或数据元素)的个数。Go lang中常用的容器数据有数组、切片和集合。

数组

数组是一个由长度固定的特定类型元素组成的序列,一个数组可以由零个或多个元素组成,它是一种线性的数据结构,同时内部元素的内存地址是相连的,没错,Python中的元祖(tuple)和Go lang中的数组就是一类东西,由于定长的特性,所以在系统资源占用层面具备一定的优势。

我们可以使用 [n]Type 来声明一个数组。其中 n 表示数组中元素的数量, Type 表示每个元素的类型:

package main  
  
import "fmt"  
  
func main() {  
    // 声明时没有指定数组元素的值, 默认为零值  
    var arr [5]int  
    fmt.Println(arr)  
  
    arr[0] = 1  
    arr[1] = 2  
    arr[2] = 3  
    fmt.Println(arr)  
}

程序返回:

[0 0 0 0 0]  
[1 2 3 0 0]

除此之外,也可通过海象操作符等方式进行声明:

package main  
  
import "fmt"  
  
func main() {  
    // 直接在声明时对数组进行初始化  
    var arr1 = [5]int{15, 20, 25, 30, 35}  
    fmt.Println(arr1)  
  
    // 使用短声明  
    arr2 := [5]int{15, 20, 25, 30, 35}  
    fmt.Println(arr2)  
  
    // 部分初始化, 未初始化的为零值  
    arr3 := [5]int{15, 20} // [15 20 0 0 0]  
    fmt.Println(arr3)  
  
    // 可以通过指定索引,方便地对数组某几个元素赋值  
    arr4 := [5]int{1: 100, 4: 200}  
    fmt.Println(arr4) // [0 100 0 0 200]  
  
    // 直接使用 ... 让编译器为我们计算该数组的长度  
    arr5 := [...]int{15, 20, 25, 30, 35, 40}  
    fmt.Println(arr5)  
  
    // 定义多维数组  
    arr := [3][2]string{  
        {"1", "10"},  
        {"2", "3"},  
        {"3", "4"}}  
    fmt.Println(arr) // [[15 20] [25 22] [25 22]]  
  
    //数组取值  
  
    fmt.Println(arr[0][0])  
  
}

同时数组支持嵌套,也就是多维数组结构,最后通过数组的下标进行取值操作。

通过将数组作为参数传递给len函数,可以获得数组的长度:

package main  
  
import "fmt"  
  
func main() {    
    a := [...]float64{67.7, 89.8, 21, 78}  
    fmt.Println("length of a is",len(a))  
  
}

数组是值类型 ,而不是引用类型。这意味着当它们被分配给一个新变量时,将把原始数组的副本分配给新变量。如果对新变量进行了更改,则不会影响原对象,这有点像Python中的可变以及不可变数据类型,原理都是一样的:

package main  
  
import "fmt"  
  
func main() {  
    a := [...]string{"USA", "China", "India", "Germany", "France"}  
    b := a // a copy of a is assigned to b  
    b[0] = "Singapore"  
    fmt.Println("a is ", a)  
    fmt.Println("b is ", b)  
}

和Python中元祖不同的是,数组元素的值可以改变,但是元素成员不能增减,最后数组可以使用for关键字或者range关键字进行遍历操作:



package main  
  
import "fmt"  
  
func test() {  
  
    a := [...]float64{67.7, 89.8, 21, 78}  
    sum := float64(0)  
    for i, v := range a { //range returns both the index and value  
        fmt.Printf("%d the element of a is %.2f\n", i, v)  
        sum += v  
    }  
    fmt.Println("\nsum of all elements of a", sum)  
  
}  
  
func main() {  
    a := [...]float64{67.7, 89.8, 21, 78}  
    for i := 0; i < len(a); i++ { //looping from 0 to the length of the array  
        fmt.Printf("%d th element of a is %.2f\n", i, a[i])  
    }  
  
    test()  
}  


程序返回:



0 th element of a is 67.70  
1 th element of a is 89.80  
2 th element of a is 21.00  
3 th element of a is 78.00  
0 the element of a is 67.70  
1 the element of a is 89.80  
2 the element of a is 21.00  
3 the element of a is 78.00  
  
sum of all elements of a 256.5

使用内置的 len 方法将返回数组中元素的个数,即数组的长度。

func arrLength() {  
    arr := [...]string{"Go语言极简一本通", "Go语言微服务架构核心22讲", "从0到Go语言微服务架构师"}  
    fmt.Println("数组的长度是:", len(arr)) //数组的长度是: 3  
}

可以这么理解,go lang的数组是元素值可以改变但长度不变的元祖(tuple)。

切片(Slice)

切片是对数组的一个连续片段的引用,所以切片是一个引用类型。切片本身不拥有任何数据,它们只是对现有数组的引用,每个切片值都会将数组作为其底层的数据结构。slice 的语法和数组很像,只是没有固定长度而已。

使用 []Type 可以创建一个带有 Type 类型元素的切片:

// 声明整型切片  
var numList []int  
  
// 声明一个空切片  
var numListEmpty = []int{}

如果愿意,也可以使用 make 方法构造一个切片,格式为 make([]Type, size, cap) :

numList := make([]int, 3, 5)

切片之所以称之为切片,是因为我们可以对数组进行裁切,从而创建一个切片:

package main  
  
import "fmt"  
  
func main() {  
  
    arr := [5]int{1, 2, 3, 4, 5}  
    var s1 = arr[1:4]  
    fmt.Println(arr)  
    fmt.Println(s1)  
  
}

程序返回:

[1 2 3 4 5]  
[2 3 4]

一个切片由三个部分构成:指针 、长度 和 容量 。指针指向第一个切片元素对应的底层数组元素的地址,要注意的是切片的第一个元素并不一定就是数组的第一个元素。长度对应切片中元素的数目;长度不能超过容量,容量一般是从切片的开始位置到底层数据的结尾位置。简单地理解,容量就是从创建切片索引开始的底层数组中的元素个数,而长度是切片中的元素个数:

package main  
  
import "fmt"  
  
func main() {  
  
    s := make([]string, 3, 5)  
    fmt.Println(len(s)) // 3  
    fmt.Println(cap(s)) // 5  
  
}

由上可知,切片内置的 len 方法和 cap 方法分别返回切片 的长度和容量。

如果切片操作超出上限将导致一个 panic 异常,有点像Python中列表的下标越界异常:

s := make([]int, 3, 5)  
fmt.Println(s[10]) //panic: runtime error: index out of range [10] with length 3

切片是引用类型,所以声明之后不对它进行赋值的话,它的默认值是 nil

var numList []int  
fmt.Println(numList == nil) // true

切片之间不能比较,因此我们不能使用恒等(== )操作符来判断两个切片是否含有全部相等元素。特别注意,如果你需要测试一个切片是否是空的,使用 len(s) == 0 来判断,而不应该用 s == nil 来判断:

切片自己不拥有任何数据元素。它只是底层数组的一种表示。对切片所做的任何修改都会反映在底层数组中:

package main  
  
import "fmt"  
  
func main() {  
  
    var arr = [...]int{1, 2, 3}  
    s := arr[:]  
    fmt.Println(arr)  
    fmt.Println(s)  
  
    s[0] = 4  
    fmt.Println(arr)  
    fmt.Println(s)  
  
}

程序返回:

[1 2 3]  
[1 2 3]  
[4 2 3]  
[4 2 3]

上面的 arr[:] 没有填入起始值和结束值,默认就是 0 和 len(arr) 。

使用 append方法可以将新元素追加到切片上,这和Python中的列表方法如出一辙,append方法的定义是 func append(slice []Type, elems ...Type) []Type 。其中 elems ...Type 在函数定义中表示该函数接受参数 elems 的个数是可变的。这些类型的函数被称为可变函数:

package main  
  
import "fmt"  
  
func main() {  
  
    s := []int{1}  
    fmt.Println(s)  
    fmt.Println(cap(s))  
  
    s = append(s, 2)  
    fmt.Println(s)  
    fmt.Println(cap(s))  
  
    s = append(s, 3, 4)  
    fmt.Println(s)  
    fmt.Println(cap(s))  
  
    s = append(s, []int{5, 6}...)  
    fmt.Println(s)  
    fmt.Println(cap(s))  
  
}

程序返回:

[1]  
1  
[1 2]  
2  
[1 2 3 4]  
4  
[1 2 3 4 5 6]  
8

当新的元素被添加到切片时,如果容量不足,会创建一个新的数组。现有数组的元素被复制到这个新数组中,并返回新的引用。现在新切片的容量是旧切片的两倍。

切片也可以有多个维度,也就是嵌套的形式:

package main  
  
import "fmt"  
  
func main() {  
  
    numList := [][]string{  
        {"1", "1"},  
        {"2", "2"},  
        {"3", "3"},  
    }  
    fmt.Println(numList)  
  
}

集合(Map)

在 Go lang中,集合是散列表(哈希表)的引用。它是一个拥有键值对元素的无序集合,在这个集合中,键是唯一的,可以通过键来获取、更新或移除操作。无论这个散列表有多大,这些操作基本上是通过常量时间完成的。所有可比较的类型,如整型 ,字符串等,都可以作为 key 。

使用 make方法传入键和值的类型,可以创建集合 。具体语法为 make(map[KeyType]ValueType) 。

package main  
  
import "fmt"  
  
func main() {  
  
    // 创建一个键类型为 string 值类型为 int 名为 scores 的 map  
    scores := make(map[string]int)  
    steps := make(map[string]string)  
  
    fmt.Println(scores)  
    fmt.Println(steps)  
  
}

也可以用集合字面值的语法创建集合,同时还可以指定一些最初的 key/value :

package main  
  
import "fmt"  
  
func main() {  
  
    var steps2 map[string]string = map[string]string{  
        "1": "1",  
        "2": "2",  
        "3": "3",  
    }  
    fmt.Println(steps2)  
  
}

亦或者使用海象操作符:

package main  
  
import "fmt"  
  
func main() {  
  
    steps3 := map[string]string{  
        "1": "1",  
        "2": "2",  
        "3": "3",  
    }  
    fmt.Println(steps3)  
  
}

动态地添加新元素:

// 可以使用 `map[key] = value` 向 map 添加元素。  
steps3["4"] = "4"

修改元素:

// 若 key 已存在,使用 map[key] = value 可以直接更新对应 key 的 value 值。  
steps3["4"] = "第四步"

取值:

// 直接使用 map[key] 即可获取对应 key 的 value 值,如果 key不存在,会返回其 value 类型的零值。  
fmt.Println(steps3["4"] )

删除某个key:

//使用 delete(map, key)可以删除 map 中的对应 key 键值对,如果 key 不存在,delete 函数会静默处理,不会报错。  
delete(steps3, "4")

判断 key 是否存在:

// 如果我们想知道 map 中的某个 key 是否存在,可以使用下面的语法:value, ok := map[key]  
v3, ok := steps3["3"]  
fmt.Println(ok)  
fmt.Println(v3)  
  
v4, ok := steps3["4"]  
fmt.Println(ok)  
fmt.Println(v4)

这个逻辑说明集合的下标读取可以返回两个值,第一个值为当前 key 的 value 值,第二个值表示对应的 key 是否存在,若存在 ok 为 true ,若不存在,则 ok 为 false 。

集合也可以进行遍历操作:

// 遍历 map 中所有的元素需要用 for range 循环。  
for key, value := range steps3 {  
    fmt.Printf("key: %s, value: %d\n", key, value)  
}

同样使用len方法来获取集合的长度:

// 使用 len 函数可以获取 map 长度  
func createMap() {  
      //...  
     fmt.Println(len(steps3))    // 4  
}

当集合被赋值为一个新变量的时候,它们指向同一个内部数据结构。因此,改变其中一个变量,就会影响到另一变量。所以,集合是引用数据类型:

package main  
  
import "fmt"  
  
func main() {  
  
    steps4 := map[string]string{  
        "1": "1",  
        "2": "2",  
        "3": "3",  
    }  
    fmt.Println("steps4: ", steps4)  
  
    newSteps4 := steps4  
    newSteps4["1"] = "1.1-222"  
    newSteps4["2"] = "2.2-222"  
    newSteps4["3"] = "3.3-222"  
    fmt.Println("steps4: ", steps4)  
  
    fmt.Println("newSteps4: ", newSteps4)  
  
}

程序返回:

steps4:  map[1:1 2:2 3:3]  
steps4:  map[1:1.1-222 2:2.2-222 3:3.3-222]  
newSteps4:  map[1:1.1-222 2:2.2-222 3:3.3-222]

所以,当需要保留原对象数据做其他操作时,最好不要使用赋值,而是提前声明新容器。同理,当集合作为参数传递到方法内时,方法对其做了修改操作,也会影响原集合对象。

结语

在业务代码的编写上,我们经常会查询来自数据库的源数据,再把它们插入到对应的复合数据类型结构中去,再进行下一步的业务聚合、裁剪、封装、处理,然后返回到前端,进行渲染操作。大体上,我们会选择数组、切片还有集合,一般情况下最外部是切片或者是数组,然后内嵌集合的数据集,集合内key作为字段,value作为字段的值。在操作上,需要注意值类型(数组)和引用类型(切片、集合)的区别:值类型的特点是:变量直接存储值,内存通常在栈中分配;引用类型的特点是:变量存储的是一个地址,这个地址对应的空间里才是真正存储的值,内存通常在堆中分配,说白了就是值类型赋值后修改不会影响原对象,而引用类型反之,有点像Python中的可变和不可变数据类型,由此可见,天下武功,同归殊途,万法归宗,万变不离其宗。


刘悦的技术博客
56 声望10 粉丝