Appearance
04集合类型:如何正确使用array、lice和map?
上节课的思考题是练习使用 for 循环中的 continue,通过上节课的学习,你已经了解 continue 是跳出本次循环的意思,现在我就以计算 100 以内的偶数之和为例,演示 continue 的用法:
cpp
sum := 0
for i:=1; i<100; i++{
if i%2!=0 {
continue
}
sum+=i
}
fmt.Println("the sum is",sum)
这个示例的关键在于:如果 i 不是偶数,就会用 continue 跳出本次循环,继续下个循环;如果是偶数,则继续执行 sum+=i,然后继续循环,这样就达到了只计算 100 以内偶数之和的目的。
下面我们开始本节课的学习,我将介绍 Go 语言的集合类型。
在实际需求中,我们会有很多同一类型的元素放在一起的场景,这就是集合,例如 100 个数字,10 个字符串等。在 Go 语言中,数组(array)、切片(slice)、映射(map)这些都是集合类型,用于存放同一类元素。虽然都是集合,但用处又不太一样,这节课我就为你详细地介绍。
Array(数组)
数组存放的是固定长度、相同类型的数据,而且这些存放的元素是连续的。所存放的数据类型没有限制,可以是整型、字符串甚至自定义。
数组声明
要声明一个数组非常简单,语法和第二课时介绍的声明基础类型是一样的。
在下面的代码示例中,我声明了一个字符串数组,长度是 5,所以其类型定义为 [5]string,其中大括号中的元素用于初始化数组。此外,在类型名前加 [] 中括号,并设置好长度,就可以通过它来推测数组的类型。
注意:[5]string 和 [4]string 不是同一种类型,也就是说长度也是数组类型的一部分。
ch04/main.go
go
array:=[5]string{"a","b","c","d","e"}
数组在内存中都是连续存放的,下面通过一幅图片形象地展示数组在内存中如何存放:
可以看到,数组的每个元素都是连续存放的,每一个元素都有一个下标(Index)。下标从 0 开始,比如第一个元素 a 对应的下标是 0,第二个元素 b 对应的下标是 1。以此类推,通过 array+[下标] 的方式,我们可以快速地定位元素。
如下面代码所示,运行它,可以看到输出打印的结果是 c,也就是数组 array 的第三个元素:
ch04/main.go
go
func main() {
array:=[5]string{"a","b","c","d","e"}
fmt.Println(array[2])
}
在定义数组的时候,数组的长度可以省略,这个时候 Go 语言会自动根据大括号 {} 中元素的个数推导出长度,所以以上示例也可以像下面这样声明:
go
array:=[...]string{"a","b","c","d","e"}
以上省略数组长度的声明只适用于所有元素都被初始化的数组,如果是只针对特定索引元素初始化的情况,就不适合了,如下示例:
go
array1:=[5]string{1:"b",3:"d"}
示例中的「1:"b",3:"d"」的意思表示初始化索引 1 的值为 b,初始化索引 3 的值为 d,整个数组的长度为 5。如果我省略长度 5,那么整个数组的长度只有 4,显然不符合我们定义数组的初衷。
此外,没有初始化的索引,其默认值都是数组类型的零值,也就是 string 类型的零值 "" 空字符串。
除了使用 [] 操作符根据索引快速定位数组的元素外,还可以通过 for 循环打印所有的数组元素,如下面的代码所示:
ch04/main.go
go
for i:=0;i<5;i++{
fmt.Printf("数组索引:%d,对应值:%s\n", i, array[i])
}
数组循环
使用传统的 for 循环遍历数组,输出对应的索引和对应的值,这种方式很烦琐,一般不使用,大部分情况下,我们使用的是 for range 这种 Go 语言的新型循环,如下面的代码所示:
go
for i,v:=range array{
fmt.Printf("数组索引:%d,对应值:%s\n", i, v)
}
这种方式和传统 for 循环的结果是一样的。对于数组,range 表达式返回两个结果:
第一个是数组的索引;
第二个是数组的值。
在上面的示例中,把返回的两个结果分别赋值给 i 和 v 这两个变量,就可以使用它们了。
相比传统的 for 循环,for range 要更简洁,如果返回的值用不到,可以使用 _ 下划线丢弃,如下面的代码所示:
go
for _,v:=range array{
fmt.Printf("对应值:%s\n", v)
}
数组的索引通过 _ 就被丢弃了,只使用数组的值 v 即可。
Slice(切片)
切片和数组类似,可以把它理解为动态数组。切片是基于数组实现的,它的底层就是一个数组。对数组任意分隔,就可以得到一个切片。现在我们通过一个例子来更好地理解它,同样还是基于上述例子的 array。
基于数组生成切片
下面代码中的 array[2:5] 就是获取一个切片的操作,它包含从数组 array 的索引 2 开始到索引 5 结束的元素:
go
array:=[5]string{"a","b","c","d","e"}
slice:=array[2:5]
fmt.Println(slice)
注意:这里是包含索引 2,但是不包含索引 5 的元素,即在 : 右边的数字不会被包含。
ch04/main.go
html
//基于数组生成切片,包含索引start,但是不包含索引end
slice:=array[start:end]
所以 array[2:5] 获取到的是 c、d、e 这三个元素,然后这三个元素作为一个切片赋值给变量 slice。
切片和数组一样,也可以通过索引定位元素。这里以新获取的 slice 切片为例,slice[0] 的值为 c,slice[1] 的值为 d。
有没有发现,在数组 array 中,元素 c 的索引其实是 2,但是对数组切片后,在新生成的切片 slice 中,它的索引是 0,这就是切片。虽然切片底层用的也是 array 数组,但是经过切片后,切片的索引范围改变了。
通过下图可以看出,切片是一个具备三个字段的数据结构,分别是指向数组的指针 data,长度 len 和容量 cap:
这里有一些小技巧,切片表达式 array[start:end] 中的 start 和 end 索引都是可以省略的,如果省略 start,那么 start 的值默认为 0,如果省略 end,那么 end 的默认值为数组的长度。如下面的示例:
array[:4] 等价于 array[0:4]。
array[1:] 等价于 array[1:5]。
array[:] 等价于 array[0:5]。
切片修改
切片的值也可以被修改,这里也同时可以证明切片的底层是数组。
对切片相应的索引元素赋值就是修改,在下面的代码中,把切片 slice 索引 1 的值修改为 f,然后打印输出数组 array:
go
slice:=array[2:5]
slice[1] ="f"
fmt.Println(array)
可以看到如下结果:
shell
[a b c f e]
数组对应的值已经被修改为 f,所以这也证明了基于数组的切片,使用的底层数组还是原来的数组,一旦修改切片的元素值,那么底层数组对应的值也会被修改。
切片声明
除了可以从一个数组得到切片外,还可以声明切片,比较简单的是使用 make 函数。
下面的代码是声明了一个元素类型为 string 的切片,长度是 4,make 函数还可以传入一个容量参数:
html
slice1:=make([]string,4)
在下面的例子中,指定了新创建的切片 []string 容量为 8:
html
slice1:=make([]string,4,8)
这里需要注意的是,切片的容量不能比切片的长度小。
切片的长度你已经知道了,就是切片内元素的个数。那么容量是什么呢?其实就是切片的空间。
上面的示例说明,Go 语言在内存上划分了一块容量为 8 的内容空间(容量为 8),但是只有 4 个内存空间才有元素(长度为 4),其他的内存空间处于空闲状态,当通过 append 函数往切片中追加元素的时候,会追加到空闲的内存上,当切片的长度要超过容量的时候,会进行扩容。
切片不仅可以通过 make 函数声明,也可以通过字面量的方式声明和初始化,如下所示:
go
slice1:=[]string{"a","b","c","d","e"}
fmt.Println(len(slice1),cap(slice1))
可以注意到,切片和数组的字面量初始化方式,差别就是中括号 [] 里的长度。此外,通过字面量初始化的切片,长度和容量相同。
Append
我们可以通过内置的 append 函数对一个切片追加元素,返回新切片,如下面的代码所示:
go
//追加一个元素
slice2:=append(slice1,"f")
//多加多个元素
slice2:=append(slice1,"f","g")
//追加另一个切片
slice2:=append(slice1,slice...)
append 函数可以有以上三种操作,你可以根据自己的实际需求进行选择,append 会自动处理切片容量不足需要扩容的问题。
小技巧:在创建新切片的时候,最好要让新切片的长度和容量一样,这样在追加操作的时候就会生成新的底层数组,从而和原有数组分离,就不会因为共用底层数组导致修改内容的时候影响多个切片。
切片元素循环
切片的循环和数组一模一样,常用的也是 for range 方式,这里就不再进行举例,当作练习题留给你。
在 Go 语言开发中,切片是使用最多的,尤其是作为函数的参数时,相比数组,通常会优先选择切片,因为它高效,内存占用小。
Map(映射)
在 Go 语言中,map 是一个无序的 K-V 键值对集合,结构为 map[K]V。其中 K 对应 Key,V 对应 Value。map 中所有的 Key 必须具有相同的类型,Value 也同样,但 Key 和 Value 的类型可以不同。此外,Key 的类型必须支持 == 比较运算符,这样才可以判断它是否存在,并保证 Key 的唯一。
Map 声明初始化
创建一个 map 可以通过内置的 make 函数,如下面的代码所示:
go
nameAgeMap:=make(map[string]int)
它的 Key 类型为 string,Value 类型为 int。有了创建好的 map 变量,就可以对它进行操作了。
在下面的示例中,我添加了一个键值对,Key 为飞雪无情,Value 为 20,如果 Key 已经存在,则更新 Key 对应的 Value:
go
nameAgeMap["飞雪无情"] = 20
除了可以通过 make 函数创建 map 外,还可以通过字面量的方式。同样是上面的示例,我们用字面量的方式做如下操作:
go
nameAgeMap:=map[string]int{"飞雪无情":20}
在创建 map 的同时添加键值对,如果不想添加键值对,使用空大括号 {} 即可,要注意的是,大括号一定不能省略。
Map 获取和删除
map 的操作和切片、数组差不多,都是通过 [] 操作符,只不过数组切片的 [] 中是索引,而 map 的 [] 中是 Key,如下面的代码所示:
html
//添加键值对或者更新对应 Key 的 Value
nameAgeMap["飞雪无情"] = 20
//获取指定 Key 对应的 Value
age:=nameAgeMap["飞雪无情"]
Go 语言的 map 可以获取不存在的 K-V 键值对,如果 Key 不存在,返回的 Value 是该类型的零值,比如 int 的零值就是 0。所以很多时候,我们需要先判断 map 中的 Key 是否存在。
map 的 [] 操作符可以返回两个值:
第一个值是对应的 Value;
第二个值标记该 Key 是否存在,如果存在,它的值为 true。
我们通过下面的代码进行演示:
ch04/main.go
go
nameAgeMap:=make(map[string]int)
nameAgeMap["飞雪无情"] = 20
age,ok:=nameAgeMap["飞雪无情1"]
if ok {
fmt.Println(age)
}
在示例中,age 是返回的 Value,ok 用来标记该 Key 是否存在,如果存在则打印 age。
如果要删除 map 中的键值对,使用内置的 delete 函数即可,比如要删除 nameAgeMap 中 Key 为飞雪无情的键值对。我们用下面的代码进行演示:
go
delete(nameAgeMap,"飞雪无情")
delete 有两个参数:第一个参数是 map,第二个参数是要删除键值对的 Key。
遍历 Map
map 是一个键值对集合,它同样可以被遍历,在 Go 语言中,map 的遍历使用 for range 循环。
对于 map,for range 返回两个值:
第一个是 map 的 Key;
第二个是 map 的 Value。
我们用下面的代码进行演示:
ch04/main.go
go
//测试 for range
nameAgeMap["飞雪无情"] = 20
nameAgeMap["飞雪无情1"] = 21
nameAgeMap["飞雪无情2"] = 22
for k,v:=range nameAgeMap{
fmt.Println("Key is",k,",Value is",v)
}
需要注意的是 map 的遍历是无序的,也就是说你每次遍历,键值对的顺序可能会不一样。如果想按顺序遍历,可以先获取所有的 Key,并对 Key 排序,然后根据排序好的 Key 获取对应的 Value。这里我不再进行演示,你可以当作练习题。
小技巧:for range map 的时候,也可以使用一个值返回。使用一个返回值的时候,这个返回值默认是 map 的 Key。
Map 的大小
和数组切片不一样,map 是没有容量的,它只有长度,也就是 map 的大小(键值对的个数)。要获取 map 的大小,使用内置的 len 函数即可,如下代码所示:
go
fmt.Println(len(nameAgeMap))
String 和 []byte
字符串 string 也是一个不可变的字节序列,所以可以直接转为字节切片 []byte,如下面的代码所示:
ch04/main.go
go
s:="Hello飞雪无情"
bs:=[]byte(s)
string 不止可以直接转为 []byte,还可以使用 [] 操作符获取指定索引的字节值,如以下示例:
ch04/main.go
go
s:="Hello飞雪无情"
bs:=[]byte(s)
fmt.Println(bs)
fmt.Println(s[0],s[1],s[15])
你可能会有疑惑,在这个示例中,字符串 s 里的字母和中文加起来不是 9 个字符吗?怎么可以使用 s[15] 超过 9 的索引呢?其实恰恰就是因为字符串是字节序列,每一个索引对应的是一个字节,而在 UTF8 编码下,一个汉字对应三个字节,所以字符串 s 的长度其实是 17。
运行下面的代码,就可以看到打印的结果是 17。
go
fmt.Println(len(s))
如果你想把一个汉字当成一个长度计算,可以使用 utf8.RuneCountInString 函数。运行下面的代码,可以看到打印结果是 9,也就是 9 个 unicode(utf8)字符,和我们看到的字符的个数一致。
go
fmt.Println(utf8.RuneCountInString(s))
而使用 for range 对字符串进行循环时,也恰好是按照 unicode 字符进行循环的,所以对于字符串 s 来说,循环了 9 次。
在下面示例的代码中,i 是索引,r 是 unicode 字符对应的 unicode 码点,这也说明了 for range 循环在处理字符串的时候,会自动地隐式解码 unicode 字符串。
ch04/main.go
go
for i,r:=range s{
fmt.Println(i,r)
}
总结
这节课到这里就要结束了,在这节课里我讲解了数组、切片和映射的声明和使用,有了这些集合类型,你就可以把你需要的某一类数据放到集合类型中了,比如获取用户列表、商品列表等。
数组、切片还可以分为二维和多维,比如二维字节切片就是 [][]byte,三维就是 [][][]byte,因为不常用,所以本节课中没有详细介绍,你可以结合我讲的一维 []byte 切片自己尝试练习,这也是本节课要给你留的思考题,创建一个二维数组并使用它。
此外,如果 map 的 Key 的类型是整型,并且集合中的元素比较少,应该尽量选择切片,因为效率更高。在实际的项目开发中,数组并不常用,尤其是在函数间作为参数传递的时候,用得最多的是切片,它更灵活,并且内存占用少。
下节课,我会为你讲解函数和方法,这也是我们代码复用、实现高效开发的第一步。