golang channel底层结构和实现

乎语百科 538 0

一、介绍

Golang 设计模式: 不要通过共享内存来通信,而要通过通信实现内存共享

channel是基于通信顺序模型(communication sequential processes, CSP)的并发模式,可以让一个 goroutine 发送特定值到另一个 goroutine 的通信机制

channel中的数据遵循先入先出(First In First Out)的规则,保证收发数据的顺序

二、结构

channel的源码在runtime包下的chan.go文件, 参见chan.go

以下时channel的部分结构:

type hchan struct {
	qcount   uint
	dataqsiz uint
	buf      unsafe.Pointer
	elemsize uint16
	closed   uint32
	elemtype *_type
	sendx    uint
	recvx    uint
	recvq    waitq
	sendq    waitq
	lock mutex
}

type waitq struct {
	first *sudog
	last  *sudog
}

其中:

qcount: 队列中剩余的元素个数

dataqsiz: 环形队列长度,即可以存放的元素个数, make初始化时指定

buf: 缓存区,实际上就是环形队列(有环形队列就有缓冲区,否则没有缓冲区),指向环形队列首部的指针,基于环形队列实现,大小等于make初始化channel时指定的环形队列长度,如果make初始化channel时不指定dataqsiz,则buf=0。只有缓冲型的channel才有buf

elemsize: 每个元素的大小

closed: channel关闭标志

elemtype: 元素类型

sendx: 写入数据的索引,即从哪个位置开始写入数据,取值[0, dataqsiz)

recvx: 读取数据的索引,即从哪个位置开始读取数据,取值[0, dataqsiz)

recvq: 接收等待队列,链表结构,长度无限长, 读取数据的goroutine等待队列, 如果channel的缓冲区为空或者没有缓冲区,读取数据的goroutine被阻塞,加入到recvq等待队列中。因读阻塞的goroutine会被向channel写入数据的goroutine唤醒

sendq: 发送等待队列,链表结构,长度无限长, 写入数据的goroutine等待队列, 如果channel的缓冲区为满或者没有缓冲区,写入数据的goroutine被阻塞,加入到sendq等待队列中。因写阻塞的goroutine会被从channel读取数据的goroutine唤醒

lock: 并发控制锁, 同一时刻,只允许一个, channel不允许并发读写

 

1 结构图

其中:

环形队列中的0表示没有数据,1表示有数据; G表示一个goroutine
dataqsiz表示环形队列的长度为6, 即可缓存6个元素
buf指向环形队列首部,此时还可以缓存2个元素
qcount表示环形队列中有4个元素
sendx表示下一个发送的数据在环形队列index=5的位置写入,取值[0, 6)
recvx表示从环形队列index=1的位置读取数据,取值[0, 6)
sendq, recvq: 虚线表示,此时转态下的channel可能有等待队列

三、channel的创建

1 声明channel类型

//同时读写的channel
var 变量 chan 类型

//只能写入数据的channel
var 变量 chan<- 类型

//只能读取数据的channel
var 变量 <-chan 类型 

其中:

类型:channel内的数据类型,golang支持的合法类型

声明的channel此时还是nil,需要配合make函数初始化之后才能使用

2 创建channel

//无缓冲的channel
变量 := make(chan 数据类型)

//有缓冲的channel
变量 := make(chan 数据类型, dataqsiz)

  

四、向channel发送数据

1 发送数据的格式

变量 <- 值

2 写数据的过程

1) 流程图如下:

 

其中:

G表示一个goroutine
虚线表示sendq中堵塞的G被唤醒的流程,如果G没有被唤醒,则一直堵塞下去,此时关闭channel,会触发panic

2) 过程描述:

1) 如果channel是nil(没有初始化), 发送数据则一直会堵塞,这是一个BUG
2) 如果等待接收队列recvq 不为空,说明没有缓冲区或者缓冲区没有数据,直接从recvq取出一个G数据写入,把G唤醒,结束发送过程
3) 如果等待接收队列recvq为空,且缓冲区有空位,那么就直接将数据写入缓冲区sendx位置, sendx++, qcount++, 结束发送过程
4) 如果等待接收队列recvq为空,缓冲区没有空位,将数据写入G,然后把G放到等待发送队列sendq中进行阻塞,等待被唤醒, 结束发送过程。当被唤醒的时候,需要写入的数据已经被读取出来,且已经完成了写入操作

五、从channel接收数据

1 接收数据的格式

1) 阻塞接收数据

程序阻塞直到收到数据并赋值

data := <-ch  

 

2) 非阻塞接收数据

非阻塞的通道接收方法可能造成高的 CPU 占用

//ok表示是否接收到数据
data, ok := <-ch

  

3) 接收数据并忽略

程序阻塞直到接收到数据,但接收到的数据会被忽略

<-ch

  

4) 循环接收

channel是可以进行遍历的,遍历的结果就是接收到的数据

for data := range ch {
    //done
}

5) SELECT语句接收

select 的特点是只要其中有一个 case 已经完成,程序就会继续往下执行,而不会考虑其他 case 的情况在一个 select 语句中,Go语言会按顺序从头至尾评估每一个发送和接收的语如果其中的多条case语句可继续执行(即没有被阻塞),那么就从这些case语句中任意选择一条如果没有case语句可以执行(即所有的通道都被阻塞):  1) 如果有 default 语句,执行 default 语句,同时程序的执行会从 select 语句后的语句中恢复  2) 如果没有 default 语句,那么 select 语句将被阻塞,直到至少有一个case可以进行下去

select {
    case <- chan1:
       //done
    case chan2 <- 2:
       //done
    default:
       //done
}

  

2 读取数据的流程

1) 流程图如下:

其中:

G表示一个goroutine
虚线表示recvq中堵塞的G被唤醒的流程,如果G没有被唤醒,则一直堵塞下去,此时关闭channel,会得到channel类型的零值

2) 过程描述:

1 如果等待发送队列sendq不为空,且没有缓冲区,直接从sendq中取出G,读取数据,最后把G唤醒,结束读取过程
2 如果等待发送队列sendq不为空,有缓冲区(此时缓冲区满了),从缓冲区中首部读出数据,把sendq出列的G中数据写入缓冲区尾部,把G唤醒,结束读取过程
3 如果等待发送队列sendq为空,且环形队列无元素,将goruntime加入等待接收队列recvq中进行堵塞,等待被唤醒
4 如果等待发送队列sendq为空,环形队列有元素,直接从缓冲区读取数据,结束读取过程

六、关闭channel

1 格式

close(ch)

2 过程描述

1) 首先校验chan是否已被初始化,然后加锁之后再校验是否已被关闭过,如果校验都通过了,那么将closed字段设值为1
2) 遍历recvq和sendq,并将所有的goroutine 加入到glist中
3) 将所有glist中的goroutine加入调度队列,等待被唤醒
4) recvq中的goroutine接收到对应数据的零值,sendq中的goroutine会直接panic

七、channel发送、接收数据过程可能产生的问题

1 向一个nil的channel发送/读取数据会一直堵塞下去?该如何唤醒?

会一直堵塞下去,不会被唤醒,可能会造成泄露,这是一个BUG

2 等待发送队列(sendq)中有数据,如果一直没有gouruntine从channel里面读数据会不会造成泄漏?

会造成泄露,channel用完了,最好要close

3 向已经关闭的channel读/写数据会发生什么?

写已经关闭的 channel 会触发panic

读已经关闭的 channel,能一直读到数据:

1) 如果 channel 关闭前,buf内有元素还未读,会正确读到 channel 内的值,且返回的第二个 bool 值为 true

2) 如果 channel 关闭前,buf内有元素已经被读完,channel 内无值,返回 channel 元素的零值,第二个 bool 值为 false

4 触发 panic 的三种情况

1) 向一个关闭的 channel 进行写操作

2) 关闭一个为 nil 的 channel

3) 重复关闭一个 channel

标签:

留言评论

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~