0%

go 每日一问

基础类

2022-06-13

问:与其他语言相比,使用 Go 有什么好处?

  • 与其他作为学术实验开始的语言不同,Go 代码的设计是务实的。每个功能 和语法决策都旨在让程序员的生活更轻松。
  • Golang 针对并发进行了优化,并且在规模上运行良好。
  • 由于单一的标准代码格式,Golang 通常被认为比其他语言更具可读性。
  • 自动垃圾收集明显比 Java 或 Python 更有效,因为它与程序同时执行。

2022-06-14

问:Golang 使用什么数据类型(都有哪些数据类型)?

  • 布尔型
  • 数字类型(整数、浮点数)
  • 字符串类型
  • 错误类型(error)
  • 派生类型
    • Pointer(指针类型)
    • Method(函数类型)
    • Interface(接口类型)
    • struct(结构体)
    • Array
    • Slice
    • Map
    • Channel

2022-06-15

问:Go 程序中的包是什么?
(pkg) 是 Go 工作区中包含 Go 源文件或其他包的目录。源文件中的每个函数、变量和类型都存储在链接包中。每个 Go 源文件都属于一个包,该包在文件顶部使用以下命令声明:
package <packagename>

2022-06-16

问:Go 支持什么形式的类型转换? 将整数转换为浮点数?
Go 支持 显式类型转换 以满足其严格的类型要求。

2022-06-17

问:Go 程序中的包是什么?
(pkg) 是 Go 工作区中包含 Go 源文件或其他包的目录。源文件中的每个函数、变量和类型都存储在链接包中。每个 Go 源文件都属于一个包,该包在文件顶部使用以下命令声明:
package <packagename>

2022-06-18

问:什么是 Goroutine? 如何停止它?

  • 将要并发执行的任务包装成一个函数,调用函数的时候加上 go 关键字,就能够开启一个 goroutine 去执行该函数的任务。

  • goroutine 对应的函数执行完,该 goroutine 就结束了。

  • 程序启动的时候会自动创建一个 goroutine 去执行 main 函数。

  • main 函数结束了,那么程序就结束了,由该程序启动的所有其他 goroutine 也都结束了。

  • goroutine 对应的函数执行结束了, goroutine 就结束了。

  • main 函数执行结束了,由 main 函数启动的 goroutine 也都结束了。

2022-06-19

问: 如何在运行时检查变量类型?
类型开关(Type Switch)是在运行时检查变量类型的最佳方式。类型开关按类型 而不是值来评估变量。每个 Switch 至少包含一个 case 用作条件语句,如果没 有一个 case 为真,则执行 default

2022-06-20

问: Go 两个接口之间可以存在什么关系?
如果两个接口有相同的方法列表,那么他们就是等价的,可以相互赋值。如果 接口 A 的方法列表是接口 B 的方法列表的子集,那么接口 B 可以赋值给接口 A。接口查询是否成功,要在运行期才能够确定。

2022-06-21

问: Go 当中同步锁有什么特点?作用是什么?
同步锁的特点:

  • Mutex:当一个 Goroutine(协程)获得了 Mutex 后,其他 Gorouline(协程)就只能进入等待之中,除非该 gorouline 释放了该 Mutex

  • RWMutex(读写锁):RWMutex 在读锁占用的情况下,会阻止写,但不阻止读;RWMutex 在写锁占用情况下,会阻止任何其他 goroutine(读和写)进来,整个锁相当于由该 goroutine(协程)独占。

    同步锁的作用:保证资源在使用时的独有性,不会因为并发而导致数据错乱,保证系统并发时的稳定性。

2022-06-22

问: Go 语言当中 Channel(通道)有什么特点,需要注意什么?

如果给一个 nilchannel 发送数据,会造成永远阻塞。
如果从一个 nil 的 channel 中接收数据,也会造成永久阻塞。 给一个已经关闭的 channel 发送数据, 会引起 panic
从一个已经关闭的 channel 接收数据, 如果缓冲区中为空,则返回一个 零 值。

2022-06-23

问:Go 语言中 cap 函数可以作用于哪些内容?
可以作用于的类型有:

  • array(数组)
  • slice(切片)
  • channel(通道)

2022-06-24

问:goconvey 是什么? 一般用来做什么? github: goconvey

  • goconvey 是一个支持 Golang 的单元测试框架
  • goconvey能够自动监控文件修改并启动测试,并可以将测试结果实时输出到 Web 界面
  • goconvey 提供了丰富的断言简化测试用例的编写

配置 elasticsearch

2022-06-25

问:Go 语言当中 new 的作用是什么?
new 创建一个该类型的实例,并且返回指向该实例的指针。new 函数是内建函数,函数定义:

1
func new(Type) *Type
  • 使用 new 函数来分配空间
  • 传递给 new 函数的是一个类型,而不是一个值
  • 返回值是指向这个新分配的地址的指针

2022-06-26

问:Go 语言中 make 的作用是什么?
make 的作用是为 slice, map, chan 的初始化 然后返回引用 make 函数是内 建函数,函数定义:

1
func make(Type, size IntegerType) Type

make(T, args) 函数的目的和 new(T) 不同 仅仅用于创建 slice, map, channel 而且返回类型是实例

2022-06-27

问:Printf()Sprintf()FprintF() 都是格式化输出,有什么不同?
虽然这三个函数,都是格式化输出,但是输出的目标不一样。

  • Printf 是标准输出,一般是屏幕,也可以重定向。
  • Sprintf() 是把格式化字符串输出到指定的字符串中。
  • Fprintf() 是把格式化字符串输出到文件中。

2022-06-28

问:Go 语言当中数组和切片的区别是什么?
数组: 数组固定长度。数组长度是数组类型的一部分,所以 [3]int[4]int 是两种不同的数组类型数组需要指定大小,不指定也会根据初始化,自动推算出大小, 大小不可改变。数组是通过值传递的。
切片: 切片可以改变长度。切片是轻量级的数据结构,三个属性,指针,长度,容量 不需要指定大小切片是地址传递(引用传递)可以通过数组来初始化,也可以 通过内置函数 make() 来初始化,初始化的时候 len=cap,然后进行扩容。

2022-06-29

问:Go 语言当中值传递和地址传递(引用传递)如何运用?有什么区别?举例说明

  • 值传递只会把参数的值复制一份放进对应的函数,两个变量的地址不同, 不可相互修改。
  • 地址传递(引用传递)会将变量本身传入对应的函数,在函数中可以对该变 量进行值内容的修改。

2022-06-30

问:Go 语言当中数组和切片在传递的时候的区别是什么?

  • 数组是值传递
  • 切片看上去像是引用传递,但其实是值传递。

2022-07-01

问:Go 语言是如何实现切片扩容的?
在数组容量小于 1024 时,扩容以当前容量2倍进行扩容。但到了 1024 之后, 每次是原容量四分之一左右。

2022-07-02

问:看下面代码的 defer 的执行顺序是什么? defer 的作用和特点是什么?

defer 的作用是:

你只需要在调用普通函数或方法前加上关键字 defer,就完成了 defer 所需要 的语法。当 defer 语句被执行时,跟在 defer 后面的函数会被延迟执行。直到 包含该 defer 语句的函数执行完毕时,defer 后的函数才会被执行,不论包含 defer 语句的函数是通过 return 正常结束,还是由于 panic 导致的异常结束。 你可以在一个函数中执行多条 defer 语句,它们的执行顺序与声明顺序相反。

defer 的常用场景:

  • defer 语句经常被用于处理成对的操作,如打开、关闭、连接、断开连接、加锁、释放锁。
  • 通过 defer 机制,不论函数逻辑多复杂,都能保证在任何执行路径下,资源被释放。
  • 释放资源的 defer 应该直接跟在请求资源的语句后。

2022-07-03

问:Golang Slice 的底层实现?
切片是基于数组实现的,它的底层是数组,它自己本身非常小,可以理解为对底层数组的抽象。因为基于数组实现,所以它的底层的内存是连续分配的,效率非常高,还可以通过索引获得数据。切片本身并不是动态数组或者数组指针。它内部实现的数据结构通过指针引用底层数组,设定相关属性将数据读写操作限定在指定的区域内。切片本身是一个只读对象,其工作机制类似数组指针的一种封装。

切片对象非常小,是因为它是只有 3 个字段的数据结构:

  • 指向底层数组的指针
  • 切片的长度
  • 切片的容量

2022-07-04

问:Golang Slice 的扩容机制,有什么注意点?
Go 中切片扩容的策略是这样的:

  • 首先判断,如果新申请容量大于2倍的旧容量,最终容量就是新申请的容量
  • 否则判断,如果旧切片的长度小于1024,则最终容量就是旧容量的两倍
  • 否则判断,如果旧切片长度大于等于1024,则最终容量从旧容量开始循环增加原来的 1/4, 直到最终容量大于等于新申请的容量
  • 如果最终容量计算值溢出,则最终容量就是新申请容量

2022-07-05

问:扩容前后的 Slice 是否相同?

  • 原数组还有容量可以扩容(实际容量没有填充完),这种情况下,扩容以后的数组还是指向原来的数组,对一个切片的操作可能影响多个指针指向相同地址的 Slice
  • 原来数组的容量已经达到了最大值,再想扩容, Go 默认会先开一片内存区域,把原来的值拷贝过来,然后再执行 append() 操作。这种情况丝毫不影响原数组。
  • 要复制一个 Slice,最好使用 Copy 函数。

2022-07-06

问:Golang 的参数传递、引用类型?
Go 语言中所有的传参都是值传递(传值),都是一个副本,一个拷贝。因为拷贝的内容有时候是非引用类型( int、string、struct 等),这样就在函数中就无法修改原内容数据;有的是引用类型( pointer、map、slice、chan 等),这样就可以修改原内容数据。
Golang 的引用类型包括 slicemapchannel。它们有复杂的内部结构,除了申请内存外,还需要初始化相关属性。内置函数 new 计算类型大小,为其分配零值内存,返回指针。而 make 会被编译器翻译成具体的创建函数,由其分配内存和初始化成员结构,返回对象而非指针。

2022-07-07

问:Golang Map 底层实现?
Golangmap 的底层实现是一个散列表,因此实现 map 的过程实际上就是实现 散表的过程。在这个散列表中,主要出现的结构体有两个,一个叫 hmap(a header for a go map),一个叫 bmap(a bucket for a Go map,通常叫其 bucket)。

2022-07-08

问:Golang Map 如何扩容?

  • 双倍扩容: 扩容采取了一种称为“渐进式”的方式,原有的 key 并不会一次性搬迁完毕,每次最多只会搬迁 2 个 bucket
  • 等量扩容: 重新排列,极端情况下,重新排列也解决不了,map 存储就会蜕变成链表,性能大大降低,此时哈希因子 hash0 的设置,可以降低此类极端场景的发生。

2022-07-09

问:Golang Map 查找?
Go 语言中 map 采用的是哈希查找表,由一个 key 通过哈希函数得到哈希值,64 位系统中就生成一个 64bit 的哈希值,由这个哈希值将 key 对应存到不同的桶 (bucket)中,当有多个哈希映射到相同的的桶中时,使用链表解决哈希冲突。
细节: key 经过 hash 后共 64 位,根据 hmap 中 B 的值,计算它到底要落在哪个桶时,桶的数量为 2^B,如 B=5,那么用 64 位最后 5 位表示第几号桶,在用 hash 值的高 8 位确定在 bucket 中的存储位置,当前 bmap 中的 bucket 未找到,则查询对应的 overflow bucket ,对应位置有数据则对比完整的哈希值, 确定是否是要查找的数据。如果当前 map 处于数据搬移状态,则优先从 oldbuckets 查找。

2022-07-10

问:介绍一下 channel
Go 语言中,不是通过共享内存来通信,而是通过通信来实现内存共享。GoCSP(Communicating Sequential Process)并发模型,中文可以叫做通信顺序进程,是通过 goroutinechannel 来实现的。
channel 收发遵循先进先出 FIFO 的原则。分为有缓冲区和无缓冲区,channel 中包括 buffer、sendxrecvx 收发的位置(ring buffer 记录实现)、sendqrecv。当 channel 因为缓冲区不足而阻塞了队列,则使用双向链表存储。

2022-07-11

问:Channelring buffer 实现 ?
channel 中使用了 ring buffer (环形缓冲区) 来缓存写入的数据。ring buffer 有很多好处,而且非常适合用来实现 FIFO 式的固定长度队列。 在 channel 中,ring buffer 的实现如下:

上图展示的是一个缓冲区为 8 的 channel bufferrecvx 指向最早被读取的数据,sendx 指向再次写入时插入的位置。

GO 并发编程

2022-07-12

问:Mutex 几种状态 ?

  • mutexLocked — 表示互斥锁的锁定状态;
  • mutexWoken — 表示从正常模式被从唤醒;
  • mutexStarving — 当前的互斥锁进入饥饿状态;
  • waitersCount — 当前互斥锁上等待的 Goroutine 个数;

2022-07-13

问:Mutex 正常模式和饥饿模式 ?

正常模式(非公平锁)

正常模式下,所有等待锁的 goroutine 按照 FIFO(先进先出)顺序等待。唤醒的 goroutine 不会直接拥有锁,而是会和新请求 goroutine 竞争锁。新请求的 goroutine 更容易抢占:因为它正在 CPU 上执行,所以刚刚唤醒的 goroutine 有很大可能在锁竞争中失败。在这种情况下,这个被唤醒的 goroutine 会加入到等待队列的前面。

饥饿模式(公平锁)

为了解决了等待 goroutine 队列的长尾问题饥饿模式下,直接由 unlock 把锁交给等待队列中排在第一位的 goroutine (队头),同时,饥饿模式下,新进来的 goroutine 不会参与抢锁也不会进入自旋状态,会直接进入等待队列的尾部。这样很好的解决了老的 goroutine到锁的场景。 饥饿模式的触发条件: 当一个 goroutine等待锁时间超过 1 毫秒时,或者当前队列只剩下一个goroutine 的时候,Mutex` 切换到饥饿模式。

总结

对于两种模式,正常模式下的性能是最好的,goroutine 可以连续多次获取锁,饥饿模式解决了取锁公平的问题,但是性能会下降,这其实是性能和公平的一个平衡模式。

2022-07-14

问:Mutex 允许自旋的条件?

  • 锁已被占用,并且锁不处于饥饿模式。
  • 积累的自旋次数小于最大自旋次数(active_spin=4)。
  • CPU核数大于1。
  • 有空闲的P。
  • 当前Goroutine所挂载的P下,本地待运行队列为空。

2022-07-15

问:RWMutex 实现 ?
通过记录 readerCount 读锁的数量来进行控制,当有一个写锁的时候,会将读锁数量设置为负数 1<<30。目的是让新进入的读锁等待之前的写锁释放通知读锁。同样的当有写锁进行抢占时,也会等待之前的读锁都释放完毕,才会开始进行后续的操作。 而等写锁释放完之后,会将值重新加上 1<<30, 并通知刚才新进入的读锁(rw.readerSem),两者互相限制。

2022-07-16

问:RWMutex 注意事项 ?

  • RWMutex 是单写多读锁,该锁可以加多个读锁或者一个写锁
  • 读锁占用的情况下会阻止写,不会阻止读,多个 Goroutine 可以同时获取读锁
  • 写锁会阻止其他 Goroutine (无论读和写)进来,整个锁由该 Goroutine 独占
  • 适用于读多写少的场景
  • RWMutex 类型变量的零值是一个未锁定状态的互斥锁
  • RWMutex 在首次被使用之后就不能再被拷贝
  • RWMutex 的读锁或写锁在未锁定状态,解锁操作都会引发 panic
  • RWMutex 的一个写锁去锁定临界区的共享资源,如果临界区的共享资源已被(读锁或写锁)锁定,这个写锁操作的 goroutine 将被阻塞直到解锁
  • RWMutex 的读锁不要用于递归调用,比较容易产生死锁
  • RWMutex 的锁定状态与特定的 goroutine 没有关联。一个 goroutine 可以 RLock(Lock),另一个 goroutine 可以 RUnlock(Unlock)
  • 写锁被解锁后,所有因操作锁定读锁而被阻塞的 goroutine 会被唤醒,并都可以成功锁定读锁
  • 读锁被解锁后,在没有被其他读锁锁定的前提下,所有因操作锁定写锁而被阻塞的 Goroutine,其中等待时间最长的一个 Goroutine 会被唤醒

2022-07-17

问:Cond 是什么
Cond 实现了一种条件变量,可以使用在多个 Reader 等待共享资源 ready 的场景(如果只有一读一写,一个锁或者 channel 就搞定了)每个 Cond 都会关联一个 Lock(*sync.Mutex or *sync.RWMutex),当修改条件或者调用 Wait 方法时,必须加锁,保护 condition

2022-07-18

问:BroadcastSignal 区别 ?

1
func (c *Cond) Broadcast()

Broadcast 会唤醒所有等待 cgoroutine。调用 Broadcast 的时候,可以加锁,也可以不加锁。

1
func (c *Cond) Signal()

Signal 只唤醒 1 个等待 cgoroutine。调用 Signal 的时候,可以加锁,也可以不加锁。

2022-07-19

问:CondWait 使用

1
func (c *Cond) Wait()

Wait() 会自动释放 c.L 锁,并挂起调用者的 goroutine。之后恢复执行, Wait()会在返回时对 c.L 加锁。除非被 Signal 或者 Broadcast 唤醒,否则 Wait() 不会返回。
由于 Wait() 第一次恢复时,C.L 并没有加锁,所以当 Wait 返回时,调用者通常并不能假设条件为真。如下代码:

1
2
3
4
5
c.L.Lock()
for !condition() {
c.Wait() }
... make use of condition ...
c.L.Unlock()

取而代之的是, 调用者应该在循环中调用 Wait。(简单来说,只要想使用 condition,就必须加锁。)

2022-07-20

问:WaitGroup 用法?
一个 WaitGroup 对象可以等待一组协程结束。使用方法是:

  • main 协程通过调用 wg.Add(delta int) 设置 worker 协程的个数,然后创建 worker 协程;
  • worker 协程执行结束以后,都要调用 wg.Done();
  • main 协程调用 wg.Wait() 且被 block,直到所有 worker 协程全部执行结束后返回。

2022-07-21

问:WaitGroup 实现原理?

  • WaitGroup 主要维护了 2 个计数器,一个是请求计数器 v,一个是等待计数器 w,二者组成一个 64bit 的值,请求计数器占高 32bit,等待计数器占低 32bit
  • 每次 Add 执行,请求计数器 v 加 1 , Done 方法执行,等待计数器减1,v 为 0 时通过信号量唤醒 Wait()

2022-07-22

问:什么是 sync.Once?

  • Once 可以用来执行且仅仅执行一次动作,常常用于单例对象的初始化场景。
  • Once 常常用来初始化单例资源,或者并发访问只需初始化一次的共享资源,或者在测试的时候初始化一次测试资源。
  • sync.Once 只暴露了一个方法 Do,你可以多次调用 Do 方法,但是只有第一次调用 Do 方法时 f 参数才会执行,这里的 f 是一个无参数无返回值的函数。

2022-07-23

问:什么操作叫做原子操作?
原子操作即是进行过程中不能被中断的操作,针对某个值的原子操作在被进行的过程中,CPU 绝不会再去进行其他的针对该值的操作。为了实现这样的严谨性,原子操作仅会由一个独立的 CPU 指令代表和完成。原子操作是无锁的,常常直接通过 CPU 指令直接实现。 事实上,其它同步技术的实现常常依赖于原子操作。

2022-07-24

问:原子操作和锁的区别?
原子操作由底层硬件支持,而锁则由操作系统的调度器实现。 锁应当用来保护一段逻辑,对于一个变量更新的保护, 原子操作通常执行上会更有效率,并且更能利用计算机多核的优势,如果要更新的是一个复合对象,则应当使用 atomic.Value 封装好的实现。

2022-07-25

问:什么是 CAS ?
CAS 的全称为 Compare And Swap,直译就是比较交换。是一条 CPU 的原子指令,其作用是让 CPU 先进行比较两个值是否相等,然后原子更新某个位置的值,其实现方式是给予硬件平台的汇编指令,在 intelCPU 中,使用的 cmpxchg 指令,就是说 CAS 是靠硬件实现的,从而在硬件层面提升效率。

简述过程

假设包含 3 个参数内存位置 (V) 、预期原值(A)和新值(B)。V 表示要更新变量的值,E 表示预期值,N 表示新值。仅当 V 值等于 E 值时,才会将 V 的值设为 N, 如果 V 值和 E 值不同,则说明已经有其他线程在做更新,则当前线程什么都不做,最后 CAS 返回当前 V 的真实值。CAS 操作时抱着乐观的态度进行的,它总是认为自己可以成功完成操作。基于这样的原理,CAS 操作即使没有锁,也可以发现其他线程对于当前线程的干扰。

2022-07-26

问:sync.Pool 有什么用 ?
对于很多需要重复分配、回收内存的地方,sync.Pool 是一个很好的选择。频繁地分配、回收内存会给 GC 带来一定的负担,严重的时候会引起 CPU 的毛刺。而 sync.Pool 可以将暂时将不用的对象缓存起来,待下次需要的时候直接使用,不用再次经过内存分配,复用对象的内存,减轻 GC 的压力,提升系统的性能。

Go Runtime

2022-07-27

问:Goroutine 定义 ?
Golang语言级别支持协程,称之为 GoroutineGolang 标准库􏰀供的所有系统调用操作(包括所有的同步 I/O 操作),都会出让 CPU 给其他 Goroutine 。这让 Goroutine 的切换管理不依赖于系统的线程和进程,也不依赖于 CPU 的核心数量,而是交给 Golang 的运行时统一调度。

2022-07-28

问:GMP 指的是什么 ?

  • G(Goroutine): 我们所说的协程,为用户级的轻量级线程,每个 Goroutine 对象中的 sched 保存着其上下文信息。
  • M(Machine): 对内核级线程的封装,数量对应真实的 CPU 数(真正干活的对象)。
  • P(Processor): 即为 GM 的调度对象,用来调度 GM 之间的关联关系, 其数量可通过 GOMAXPROCS() 来设置,默认为核心数。

    2022-07-29

    问:1.0 之前 GM 调度模型 ?
    调度器把 G 都分配到 M 上,不同的 G 在不同的 M 并发运行时,都需要向系统申请资源,比如堆栈内存等,因为资源是全局的,就会因为资源竞争照成很多性能损耗。为了解决这一的问题 go1.1 版本引入,在运行时系统的时候加入 p 对象,让 P 去管理这个 G 对象,M 想要运行 G,必须绑定 P,才能运行 P 所管理的 G
    GM 调度存在的问题:
  • 单一全局互斥锁(Sched.Lock)和集中状态存储
  • Goroutine 传递问题(M 经常在 M 之间传递”可运行”的 goroutine)
  • 每个 M 做内存缓存,导致内存占用过高,数据局部性较差
  • 频繁 syscall 调用,导致严重的线程阻塞/解锁,加剧额外的性能损耗。

2022-07-30

问:GMP 调度流程 ?

  • 每个 P 有个局部队列,局部队列保存待执行的 goroutine (流程2),当 M 绑定的 P 的的局部队列已经满了之后就会把 goroutine 放到全局队列(流程 2-1)
  • 每个 P 和一个 M 绑定,M 是真正的执行 Pgoroutine 的实体(流程3), M 从绑定的 P 中的局部队列获取 G 来执行
  • M 绑定的 P 的局部队列为空时,M 会从全局队列获取到本地队列来执行 G (流程 3.1),当从全局队列中没有获取到可执行的 G 时候,M 会从其他 P 的局部队列中偷取 G 来执行(流程 3.2),这种从其他 P 偷的方式称为 work stealing
  • G 因系统调用(syscall)阻塞时会阻塞 M ,此时 P 会和 M 解绑即 hand off ,并寻找新的 idleM,若没有 idleM 就会新建一个 M(流程 5.1)
  • Gchannel 或者 network I/O 阻塞时,不会阻塞 MM 会寻找其他 runnableG;当阻塞的 G 恢复后会重新进入 runnable 进入 P 队列等待执行(流程 5.3)

2022-07-31

问:GMPwork stealing 机制 ?
获取 P 本地队列,当从绑定 P 本地 runq 上找不到可执行的 g,尝试从全局链表中拿,再拿不到从 netpoll 和事件池里拿,最后会从别的 P 里偷任务。P 此时去唤醒一个 MP 继续执行其它的程序。M 寻找是否有空闲的 P,如果有则将该 G 对象移动到它本身。接下来 M 执行一个调度循环(调用 G 对象 -> 执行 -> 清理线程 → 继续找新的 Goroutine 执行)。

2022-08-01

问:GMPhand off 机制 ?
当本线程 M 因为 G 进行的系统调用阻塞时,线程释放绑定的 P,把 P 转移给其他空闲的 M 执行。 细节:当发生上线文切换时,需要对执行现场进行保护,以便下次被调度执行时进行现场恢复。Go 调度器 M 的栈保存在 G 对象上,只需要将 M 所需要的寄存器(SPPC 等)保存到 G 对象上就可以实现现场保护。当这些寄存器数据被保护起来,就随时可以做上下文切换了,在中断之前把现场保存起来。如果此时 G 任务还没有执行完,M 可以将任务重新丢到 P 的任务队列,等待下一次被调度执行。当再次被调度执行时,M 通过访问 GvdsoSPvdsoPC 寄存器进行现场恢复(从上次中断位置继续执行)。

2022-08-02

问:协作式的抢占式调度 ?
在 1.14 版本之前,程序只能依靠 Goroutine 主动让出 CPU 资源才能触发调 度。这种方式存在问题有:

  • 某些 Goroutine 可以长时间占用线程,造成其它 Goroutine 的饥饿;
  • 垃圾回收需要暂停整个程序(Stop-the-world,STW),最长可能需要几分钟的时间,导致整个程序无法工作.

2022-08-03

问:基于信号的抢占式调度?
在任何情况下,Go 运行时并行执行(注意,不是并发)的 goroutines 数量是 小于等于 P 的数量的。为了提高系统的性能,P 的数量肯定不是越小越好,所以官方默认值就是 CPU 的核心数,设置的过小的话,如果一个持有 PM, 由于 P 当前执行的 G 调用了 syscall 而导致 M 被阻塞,那么此时关键点: GO 的调度器是迟钝的,它很可能什么都没做,直到 M 阻塞了相当长时间以后,才会发现有一个 P/Msyscall 阻塞了。然后,才会用空闲的 M 来强这个 P。通过 sysmon 监控实现的抢占式调度,最快在 20us,最慢在 10-20ms 才 会发现有一个 M 持有 P 并阻塞了。操作系统在 1ms 内可以完成很多次线程调度(一般情况 1ms 可以完成几十次线程调度),Go 发起 IO/syscall 的时候执行该 GM 会阻塞然后被 OS 调度走,P 最慢要 10-20ms 才能发现这个阻塞,说不定那时候阻塞已经结束了,这样宝贵的 P 资源就这么被阻塞的 M 浪费了。

2022-08-04

问:GMP 调度过程中存在哪些阻塞?

  • I/Oselect
  • block on syscall
  • channel
  • 等待锁
  • runtime.Gosched()

2022-08-05

问:Sysmon 有什么作用?
Sysmon 也叫监控线程,变动的周期性检查,好处:

  • 释放闲置超过 5 分钟的 span 物理内存;
  • 如果超过2分钟没有垃圾回收,强制执行;
  • 将长时间未处理的 netpoll 添加到全局队列;
  • 向长时间运行的 G 任务发出抢占调度(超过 10msg,会进行 retake);
  • 收回因 syscall 长时间阻塞的 P;

2022-08-06

问:三色标记原理
原理:

  • 首先把所有的对象都放到白色的集合中:
  • 从根节点开始遍历对象,遍历到的白色对象从白色集合中放到灰色集合中
  • 遍历灰色集合中的对象,把灰色对象引用的白色集合的对象放入到灰色集合中,同时把遍历过的灰色集合中的对象放到黑色的集合中
  • 循环步骤3,知道灰色集合中没有对象
  • 步骤4结束后,白色集合中的对象就是不可达对象,也就是垃圾,进行回收

2022-08-07

问:写屏障
Go 在进行三色标记的时候并没有 STW,也就是说,此时的对象还是可以进行修改。
我们在进行三色标记中扫􏰀灰色集合中,扫􏰀到了对象 A,并标记了对象 A 的 所有引用,这时候,开始扫􏰀对象 D 的引用,而此时,另一个 goroutine 修改 了 D->E 的引用。
这样会不会导致 E 对象就扫􏰀不到了,而被误认为 为白色对象,也就是垃圾 写屏障就是为了解决这样的问题,引入写屏障后,在上述步骤后,E 会被认为 是存活的,即使后面 E 被 A 对象抛弃,E 会被在下一轮的 GC 中进行回收,这一 轮 GC 中是不会对对象 E 进行回收的。

2022-08-08

问:插入写屏障
Go GC 在混合写屏障之前,一直是插入写屏障,由于栈赋值没有 hook 的原因,栈中没有启用写屏障,所以有 STW。Golang 的解决方法是:只是需要在结束时启动 STW 来重新扫描栈。这个自然就会导致整个进程的赋值器卡顿。

2022-08-09

问:删除写屏障
Golang 没有这一步,Golang 的内存写屏障是由插入写屏障到混合写屏障过渡 的。简单介绍一下,一个对象即使被删除了最后一个指向它的指针也依旧可以活过这一轮,在下一轮 GC 中才被清理掉。

2022-08-10

问:删除写屏障

  • 混合写屏障继承了插入写屏障的优点,起始无需 STW 打快照,直接并发扫描垃圾即可;
  • 混合写屏障继承了删除写屏障的优点,赋值器是黑色赋值器,GC期间,任何在栈上创建的新对象,均为黑色,扫描过一次就不需要扫描了,这样就消除了插入写屏障时期最后 STW 的重新扫描栈;
  • 混合写屏障扫􏰀精度继承了删除写屏障,比插入写屏障更低,随着带来的 是 GC 过程全程无 STW;
  • 混合写屏障扫􏰀栈虽然没有 STW,但是扫􏰀某一个具体的栈的时候,还是 要停止这个 goroutine 赋值器的工作(针对一个 goroutine 栈来说,是 暂停扫的,要么全灰,要么全黑,原子状态切换)。

2022-08-11

问:GC 触发时机
主动触发: 调用 runtime.GC
被动触发: 使用系统监控,该触发条件由 runtime.forcegcperiod 变量控制,默认为 2 分 钟。当超过两分钟没有产生任何 GC 时,强制触发 GC。 使用步调(Pacing)算法,其核心思想是控制内存增长的比例。如 GoGC 是一种比例 GC, 下一次 GC 结束时的堆大小和上一次 GC 存活堆大小成比例.

2022-08-12

问:Go 语言中 GC 的流程是什么?
Go1.14 版本以 STW 为界限,可以将 GC 划分为五个阶段:

  • GCMark 标记准备阶段,为并发标记做准备工作,启动写屏障
  • STWGCMark 扫描标记阶段,与赋值器并发执行,写屏障开启并发
  • GCMarkTermination 标记终止阶段,保证一个周期内标记任务完成,停止写屏障
  • GCoff 内存清扫阶段,将需要回收的内存归还到堆中,写屏障关闭
  • GCoff 内存归还阶段,将过多的内存归还给操作系统,写屏障关闭

2022-08-13

问:GC 如何调优
通过 go tool pprofgo tool trace 等工具

  • 控制内存分配的速度,限制 Goroutine 的数量,从而提高赋值器对 CPU 的利用率。
  • 减少并复用内存,例如使用 sync.Pool 来复用需要频繁创建临时对象,例如提前分配足够的内存来降低多余的拷贝。
  • 需要时,增大 GOGC 的值,降低 GC 的运行频率。

Docker 安装使用并连接 Redis

Docker 下拉取最新的镜像,命令:

1
docker pull redis

查看已安装镜像:

1
docker images

启动一个 redis 实例:

1
2
docker run -itd --name redis_test -p 6379:6379 redis
docker run -itd --name redis_web_app -p 6379:6379 redis

通过 redis-cli 链接 redis:

1
docker exec -it redis_test /bin/bash

MySQL 安装并链接同理。
设置字符集:echo "export LANG=C.UTF-8" >>/etc/profile && source /etc/profile

Goland web 项目所需要的设计模式,项目结构

爬取 豆瓣 电影列表

创建表 select_movies_subjects

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
create table select_movies_subjects
(
episodes_info text null comment '提示信息',
rate varchar(20) null comment '评分',
cover_x double null comment '封面宽度',
title text null comment '标题',
url text null comment '电影链接',
playable tinyint(1) null comment '是否可以播放',
cover text null comment '封面图片链接',
id text null comment '电影标识',
cover_y double null comment '封面图片高度',
is_new tinyint(1) null comment '是否是新上映电影',
m_id int auto_increment comment '自增主键' primary key
);

alter table select_movies_subjects
modify title text null comment '标题';

create table select_movies_subjects (
episodes_info text null comment '提示信息',
rate varchar(20) null comment '评分',
cover_x double null comment '封面宽度',
title text null comment '标题',
url text null comment '电影链接',
playable tinyint(1) null comment '是否可以播放',
cover text null comment '封面图片链接',
id bigint not null comment '电影标识' primary key,
cover_y double null comment '封面图片高度',
is_new tinyint(1) null comment '是否是新上映电影'
);


create table select_tvs_tag
(
id bigint auto_increment
primary key,
name varchar(20) default '' null
);

create table select_tvs_subjects
(
episodes_info text null comment '提示信息',
rate varchar(20) null comment '评分',
cover_x double null comment '封面宽度',
title text null comment '标题',
url text null comment '电视剧链接',
playable tinyint(1) null comment '是否可以播放',
cover text null comment '封面图片链接',
id text null comment '电视剧标识',
cover_y double null comment '封面图片高度',
is_new tinyint(1) null comment '是否是新上映电视剧',
m_id int auto_increment comment '自增主键' primary key
);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
CREATE TABLE user (
`id` bigint (20) NOT NULL AUTO_INCREMENT,
`user_id` bigint (20) NOT NULL,
`username` varchar (64) COLLATE utf8mb4_general_ci NOT NULL,
`password` varchar (64) COLLATE utf8mb4_general_ci NOT NULL,
`email` varchar (64) COLLATE utf8mb4_general_ci,
`gender` tinyint (4) NOT NULL DEFAULT '0',
`create_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
`update time` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`),
UNIQUE KEY `idx_username` (`username`) USING BTREE,
UNIQUE KEY `idx_user_id` (`user_id`) USING BTREE
)
ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

开发小技巧

JS中标识最大的整数:2^53-1, Go中表达最大的整数是: 2^63-1,在传值的过程中,会出现js无法表现超出其表现范围的数字。
解决的办法是在go端返回给前端数据的时,将将该字段转成字符串传递,而在go中表现的更简单一些,就是在tag中加上,string 即可。
实例:

1
2
3
4
5
6
type User struct {
UserID int64 `db:"user_id,string"`
Username string `db:"username"`
Password string `db:"password"`
Token string `db:"token"`
}

use mysql;
ALTER USER ‘root‘@’localhost’ IDENTIFIED WITH mysql_native_password BY ‘123456’;
FLUSH PRIVILEGES;

nginx 部署项目 配置文件实例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
server {
listen 80;
server_name localhost;

access_log /var/log/webapp-access.log;
error_log /var/logwebapp-error.log;

location / {
proxy_pass http://127.0.0.1:8084;
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
坚持原创技术分享,您的支持将鼓励我继续创作!

欢迎关注我的其它发布渠道