侧边栏壁纸
博主头像
汪洋

即使慢,驰而不息,纵会落后,纵会失败,但一定可以达到他所向的目标。 - 鲁迅

  • 累计撰写 190 篇文章
  • 累计创建 74 个标签
  • 累计收到 108 条评论

Go - 内存管理器的内存分配策略

汪洋
2022-05-15 / 0 评论 / 0 点赞 / 143 阅读 / 3,389 字

关于 Go 的内存分配

Go 语言里,从内存的分配到不再使用后内存的回收等等这些内存管理工作都是由 Go 在底层完成的。虽然开发者在写代码时不必过度关心内存从分配到回收这个过程,但是 Go 的内存分配策略里有不少有意思的设计,通过了解他们有助于我们自身的提高,也让我们能写出更高效的 Go 程序。

Go 内存管理的设计旨在在并发环境中快速运行,并与垃圾回收器集成在一起。让我们看一个简单的示例:

package main

type smallStruct struct {
	a, b int64
	c, d float64
}

func main() {
	smallAllocation()
}

//go:noinline
func smallAllocation() *smallStruct {
	return &smallStruct{}
}

函数上面的注释//go:noinline将禁止Go对该函数进行内联,这样main函数就会使用smallAllocation函数返回的指针变量,因为被多个函数使用,返回的这个变量将被分配到堆上。

关于内联的概念之前的文章有说过:

内联是一种手动或编译器优化,用于将简短函数的调用替换为函数体本身。这么做的原因是它可以消除函数调用本身的开销,也使得编译器能更高效地执行其他的优化策略。

所以如果上面的例子不干预编译器的话,编译器通过内联将smallAllocation函数体里的内容直接放到main函数里,这样就不会产生smallAllocation这个函数的调用了,所有的变量都是main函数内这个范围使用的,也就不在需要将变量往堆上分配了。

继续说上面那个例子,通过逃逸分析命令 go tool compile -m main.go 可以确认我们上面的分析,&smallStruct{}会被分配到堆上去。

➜ go tool compile -m main.go
main.go:12:6: can inline main
main.go:10:9: &smallStruct literal escapes to heap

借助命令go tool compile -S main.go,可以显示该程序的汇编代码,也可以明确地向我们展示内存的分配:

0x001d 00029 (main.go:10)       LEAQ    type."".smallStruct(SB), AX
0x0024 00036 (main.go:10)       PCDATA  $2, $0
0x0024 00036 (main.go:10)       MOVQ    AX, (SP)
0x0028 00040 (main.go:10)       CALL    runtime.newobject(SB)

内置函数newobject会通过调用另外一个内置函数mallocgc在堆上分配新内存。在Go里面有两种内存分配策略,一种适用于程序里小内存块的申请,另一种适用于大内存块的申请,大内存块指的是大于32KB。

下面我们来细聊一下这两种策略。

小于 32KB 内存块的分配策略

当程序里发生了32kb以下的小块内存申请时,Go会从一个叫做的mcache的本地缓存给程序分配内存。这个本地缓存mcache持有一系列的大小为32kb的内存块,这样的一个内存块里叫做mspan,它是要给程序分配内存时的分配单元。

在Go的调度器模型里,每个线程M会绑定给一个处理器P,在单一粒度的时间里只能做多处理运行一个goroutine,每个P都会绑定一个上面说的本地缓存mcache。当需要进行内存分配时,当前运行的goroutine会从mcache中查找可用的mspan。从本地mcache里分配内存时不需要加锁,这种分配策略效率更高。

那么有人就会问了,有的变量很小就是数字,有的却是一个复杂的结构体,申请内存时都分给他们一个mspan这样的单元会不会产生浪费。其实mcache持有的这一系列的mspan并不都是统一大小的,而是按照大小,从8字节到32KB分了大概70类的msapn

就文章开始的那个例子来说,那个结构体的大小是32字节,正好32字节的这种mspan能满足需求,那么分配内存的时候就会给它分配一个32字节大小的mspan

现在,我们可能会好奇,如果分配内存时mcachce里没有空闲的32字节的mspan了该怎么办?Go里还为每种类别的mspan维护着一个mcentral

mcentral的作用是为所有mcache提供切分好的mspan资源。每个central会持有一种特定大小的全局mspan列表,包括已分配出去的和未分配出去的。每个mcentral对应一种mspan,当工作线程的mcache中没有合适(也就是特定大小的)的mspan时就会从mcentral 去获取。mcentral被所有的工作线程共同享有,存在多个goroutine竞争的情况,因此从mcentral获取资源时需要加锁。

mcentral的定义如下:

//runtime/mcentral.go

type mcentral struct {
    // 互斥锁
    lock mutex 
    
    // 规格
    sizeclass int32 
    
    // 尚有空闲object的mspan链表
    nonempty mSpanList 
    
    // 没有空闲object的mspan链表,或者是已被mcache取走的msapn链表
    empty mSpanList 
    
    // 已累计分配的对象个数
    nmalloc uint64 
}

mcentral里维护着两个双向链表,nonempty表示链表里还有空闲的mspan待分配。empty表示这条链表里的mspan都被分配了object

如果上面我们那个程序申请内存的时候,mcache里已经没有合适的空闲mspan了,那么工作线程就会像下图这样去mcentral里去申请。

简单说下mcachemcentral获取和归还mspan的流程:

  • 获取 加锁;从nonempty链表找到一个可用的mspan;并将其从nonempty链表删除;将取出的mspan加入到empty链表;将mspan返回给工作线程;解锁。
  • 归还 加锁;将mspanempty链表删除;将mspan加入到nonempty链表;解锁。

mcentral没有空闲的mspan时,会向mheap申请。而mheap没有资源时,会向操作系统申请新内存。mheap主要用于大对象的内存分配,以及管理未切割的mspan,用于给mcentral切割成小对象。

同时我们也看到,mheap中含有所有规格的mcentral,所以,当一个mcachemcentral申请mspan时,只需要在独立的mcentral中使用锁,并不会影响申请其他规格的mspan

上面说了每种尺寸的mspan都有一个全局的列表存放在mcentral里供所有线程使用,所有mcentral的集合则是存放于mheap中的。mheap里的arena 区域是真正的堆区,运行时会将 8KB 看做一页,这些内存页中存储了所有在堆上初始化的对象。运行时使用二维的 runtime.heapArena 数组管理所有的内存,每个 runtime.heapArena 都会管理 64MB 的内存。

如果 arena 区域没有足够的空间,会调用 runtime.mheap.sysAlloc 从操作系统中申请更多的内存。

大于32KB内存块的分配策略

Go 没法使用工作线程的本地缓存 mcache 和全局中心缓存 mcentral 上管理超过 32KB 的内存分配,所以对于那些超过32KB的内存申请,会直接从堆上(mheap)上分配对应的数量的内存页(每页大小是8KB)给程序。

总结

我们把内存分配管理涉及的所有概念串起来,可以勾画出 Go 内存管理的一个全局视图:

Go语言的内存分配非常复杂,这个文章从一个比较粗的角度来看Go的内存分配,并没有深入细节。一般而言,了解它的原理,到这个程度也就可以了(应付面试)。

总结起来关于Go内存分配管理的策略有如下几点:

  • Go在程序启动时,会向操作系统申请一大块内存,由mheap结构全局管理。
  • Go内存管理的基本单元是mspan,每种mspan可以分配特定大小的object
  • mcache, mcentral, mheapGo内存管理的三大组件,mcache管理线程在本地缓存的mspanmcentral管理全局的mspan供所有线程使用;mheap管理Go的所有动态分配内存。
  • 一般小对象通过mspan分配内存;大对象则直接由mheap分配内存。
0

评论区