brk（）系统调用是做什么的？

2018-07-01 00:26:56

根据Linux程序员手册：

brk（）和sbrk（）更改程序中断的位置，该中断定义了进程数据段的结尾。

数据段在这里意味着什么？它只是数据段或数据，BSS和堆的组合？

根据维基：

有时数据，BSS和堆区统称为“数据段”。

我没有理由改变数据段的大小。如果它是数据，BSS和堆集体然后它是有道理的，因为堆将获得更多的空间。

这让我想到了第二个问题。在我读到的所有文章中，作者说，堆向上增长，堆栈向下增长。但是他们没有解释的是，当堆占用堆和栈之间的所有空间时会发生什么？

我看到很多部分的答案，但没有完整的答案。这是您再次发布的图片：

虚拟内存布局的简化图像

“break” - 由brk和sbrk操作的地址 - 是堆顶部的虚线。您读过的文档将此描述为“数据段”的末尾，因为在传统（预共享库，预mmap ）Unix中，数据段与堆是连续的; 在程序启动之前，内核会将“文本”和“数据”块从地址0（实际上高于地址0，因此NULL指针真正没有指向任何东西）加载到RAM中，并将中断地址设置为数据段的结尾。第一次调用malloc会使用sbrk来移动分隔sbrk ，并在数据段顶部和新的更高断点地址之间创建堆，如图所示，随后使用malloc将使用它来创建堆是必要的。

同时，堆栈从内存顶部开始并逐渐减小。堆栈不需要明确的系统调用来使其更大; 要么开始分配尽可能多的RAM（这是传统的方法），要么在堆栈下面有一个保留地址区域，当它发现尝试在那里写入内容时，内核会自动为其分配RAM （这是现代的方法）。无论哪种方式，地址空间底部都可能有或没有可用于堆栈的“保护”区域。如果这个区域存在（所有现代系统都这样做），它永远不会被映射; 如果堆栈或堆试图进入它，你会得到一个分段错误。然而，传统上，内核并未尝试强制实施边界; 堆栈可能会堆积到堆中，或者堆可能堆积到堆栈中，并且无论如何他们会在彼此的数据上涂写，程序会崩溃。如果你非常幸运，它会立即崩溃。

我不确定这个图中512GB的数字来自哪里。它意味着一个64位的虚拟地址空间，这与您在那里的非常简单的内存映射不一致。一个真正的64位地址空间看起来更像这样：

这不是可以远程扩展的，它不应该被解释为给定操作系统如何操作（在我绘制它之后），我发现Linux实际上使可执行文件更接近于地址零，比我想象的要更接近于共享库在令人惊讶的高地址）。该图的黑色区域未映射 - 任何访问都会导致立即发生段错误 - 并且它们相对于灰色区域是巨大的。浅灰色区域是程序及其共享库（可以有数十个共享库）; 每个都有一个独立的文本和数据段（和“bss”段，它也包含全局数据，但被初始化为全零位，而不是占用磁盘上可执行文件或库中的空间）。堆不再一定要连续执行可执行文件的数据段 - 我以这种方式绘制了它，但看起来像Linux至少不会这样做。堆栈不再与虚拟地址空间的顶端相连，堆栈和堆栈之间的距离非常大，您不必担心会越过堆栈。

休息仍然是堆的上限。然而，我没有说明的是，在黑色的地方，可能会有数十个独立的内存分配，使用mmap而不是brk 。（操作系统会尽量远离brk区域，以免碰撞。）