操作系统是如何管理物理内存的？

本文是操作系统系列第三篇，介绍物理内存管理。操作系统对内存的管理是非常复杂的，和程序的执行、硬件、编译器等密切相关。本文从物理内存入手，介绍内存管理的重要概念，也为后续的虚拟内存管理内容做铺垫。原文链接，更多内容见公号机器学习与系统，欢迎与我互动~

内存管理的需求

抽象，即给每个程序逻辑地址空间
保护，不同程序的地址空间互相隔离，无法越界访问
共享，对于一些公共函数库，可以只在内存中存一份，其它程序引用这一个库即可
虚拟化，通过逻辑地址和虚拟内存，可以使用更大的地址空间

地址的概念

地址是用来标志存储资源位置的，在计算机中用一串二进制数据表示。

一. 地址空间

地址空间就是指地址的范围，从最小值到最大值：

物理地址空间从0到物理内存的最大值：0~MAX_sys
逻辑地址空间从0到程序虚拟内存范围的最大值：0~MAX_prog

下图展示了物理地址空间，进程A、B的逻辑地址空间。

二. 地址生成

物理地址是已经确定的，逻辑地址的生成依赖于编译器。

编译：将高级语言编译成汇编语言。假设此时此时地址已知，如果起始地址改变，必须重新编译
汇编：将汇编语言翻译长机器能够识别的二进制代码，里面的地址是该程序执行时，对应地址空间中的位置
链接：将程序执行需要的函数库链接到可执行文件中，更新地址空间
加载：将函数加载到内存中时根据程序块在内存中的位置更新逻辑地址空间内的地址(重定位)
执行：执行代码时，程序在内存中可能会移动，这里需要地址转换(映射)支持

三. 地址解析

下图是CPU和计算机的基本架构，我们以此图来说明物理/逻辑地址在CPU和计算机中如何被解析处理的。

首先，CPU中的算数逻辑单元看到的都是逻辑地址
当CPU需要把数据写入内存或从内存中读取时，MMU会把逻辑地址转换成对应的物理地址
控制逻辑把数据、操作请求和物理地址发送到总线，分为读请求和写请求
- 写请求，则把数据写入内存
- 读请求，则把数据从内存中读取发送给CPU

在上面的过程中，MMU负责逻辑地址和物理地址之间的转换，操作系统负责建立逻辑地址和物理地址之间的映射关系。

连续内存分配

基本概念

连续内存分配：给程序分配一块连续内存区域
内存碎片：内存上一些没有被分配利用的区域
- 内部碎片：某个程序分配的内存没有充分利用。是否产生取决于分配算法，比如分配的内存大小是否要取整
- 外部碎片：被分配的内存区域之间没的的空闲区域
碎片整理：通过调整进程占用的内存区域位置来减少或避免分区碎片
碎片紧凑：通过移动分配给进程的内存区域，以合并外部碎片。要求运行的程序都可以动态重定位

动态分配

当程序被加载时，根据进程的实际需要动态分配内存空间，使分配的大小刚好与作业的大小相等。动态分区分配并不预先将内存划分成一块块分区，而是在程序进入内存时，根据程序的大小动态地建立分区，因此系统中分区的大小是可变的，分区的数目也是可变的。

有以下三种分配策略：

最先匹配(First-fit)：分配N个字节，使用第一个可用空间比N大的内存块。如分配400 byte的内存块，按照从上到下的查找顺序，应该分配1K byte内存区域。如果是从下往上查找，应该分配5K byte的区域。
最佳匹配(Best-fit)：分配N字节分区时，查找并使用不小于N的最小空闲分区。如果要分配2800 byte，应该分配3K byte区域。
最差匹配(Worst-fit)：分配N字节，使用尺寸不小于N的最大空闲分区。如果分配800 byte，则选择5K byte区域。

上述三种分区算法，在释放分区时，都要检查是否能和周围的分区合并。

非连续内存管理

连续内存分配会出现内/外部碎片、动态修改比较困难、内存必须连续，而且内存利用率不高。因此提出了非连续内存分配的方法，允许程序使用非连续的内存空间、允许共享代码和数据，以提高内存利用效率和管理的灵活性。

当然，这也带来了挑战：非连续内存分配中，如何有效实现和管理逻辑地址和物理地址间的映射。

下面介绍三种方式：

段式存储管理(segmentation)
页式存储管理(paging)
段页式存储管理(上面两者的综合)

段式存储管理

段(segment)指一类地址空间，一个段就是一个地址连续的内存块，若干个段组成程序的逻辑地址空间。

每个段由0到最大的线性地址序列构成。各个段的长度可以是0到某个允许的最大值之间的一个数。不同的段的长度可以不同(通常情况下也都不一样)，段的长度在运行期间可以动态改变，比如push数据时，堆栈段的长度会增加，pop时会减少。段也可以被装满，但是通常情况下段的长度很大，这种情况很少发生。

段式存储管理下的逻辑地址组成格式为(s, o)，s为段号，o为段内偏移量，段号和对应内存中的物理起始地址由段表记录。寻址时，先根据段号到段表中查到物理起始地址(基址)，然后加上偏移量，得到最终的物理地址。

页式存储管理

页式存储管理有两个至关重要的概念：

物理页帧(Frame | Page Frame | 帧 | 页帧)：把物理地址空间分成大小相同的基本单位。大小为2^n，如512/4096等。
逻辑页面(Page | 页)：把逻辑地址空间划分为相同大小的基本单位
页帧大小和页面大小必须一致

页式存储管理的寻址方式和段式管理类似，逻辑地址格式为(p, o)，表示页中的地址，其中p表示页号，o表示偏移量。物理地址格式为(f, o)，表示页帧中的地址，其中f表示页帧号，o表示偏移量，页偏移量和页帧偏移量是相等的。

页和页帧的对应关系使用页表(Page Table)来管理。寻址时首先根据页号找到页表中对应的页帧号，然后用得到的页帧号与偏移量组成实际的物理地址。

该图来自清华大学OS课程PPT，笔者做了适当修改

页面和页帧的大小相比分段要小得多，假设系统是32位，页帧大小1024字节，这样有2^32/2^10=2^22条页表记录，查询页表的时间要多很多。下面介绍两个提高性能的方法：

使用快表(Translation Look-aside Buffer, TLB)：直译为旁路快表缓冲，可以理解为页表缓冲。即在内存和CPU之间搭建页表缓存，寻址时先到TLB中查找，未命中再到内存中的快表查找
多级页表：(p1, p2, o)是两级页表的虚拟地址表示，先根据p1查找页表1中的p2，再根据p2查询真正的页帧号，然后根据偏移地址o查到最终的物理地址

分段和分页的比较

分页和分段系统有许多相似之处。两者都采用离散分配方式，且都要通过地址映射机构来实现地址变换。但在概念上两者完全不同，主要表现在下述三个方面：

页帧是信息的物理单位，分页是为了实现非连续分配，以便解决内存碎片问题, 提高内存的利用率。段是信息的逻辑单位，分段的目的是为了能更好地满足用户的需要。
页的大小固定且由系统决定，由系统把逻辑地址划分为页号和页内地址两部分，是由机器硬件实现的，因而在系统中只能有一种大小的页面。而段的长度却不固定，决定于用户所编写的程序，通常由编译程序在对源程序进行编译时，根据信息的性质来划分。

段式存储和页式存储都是为了更好管理内存，段式从程序的角度入手，页式从物理底层的角度入手，在理解上，可以结合两者的优缺点进行选择：

	分段	分页
优点	段长可动态修改，方便编程，分段共享，分段保护，动态链接，动态增长	非连续分配，减少内存碎片，提高内存利用效率
缺点	内部碎片，地址计算需要更多硬件支持	需要两次内存访问，页表可能很大

段页式存储管理

段页式存储管理充分利用了段式存储在内存保护方面有优势，页式存储在内存利用和优化转移到后备存储方面有优势。

在段式存储管理基础上，给每个段加一级页表。逻辑地址格式为(s, p, o)，s为段号，p为页号，o为页内偏移。寻址时，现根据段号s查找段表中的页表地址，然后到页表中查找p对应的起始地址，最后加上偏移o得到最终的物理地址。

总结

程序在执行时，CPU看到的是逻辑地址，当CPU读写数据时，由MMU根据逻辑地址找到对应的物理地址，然后到总线上读写数据。通过这种管理机制，可以更好地管理内存，在多道程序执行中做到隔离和共享。

文章持续更新，可以微信搜索「 机器学习与系统 」阅读最新内容，回复【内推】【考研】获取我准备的头条内推以及考研信息

操作系统是如何管理物理内存的？

内存管理的需求

地址的概念

连续内存分配

基本概念

动态分配

非连续内存管理

段式存储管理

页式存储管理

分段和分页的比较

段页式存储管理

总结

Reference

陆道峰

引用和评论

ArchLinux Plasma 简洁优雅桌面环境设置

《Operating System Concepts》阅读笔记：p228-p257

《Operating System Concepts》阅读笔记：p481-p482

《Operating System Concepts》阅读笔记：p331-p353

龙蜥RISC-V SIG 2.0研讨会圆满举办，宋卓当选国际基金会Datacenter SIG主席

高性能网络SIG双月动态：加速 SMC eBPF 透明替换特性上游化进程，并与上游深度研讨新特性

龙蜥 2024 年度“最佳合作伙伴”揭晓！申威、AMD 等多家新晋贡献厂商实力登榜