头图

写在前面

撸代码只是程序员的一项最基本的技能,除此之外,还有很多知识需要程序员掌握。【程序员进阶系列】专题,旨在分享程序员想要进一步提升自我,突破发展瓶颈的一系列技术。今天,我们来一起聊聊计算机中的层次化存储结构。

文章已收录到:

https://github.com/sunshinelyz/technology-binghe

https://gitee.com/binghe001/technology-binghe

层次化存储结构

首先,问小伙伴们一个问题:计算机的存储结构为什么需要进行层次化的划分呢?

说的直接一点:就是为了减少经济成本。如果说,CPU的价格非常便宜的话,根本就不需要内存了。可以把所有的内存容量全部都做到CPU里面去,就可以了。但是,事实上,CPU的内存是很精贵的,至今为止,CPU中基本上还是一级缓存和二级缓存。三级缓存比较少见。而且,CPU中的存储容量是非常小的,基本都是KB级别的存储,CPU的内存容量也就几KB,MB级别的CPU内存也是比较少见的。所以,出于经济成本的考虑,计算机中的存储结构是按照层次进行划分的。

为了能够让小伙伴们更加清晰的理解层次化存储结构,我们先来看一张图。

由上图,可以看出:

(1)层次化的存储结构可以分为:CPU、Cache(高速缓存)、主存(内存)、外存(辅存)。

(2)从上往下,速度越来越慢,容量越来越大。

局部性原理是层次化存储结构的支撑。

局部性原理

一个编写良好的计算机程序常常具有良好的局部性。也就是说。它们倾向于引用临近于其他最近引用过的数据项的数据项,或者最近引用过的数据项本身。这汇总倾向性,就被称为局部性原理,这是一个持久的概念,对硬件和软件系统的设计和性能都有着极大的影响。

之所以有这个规律,很多人认为原因是:程序的指令大部分时间是顺序执行的,而且程序的集合,如数组等各种数据结构是连续存放的。

局部性原理讲的是:在一段时间内,整个程序的执行仅限于程序的某一部分,相应地,程序访问的存储空间也局限于某个内存区域。主要分为两类:

  • 时间局部性:如果程序中的某条指令一旦执行,则不久之后该指令可能再次被执行;如果某数据被访问,则不久之后该数据可能再次被访问。
  • 空间局部性:是指一旦程序访问了某个存储单元,则不久之后,其附近的存储单元也将被访问。

Cache

针对Cache相关的技术,我们主要来聊聊Cache的概念和映像相关的技术。

Cache-概念

这里的Cache表示的是高速缓冲,在计算机的存储体系系统中,Cache是除寄存器外访问速度最快的层次。 使用Cache改善系统性能的依据是程序的局部性原理

如果以h代表对Cache的访问命中率,t1表示Cache的周期时间,t2表示主存储器的周期时间,以读操作为例,使用“Cache+主存储器”的系统的平均周期为t3,则可以得出如下运算公式。

t3 = h * t1 + (1 - h) * t2 

其中。(1 - h)又称为失效率,也就是未命中率。

Cache-映像

Cache的映像分为三种,分别是:直接相联映像、全相联映像、组相联映像。

  • 直接相联映像:硬件电路比较简单,但冲突率最高。
  • 全相连映像:电路难于设计和实现,只适用于小容量的Cache,冲突率比较低。
  • 组相联映像:直接相联与全相联的折中。

地址映像是将主存与Cache的存储空间划分为若干大小相同的页(或称为块)。

例如,一台计算机的主存容量为1GB,划分为2048页,每页512KB;Cache的容量为8MB,划分为16页,每页512KB。接下来,我们由此来详细图解直接相联映像、全相联映像和组相联映像。

直接相联映像

我们可以画一组图来表示Cache的直接映像。首先,我们先来简单画一个主存标记、Cache页号和页内地址的示意图。如下所示。

如上图所示,主存标记为7位,Cache页号为4位,页内地址为19位。

记录主存区号的示意图如下所示。

有了上面两张图的基础后,我们再来看直接相联映像的示意图如下所示。

这里,我们将容量为1GB的主存划分成2048页,总共127个区,每页的容量为512KB。将容量为8MB的Cache划分为16页,每页容量为512KB。

所谓直接相联映像是指Cache中的0页只能存储主存中0页的内容,这里主存中0页指的是每个区的0页,比如上图中的0区的0页,1区的16页,127区的2032页等。

在直接相联映像中,只需要记录主存标记、Cache页号和页内地址就能够快速的找到主存中的数据。

使用直接相联映像有个缺点:那就是如果Cache中的0页,存储了主存中0区0页的内容时,如果此时需要存储主存1区中的16页内容,就只能将主存0区中0页的内容从Cache的0页中清除,然后将主存1区中16页的内容存储到Cache中的0页内。冲突率比较高。细心的小伙伴会发现:这其实是违背局部性原理的。

直接相联映像访问速度最快,但冲突率最高。

全相连映像

我们先来看下全相联映像的主存页标记和页内地址的示意图,如下所示。

此时,使用11位来标识主存页标记,使用19位来标识页内地址。

使用全相连映像需要记录主存与Cache的对应关系,如下图所示。

接下来,我们来看看全相连映像的示意图,如下所示。

从图中可以看出,Cache中的任何一个也,都可以存储主存中的任何一个页。

使用全相连映像访问速度最慢,冲突率最低。

组相联映像

组相联映像本质上是直接相联映像和全相联映像的折中。同样的,我们先来看组相连映像的存储示意图。

此时,在组相连映像中,Cache组号使用3位表示,组内页号使用1位表示,页内地址使用19位表示。其中,3位的Cache组号,1位的组内页号和前面的7位构成了主存页标记;3位的Cache组号,1位的组内页号和19号的页内地址构成了Cache地址。

接下来,我们再来看看主存与Cache的对应关系,如下图所示。

组相连的映像示意图如下所示。

由上图可知,在组相连映像中,主存的组与Cache的组是组相联映像关系,而在组内则是通过直接相联映像来访问和存储数据。

好了,我已经肝不动了。今天就到这儿吧,我是冰河,大家有啥问题可以在下方留言,也可以加我微信:sun_shine_lyz,我拉你进群,一起交流技术,一起进阶,一起牛逼~~


冰河
156 声望970 粉丝