不奢望岁月静好 只希望点滴积累

0%

建立数据通路(17-19讲)

指令周期

1
2
3
4
5
计算机每执行一条指令的过程、可以分解为:
1. Fetch(取得指令), 也就是从PC寄存器找到对应的指令地址、根据指令地址从内存找到具体指令、加载到指令寄存器、然后将PC寄存器自增、好在未来执行下一条指令
2. Decode(指令译码): 根据指令寄存器里的指令、解析成将要进行什么样的操作、是R、I、J中的哪一种指令、具体要操作哪些寄存器、数据或者内存地址
3. Execute(执行指令), 也就是实际运行对应的R、I、J这些特定的指令、进行算术逻辑操作、数据传输或者直接的地址跳转
4. 重复1~3的步骤

Machine Cycle: 又称为机器周期或者CPU周期, CPU的内部操作速度很快、但是访问内存的速度却慢很多、每一条指令都从内存中加载而来、所以一般把从内存中读取一条指令的最短时间称为CPU周期

Clock Cycle: 也就是时钟周期及机器的主频、一个CPU周期通常是几个时钟周期的积累、一个CPU周期的时间、就是这几个时钟周期的总和

对于一个指令周期来说、取出一条指令、然后执行、至少需要两个CPU周期、取出指令至少需要一个CPU周期、执行也至少需要一个CPU周期、复杂的指令需要更多的CPU周期

so. 一个指令周期包含多个CPU周期、而一个CPU周期又包含多个时钟周期

建立数据通路

1
2
3
4
5
6
一般来说、数据通路就是处理器单元、通常有两类元件组成

1. 操作元件: 也叫组合逻辑单元、就是ALU、功能就是在特定的输入下、根据下面的组合电路的逻辑、生成特定的输出
2. 存储元件: 也叫状态原件, eg. 计算过程中需要用到的寄存器、无论是通用寄存器还是状态寄存器、其实都是存储原件

通过数据总线的方式、将操作元件和存储元件连接起来、就可以完成数据的存储、处理和传输了、这就是所谓的建立数据通路

控制器: 可以看成只是机械的重复 Fetch -> Decode -> Execute 循环中的前两个步骤、然后将最后一个步骤通过控制器产生的信号、交给ALU去处理

1
2
3
控制器电路听起来很简单、其实特别复杂,
1. 所有CPU支持的指令、都会在控制器里边被解析成不同的输出信号、eg. Intel CPU支持2000个以上的指令、意味着: 控制器输出的控制信号、至少有2000种不同的组合
控制器里的ALU和各种组合逻辑电路、可以认为是一个固定功能的电路、控制器翻译出来的、就是不同的控制信号、这些控制信号、告诉ALU去做不同的计算

CPU所需要的硬件电路

1
2
3
4
5
6
7
8
要想搭建CPU、需要再数字电路层面、实现一些功能.
一、ALU: 实际就是一个没有状态的、根据输入计算输出结果的一个电路
二、需要一个寄存器(可进行状态读写的电路元件)
需要一个电路(可存储上次计算的结果)、这个计算结果不一定立刻能拿到电路的下游使用、但可在需要的时候拿出来使用、常见能够进行状态读写的电路有: 锁存器(Latch) 和 D触发器(Data / Delay Flip-flop)
三、需要有一个`自动`的电路: 可按照固定的周期、不停地实现呢PC寄存器自增、自动的执行 Fetch-Decode-Execute的步骤
四、需要一个译码电路: 无论是decode还是对于拿到的内存地址去获对应的数据或者指令、都需要通过一个电路找到对应的数据、这个就是译码器电路

虽然CPU已经是有几十亿个晶体管组成的及其复杂的电路、但 仍然是由一个个的基本功能的电路组成的

时序逻辑电路

1
2
3
4
解决了以下问题:
1. 自动运行, 时序电路接通后可以不停的开启和关闭开关、进入下一个自动运行的状态、使得控制器不停的让PC寄存器自增读取下一条指令成为可能
2. 存储问题, 通过时序电路实现的触发器、可以把计算结果存储在特定的电路里、而不是像组合逻辑电路、一旦输入变化、对应的输出也会变化
3. 时序协调问题, 无论是程序实现的软件指令还是硬件层面、各种指令的操作都有先后的顺序要求、时序电路使得不同的事件按照时间顺序发生

时钟信号的硬件实现

1
2
时钟: CPU的祝您是又一个晶体振荡器实现的、而这个晶体振荡器生成的电路信号、就是时钟信号
反馈电路: 将电路的输出信号作为输入信号的电路构造方式、叫做反馈电路

通过D触发器实现存储功能

1
2
3
4
5
6
7
将R和S两个信号通过一个反相器合并、可以通过一个数据信号D进行Q的写入操作

只要CLK信号是1、R和S就可以设置输出Q、而当CLK信号是0的时候、无论R和S怎么设置、输出信号Q是不变的、这样、整个电路就成了我们最常用的D型触发器、用来控制R和S这两个开关的信号、可以视为一个输入的数据信号D、也就是Data、这就是D型触发器的由来

一个D型触发器、只能控制1bit的读写、若同时拿出多个D型触发器并列在一起、并且把用同一个CLK信号控制作为所有D型触发器的开关、就变成了一个N位的D型触发器、可以同时控制N位的读写

CPU中的寄存器可以直接通过D型触发器来构造、可以在D触发器的基础上、加上更多的开关、来实现清0或者全置位这样的操作

PC寄存器所需要的计数器

1
2
3
4
5
6
7
8
9
PC寄存器还有个名字叫程序计数器、为什么呢 ?
有了时钟信号、可以提供定时的输入、有了D型触发器、可以在时钟信号控制的时间点写入数据、将这两个功能组合起来、就可以实现一个自动的计数器了

加法器的两个输入、一个始终设置为1、另外一个个来自于一个D型触发器A、将加法器的输出结果、写到这个D触发器的A里边、于是 D型触发器里边的数据就会在固定的时钟信号为1的时候更新一次

加法计数、内存取值、乃至后边的命令执行、最终其实都是由时钟信号来控制执行时间点和先后顺序的、这也是需要时序电路最核心的原因

在最简单的情况下、需要让每一条指令、从程序计数器、到获取指令、执行指令、都在一个时钟周期内完成、若PC计数器增长太快、程序就会出错, 因为此时前一次运算的结果还没写回对应的寄存器
在这种情况下、需要在一个时钟周期里、确保执行完成一条最复杂的CPU指令、即: 耗时最长的一条CPU指令、这样的CPU设计、称为 单指令周期处理器

读写数据所需要的译码器

1
2
3
4
5
6
7
8
现在数据可以存储在D触发器里了、若将多个D触发器放在一起、就可以形成很大的一块存储空间、甚至可以当成一块内存来使用、
eg. 现在的电脑内存可能有8G、16G、那么怎么才能知道写入和读取的数据是这块大的内存里、哪几个bit呢 ?
于是: 我们需要一个电路来完成寻址的工作、就是 译码器
将寻址退化到最简单的模型、就是两个地址中选择一个、称为 2-1选择器、
若输入的信号有三个不同的开关、就可以从 2³=8中选择一个地址了、即3-8译码器
现代计算机是64位的、寻址空间是264次方、需要一个有64个开关的译码器

所以: 译码器的本质、就是从输出的多个位的信号中、根据一定的开关和电路组合、选择自己想要的信号、除了可以寻址、还可以将对应的需要运行的指令码同样通过译码器、找出我们期望执行的指令、也就是opcode及后边对应的操作数或者寄存器地址

因为从内存取指令的时间很长、若使用单指令周期处理器、意味着我们的指令都要去等待一些慢速操作、这些不同指令执行速度的差异、也正是计算机指令有指令周期、CPU周期和时钟周期之分的原因、因此, 优化现代CPU性能时、用的CPU都不是单指令周期处理器、而是通过流水线、分支预测等技术、来实现在一个周期里同时执行多个指令