[考研][计算机组成原理] 程序的机器级表示

2023-11-24 16:19:31

考研，408，组成原理，程序的机器级表示

考研 408 大纲《计算机组成原理》指令系统部分新增的 高级语言程序于机器级代码直接的对应 考点：

选择结构语句的机器级表示
循环结构语句的机器级表示
过程（函数）调用对应的机器基本表示

主要看 CSAPP 整理了一下。

流程控制

if-else

csapp2e.Zh_CN P130: 3.6.4

C 语言模版：

if (test_expr)then_statement
elseelse_statement

Goto 版本：

  t = test_expr;if (!t)goto FALSE;then_statementgoto DONE;
FALSE:else_statement
DONE:

注意这里的 FALSE 是个标签，不是 0.

如果思路反过来，测试 t 为真时 goto 跳转到 TRUE 去跑 then_statement，虽然也可以，但对于没有 else 的 if 就会很诡异。

汇编（ATT 风格 MOV S, D 表示 S -> D）：

  [test_expr]        # 测试语句:        e.g. cmpjnc FALSE          # 不满足条件时跳转: e.g. je[then_statement]jmp DONE
FALSE:[else_statement]
DONE:

约定：我们用 jc、jnc 来代表某个“条件跳转”指令，具体可能是 je，jg，jl 等等。

jc：满足条件时跳转，对应 if (test_expr) goto L;；
jnc：不满足条件时跳转，对应 if (!t) goto L;。

我们在汇编里用 [test_expr] 这种表示实现 C 中的 test_expr 的一块代码。

e.g. if-else

int absdiff(int x, int y) {if (x < y)return y - x;elsereturn x - y;
}

goto:

int absdiff_goto(int x, int y) {int result;if (x >= y)goto x_ge_y;result = y - x;goto done;x_ge_y:result = x - y;done:return result;
}

asm:

  movl 8(%ebp), %edx    # xmovl 12(%ebp), %eax   # ycmpl %eax, %edx       # x:y 做 x-y 来比较jge  X_GE_Y            # x >= y 则跳转subl %edx, %eax       # y-xjmp  DONE
X_GE_Y:subl %eax, %edx       # x-ymovl %edx, %eax
DONE:

[补充]条件传送

对于用三目运算符完成的简单的条件，例如 min = (x < y ? x : y); 把这个翻译成 if-else，用上面的那种手法去翻译，其实对流水线并不友好。控制冒险如果错了惩罚时间相当长。

现代机器上有「条件传送」指令：cmov。就是类似于条件跳转 jc，cmov 在满足条件的时候做 mov。

具体的 cmov 族也是有 cmove、cmovl、cmovge 等等这些。

利用这个指令，可以把两个分支全算了，最后利用 cmov 来选一个结果。就不用去控制冒险了：

v = test_expr ? then_expr : else_expr;/* ⬇️ */vt = then_expr;
v  = else_expr;
t  = test_expr;
if (t) v = vt;    // 用 cmov 实现

但注意，这个不是通用的！！不是所有三目运算都可以这么翻译，一般只有这种纯运算、没有副作用的才能这么搞。

do-while

csapp2e.Zh_CN P130: 3.6.5

dobody_statement
while (test_expr);

goto:

LOOP:body_statementt = test_expr;if (t)goto LOOP;

其实 do-while 和汇编是自然对应的：do 换成 loop 标签，while 就是 if 条件 goto. 非常简单。其他的循环都可以先翻译成 do-while 循环，再写成汇编。

asm:

LOOP:[body_statement][test_expr]jc LOOP     # 满足 test_expr 则跳转

e.g. do-while

计算 n 的阶乘：

int fact(int n) {int result = 1;do {result *= n;n = n-1;} while (n > 1);return result;
}

asm:

  movl  8(%ebp), %edx   # nmovl  $1, %eax        # result
LOOP:imull %edx, %eax      # result *= nsubl  $1, %edx        # n = n-1cmpl  $1, %edx        # cmp: n-1jg    LOOP            # if (n>1) goto LOOP

while

csapp2e.Zh_CN P134

while (test_expr)body_statement

其实 while 就是在 do-while 开始之前多一个入口检测 if 检测。

翻译成 do-while 循环:

  if (!text_expr)goto DONE;dobody_statementwhile (text_expr);
DONE:

再展开 do-while，得到纯粹的 goto 版本：

  t = test_expr;if (!t)goto DONE;
LOOP:body_statementt = text_expr;if (t)goto LOOP;
DONE:

asm：

  [test_expr]jnc DONE   # 不满足 test_expr 则跳转
LOOP:[body_statement][test_expr]jc LOOP    # 满足 test_expr 则跳转
DONE:

其实在 do-while 的基础上，加了最前面的一个测试条件跳转，还有最后的 DONE 标签。

注意入口测试的 jnc 和 LOOP 里的 jc 刚好是反的。

e.g. while

还是刚才的阶乘，改成 while 入口循环：

int fact(int n) {int result = 1;while (n > 1) {result *= n;n = n-1;};return result;
}

asm:

  movl  8(%ebp), %edx   # nmovl  $1, %eax        # resultcmpl  $1, %edx        # cmp: n-1jle   DONE            # if (n<=1) goto DONE 
LOOP:imull %edx, %eax      # result *= nsubl  $1, %edx        # n = n-1cmpl  $1, %edx        # cmp: n-1jg    LOOP            # if (n>1) goto LOOP
DONE:

for

csapp2e.Zh_CN P137

for (init_expr; test_expr; update_expr)body_statement

C 规定 for 等效于如下的 while ：（K&R 2e P60: 3.5）

init_expr;
while (test_expr) {body_statementupdate_expr;
}

也就是，在 while 的基础上，最前面（循环外面）加了一个 init_expr，循环体最后（循环里面）加了一个 update_expr。

进一步，翻译成 do-while 循环：

  init_expr;if (!test_expr)goto DONE;do {body_statementupdate_expr;} while (test_expr);
DONE:

goto 版本：

  init_expr;t = test_expr;if (!t)goto DONE;
LOOP:body_statementupdate_expr;t = test_expr;if (t)goto LOOP;
DONE:

asm:

  [init_expr][test_expr]jnc DONE   # 不满足 test_expr 则跳转
LOOP:[body_statement][update_expr][test_expr]jc LOOP    # 满足 test_expr 则跳转
DONE:

（只是在 while 的基础上加了 2、7 两行）

特例：带continue的for

csapp2e.Zh_CN P139: 练习题3.24 （答案P219）

带 continue 的 for 直接翻译成 while 就炸了，更新表达式执行不到，导致无限循环：

for (i = 0; i < 10; i++) {if (i % 1) continuesum += i;
}/* ⬇️ */while (i < 10) {    // ❌if (i % 1) {continue;}sum += i;i++;
}

正确的做法，把 continue 改成一组 goto-label：

while (i < 10) {if (i % 1) {goto UPDATE;}sum += i;
UPDATE:i++;
}

switch

csapp2e.Zh_CN P144: 3.6.7

switch 才是最麻烦的。

switch 在分支多、值范围跨度小时可以用「跳转表」来实现。

int switch_eg(int x, int n)
{int result = x;switch (n) {case 100:result *= 13;break;case 102:result += 10;/* Fall through */case 103:result += 11;break;case 104:case 106:result *= result;break;default:result = 0;}return result;
}

这个东西 GCC 用拓展的 C 语言来实现：用 && 运算符取一个 label 的位置。（GCC Extensions: Labels as Values）


int
switch_eg_impl(int x, int n)
{/* Table of code pointers */static void* jt[7] = { &&loc_A, &&loc_def, &&loc_B, &&loc_C, &&loc_D, &&loc_def, &&loc_D };unsigned index = n - 100;int result;if (index > 6)goto loc_def;/* Multiway branch */goto* jt[index];loc_def: /* Default case*/result = O;goto done;loc_C:/*Case103*/result = x;goto rest;loc_A: /*Case100*/result = x * 13;goto done;loc_B:/* Case 102 */result = x + 10;/* Fall through */rest:/* Fínish case 103 */result += 11;goto done;
loc_D:/* Cases 104, 106 */result = x * x;
/*. Fall through */
done:return result;
}

就是顺序穷举，把每个 case 的 label 地址放到跳转表 jt 中。然后根据 switch 变量 n，从顺序的跳转表中取出对应下标处的 label 来执行。

编译成汇编：

跳转表（数据部分）：

	.section	.rodata
.L4:.long	.L7@GOTOFF.long	.L8@GOTOFF.long	.L6@GOTOFF.long	.L5@GOTOFF.long	.L3@GOTOFF.long	.L8@GOTOFF.long	.L3@GOTOFF

switch_eg 函数：

	movl	4(%esp), %eax   # nmovl	8(%esp), %edx   # xsubl	$100, %edxcmpl	$6, %edxja	.L8addl	.L4@GOTOFF(%ecx,%edx,4), %ecxjmp	*%ecx   # 跳转到 ecx 里面的地址: *jt[n]
.L7:  # loc_A: case 100leal	(%eax,%eax,2), %edx  # t = x*3leal	(%eax,%edx,4), %eax  # result = x + 4*tret
.L6:  # loc_B: case 102addl	$10, %eax# fall through
.L5:  # rest: case 103addl	$11, %eaxret
.L3:  # loc_D: case 104, 106imull	%eax, %eaxret
.L8:  # defaultmovl	$0, %eaxret

这个和书上不太一样，我自己编译出来的（gcc -O1 -m32 -S switch.c，GCC: (Debian 8.3.0-6) 8.3.0）我这个把 ret 提进去了，区别不大。（用 -O0 能编译出那种最后跳转到 .L8 的，但局部实现比较可怕，所以这里没有采用）

过程调用

csapp2e.Zh_CN P149: 3.7

过程依赖于栈：

栈帧示意图

%ebp 指向当前过程的栈帧(底)，%esp 指向当前过程的栈顶。

调用者 P 调用被调用者 Q，Q 的参数、返回地址（就是 call 指令之后的下一条指令地址）放在 P 的栈帧中。

一个过程调用的步骤如下：

调用者：保存，压参，call 子过程
被调用者：建栈，保存，执行，恢复，离开（退栈），返回调用者

过程调用步骤

调用者：
- 保存「调用者保存寄存器」：
```
%eax, %edx, %ecx
```
- 参数逐个压入栈
- call Q：「返回地址」压入栈，跳到 Q 处执行。
被调用者（子过程）：
- 建立：子过程一开始，先把 ebp 改成当前的（保存起调用者的）：
```
# 手动写这两行：
pushl %ebp
movl %esp, %ebp
```
- 保存其他「被调用者保存」寄存器（可选）:
```
pushl reg  # 可能是 %ebx, %esi, %edi
```
- 执行子过程主体
- 恢复「被调用者保存」寄存器：一个个 pop 出来。
- leave：准备返回（还原栈和帧，把子过程的栈帧弹出来）：
```
leave# ⬆️等价⬇️ #movl %ebp, %esp
popl %ebp
```
- ret 弹出「返回地址」，执行之：转回调用者

之所以分开几步，有的手动，有的自动，可以理解为是因为 call、leave、ret 这些指令偶尔也可以单用。比如下面的代码，通过 call 获取 PC 值，放到整数寄存器：

  call next
next:popl %eax

这里用了 call，但不是过程调用，还是顺序执行的，这只是个获取 PC 的小技巧。

一定要上了那完整的一套才是个过程调用。

e.g. 过程调用

int
add(int a, int b)
{return a + b;
}int
caller()
{int x = 1;int y = 2;int z = add(x, y);return z;
}

编译出来：

$ gcc -m32 -O0 -S call.c

GCC: (Homebrew GCC 10.2.0_3) 10.2.0

_add:# 建立pushl	%ebpmovl	%esp, %ebp# 执行movl	8(%ebp), %edxmovl	12(%ebp), %eaxaddl	%edx, %eax# 离开, 返回popl	%ebpret_caller:pushl	%ebpmovl	%esp, %ebpsubl	$24, %esp     # 新分配栈空间movl	$1, -12(%ebp) # xmovl	$2, -16(%ebp) # ypushl	-16(%ebp)     # 参数: b=ypushl	-12(%ebp)     # 参数: a=xcall	_addaddl	$8, %esp      # 缩回放参数的栈空间movl	%eax, -20(%ebp)movl	-20(%ebp), %eaxleaveret

subl $24, %esp 是用来给栈帧分配空间。栈反向增长，所以是减。24 个字节里，8 个用来放局部变量，中间 8 个闲置，最后 8 个用来放给子过程的参数。

按照惯例，这里的 add 和 caller 都把自己的返回值放到了 %eax 中，给上一层调用者自行读取。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

[考研][计算机组成原理] 程序的机器级表示

流程控制

if-else

e.g. if-else

[补充]条件传送

do-while

e.g. do-while

while

e.g. while

for

特例：带continue的for

switch

过程调用

过程调用步骤

e.g. 过程调用

相关文章