jacksplwxy
diff --git a/‎04_运行时刻环境/README.md
Lines changed: 55 additions & 43 deletions b/‎04_运行时刻环境/README.md
Lines changed: 55 additions & 43 deletions
diff --git a/‎05_目标代码生成/README.md
Lines changed: 51 additions & 154 deletions b/‎05_目标代码生成/README.md
Lines changed: 51 additions & 154 deletions
diff --git a/‎dist/SDT/ILGen.js
Lines changed: 2 additions & 1 deletion b/‎dist/SDT/ILGen.js
Lines changed: 2 additions & 1 deletion
@@ -1,6 +1,3 @@
-```
-
-
 *前言：
   从词法分析，到语法分析，到三地址代码生成，这个几个阶段的本质还只是对字符串的转换，是静态编译阶段。而运行时指的是程序执行顺序、执行环境、内存动态分配等内容。
   运行时刻跟编译时刻虽然是两个不同的阶段，但是由于运行时刻用到的指令是由编译器生成的，要使编译器生成正确指令，必需对程序运行时有足够的了解。如此才能解决在前面一节《03_中间代码生成》的三地址表达式实例2中提出的问题，才能生成能够精确翻译为机器码的中间码。
@@ -18,13 +15,23 @@
        -- 这种分配策略要求程序代码中不允许有可变数据结构(比如可变数组)的存在,也不允许有嵌套或者递归的结构出现,因为它们都会导致编译程序无法计算准确的存储空间需求
        -- 常用的静态存储分配方法：
           -- 顺序分配法：
-             假设一个程序生成了6个过程，树表示过程间的调用关系：https://www.pianshen.com/article/13011737518/
+             假设一个程序生成了6个过程，树表示过程间的调用关系：
                       1/22 
-                       / \
-                    2/15  3/18
-                    / \   / \
-
-          -- 层次分配法
+                     /    \
+                  2/15    3/18
+                  /   \  /   \
+                4/17  6/10   5/23
+             过程     存储区域
+               1         0~21
+               2        22~36
+               3        37~54
+               4        55~71
+               5        72~94
+               6        95~104
+             特点：按照过程出现的先后顺序逐段分配存储空间；各过程的活动记录占用互不相交的存储空间
+             优点：处理上简单
+             缺点：对内存空间的使用不够经济合理
+          -- 层次分配法：https://www.pianshen.com/article/13011737518/
        -- 实现静态存储分配：
           -- 编译程序对源程序进行处理时，对每个变量在符号表中创建一个记录，保存该变量的属性，其中包括为变量分配的存储空间地址即目标地址
           -- 由于每个变量需要的空间大小已知，则可将数据区开始位置的地址A分配给第一个变量，设第一个变量占n1个字节，则A + n1分配给第二个变量。同理，A + n1 + n2分配给第三个变量等等
@@ -79,6 +86,9 @@
   -- 内核：内核区是所有进程共享的
 
 
+
+
+
 *栈式存储分配：
 ·活动记录
   -- 使用过程(或函数、方法)作为用户自定义动作的单元的语言，其编译器通常以过程为单位分配存储空间
@@ -88,6 +98,7 @@
   -- 当一个过程被调用时，该过程的活动记录被压入栈；当过程结束时，该活动记录被弹出栈。
   -- 栈式存储不仅允许活跃时段不交叠的多个过程调用之间共享空间，而且允许以如下方式为一个过程编译代码：它的非局部变量的相对地址总是固定的
 ·寄存器与函数栈帧
+  -- 栈帧：函数调用经常是嵌套的，在同一时刻，堆栈中会有多个函数的信息。每个未完成运行的函数占用一个独立的连续区域，称作栈帧(Stack Frame)
   -- 每一个函数独占自己的栈帧空间。当前正在运行的函数的栈帧总是在栈顶。Win32系统提供两个特殊的寄存器用于标识位于系统栈顶端的栈帧。
      -- ESP：栈指针寄存器(extended stack pointer)，其内存放着一个指针，该指针永远指向系统栈最上面一个栈帧的栈顶，当我们往栈内添加数据时，ESP就会往上移动该数据的大小。
      -- EBP：基址指针寄存器(extended base pointer)，其内存放着一个指针，该指针永远指向系统栈最上面一个栈帧的底部
@@ -134,7 +145,6 @@
   -- 数据类型：
      -- 基本类型：基本数据类型都储存在栈中
      -- 引用类型：引用类型的值是储存在堆中，栈内存中保存着一个堆内存的对象的引用
-
 ·作用域
   -- 作用域分为：词法作用域（也叫静态作用域）和环境作用域（也叫执行时作用域/动态作用域）。
   -- js遵循词法作用域
@@ -160,33 +170,36 @@
   var b=a+1       p1=p0+1       p1              a           sp+4
                   a=p1          a               p1          sp+8
                   b=a+1         b               p2          sp+12
-
 ·三地址表达式实例2（斐波那契函数）栈的活动记录图示：
-  程序执行时，首先将opcode码（为了易于理解，我们这里讨论的opcode用三地址码表示）载入内存，存到代码段。代码开始执行时，cpu至上而下读取opcode，直到读取到call f这一行，此时将5压栈，代码段的指针指向代码段的f函数体的第一行（即f行）并开始逐行往下执行。通过栈的指针偏移和代码段的指针偏移，就可以拿到各个数据的地址了
-    栈空间（通过指针偏移拿到数据）     代码段（通过行号值拿到数据）    
-  |  link7   |                           
-  //link7会指向数字2                |     f    |
-  |     2    |                     |  t1=n==1  |
-  |  link6   |                     |  t2=n==2  |
-  |  link5   |                     |t3=t1 or t2|
-  |其他临时变量|                    |           |
-  |  返回值3 |                      |branch goto|
-  |     3    |                     |   ...     |
-  |  link4   |                     |           |
-  |  link3   |                     |           |
-  |其他临时变量|                    |           |
-  |  返回值2 |                      |          |
-  |     4    |                     |           |
-  |  link2   |                     |           |
-  //link2会指向数字5                |           |
-  |  link1   |                     |           |
-  //link1会指向代码call f           |           |
-  |其他临时变量|                    |           |
-  |  返回值1 |                      |          |
-  //返回值可根据5的偏移量计算拿到    |           |  
-  //通过push空为返回值1占位         |   call f  |
-  |     5    |                     //call f将指向f函数体的第一行
-  ------------                     --------------
+      栈空间（通过指针偏移拿到数据）                 代码段（通过行号值拿到数据）    
+    |  link7   |                           
+    //link7会指向数字2                            |     f    |
+    |     2    |                                 |  t1=n==1  |
+    |  link6   |                                 |  t2=n==2  |
+    |  link5   |                                 |t3=t1 or t2|
+    |其他临时变量|                                |           |
+    |  返回值3 |                                  |branch goto|
+    |     3    |                                 |   ...     |
+    |  link4   |                                 |           |
+    |  link3   |                                 |           |
+    |其他临时变量|                                |           |
+    |  返回值2 |                                  |          |
+    |     4    |                                 |           |
+    |  link2   |                                 |           |
+    //link2会指向数字5（即上一个栈帧 ）            |           |
+    |  link1   |                                 |           |
+    //link1会指向代码call f                       |           |
+    |其他临时变量|                                |           |
+    |  返回值1 |                                  |          |
+    //返回值可根据5的偏移量计算拿到                |           |  
+    //通过push空为返回值1占位                     |   call f  |
+    |     5    |                                 //call f将指向f函数体的第一行
+    ------------                                 --------------
+  运行时分析：
+    程序执行时，操作系统首先会开辟一个内存空间（具体参考《递归语言的运行时内存划分.jpg》），并将二进制机器码（为了易于理解，我们这里讨论的机器码用三地址码表示）载入存到开辟的内存的代码段，此时CS（Code Segment，代码段寄存器）指向该代码段的基址。
+    通过CS:IP（即Instruction Pointer，指令指针寄存器，即代码段CS对应的偏移指针）的指向从内存中取出下一条执行的指令，产生如下流程：取出的指令装入CPU的指令寄存器 → 执行指令 → IP++（即指向下一条指令了）或 通过JMP等跳转指令重新修改CS:IP而该表下一条指令的位置 → 重复第一步（循环）。
+    当然，在前面运行存储分配讲到，对于JS这种复杂的语言不会这么简单执行，而是要依赖栈进行临时数据和执行流程进行管理。根据ecma-262标准，JS引擎会先创建一个全局环境，并将全局上下文压入栈底。当遇到函数执行时，会创建函数执行上下文，并将该上下文压入栈顶。而栈中的指令可以根据EBP:ESP（ESP是堆栈指针寄存器，存放执行函数对应栈帧的栈顶地址(也是系统栈的顶部)，且始终指向栈顶；EBP是栈帧基址指针寄存器，存放执行函数对应栈帧的栈底地址）获取当前的内存地址空间，以指导生成准确操作数的机器码。
+    通过栈的指针偏移和代码段的指针偏移，两者配合就可以完成运行时的内存分配，并记录下各个数据的地址。    
 ·设计一个三地址码生成规则：
   -- @：表示作用域
   -- section：执行上下文
@@ -199,13 +212,13 @@
   -- call：函数调用
   -- pass：表示传参
 ·源码 → 三地址
-  function fibonacci(n){
-    if(n==1 || n==2){
-      return n
+    function fibonacci(n){
+      if(n==1 || n==2){
+        return n
+      }
+      return fibonacci(n-1)+fibonacci(n-2)
     }
-    return fibonacci(n-1)+fibonacci(n-2)
-  }
-  print(fibonacci(5))
+    print(fibonacci(5))
   转换后的三地址码：
     section fibonacci@2
     set %TOP% %SP%
@@ -229,4 +242,3 @@
     call fibonacci@1
     pass $t2@1
     call print@1
-·算法：
 
@@ -1,160 +1,57 @@
-## 微机原理
-### 指令：
-* 指令格式：操作码 [操作数] [操作数]
-  <br/>
-  ~&emsp;操作数：执行对象。第一个操作数 ：目标操作数；第二个操作数：源操作数
-  <br/>
-  ~&emsp;[]表示可以缺省
-* 指令格式：
-  <br/>
-  ~&emsp;零操作数指令：操作码
-  <br/>
-  ~&emsp;单操作数指令：操作码 [操作数]
-  <br/>
-  ~&emsp;双操作数指令：操作码 [操作数] [操作数]
-* 指令中的操作数
-  <br/>
-  ~&emsp;立即数:是一个常数
-  <br/>
-  ~&emsp;寄存器操作数：是一个地址，计算速度最快
-  <br/>
-  ~&emsp;存储器操作数：是一个地址，计算速度最慢
-* 立即数：立即数本身是参加操作的本身，可以是8位或者16位。只能作为源操作数
-```
-mov AX,1234H
-mov BL,22H
-```
-* 寄存器操作数:参加运算的数存放在指令给出的寄存器中，可以是8位，16位。
-```
-mov AX,BX
-mov DL,CH
-```
-* 存储器操作数:
-  <br/>
-  ~&emsp;参与运算的数据存放在存储器的某一个或两个单元中
-  <br/>
-  ~&emsp;表现形式：【 】：方括号里面是地址（偏移地址）
-```
-MOV AL,[1200H]
-```
-
-### 指令的寻址方式(8种)：
-* 立即寻址
-  ```
-  由指令直接给出运算数据。操作数为立即数
-  MOV AX,1200H
-  结果：AL=00H，AH=12H
-  常数1200H存放在代码段
-  ```
-* 寄存器寻址
-  ```
-  参加的操作数在CPU的通用寄存器中
-  mov AX,BX
-  ```
-* 存储器操作数的寻址方式
-* 直接寻址
-  ```
-  方括号里面直接是偏移地址
-  MOV AX,[1200H]
-  ```
-* 寄存器间接寻址
-  ```
-  偏移地址为通用寄存器中的内容，换句话说：偏移地址放在通用寄存器中
-  ```
-* 寄存器相对寻址
-  ```
-  相对寻址主要用于一维数组的操作
-  ```
-* 基址，变址，相对寻址
-  ```
-  操作数的偏移地址=基址寄存器中的数据+变址寄存器中的数据+偏移地址
-  主要运用二维数组
-  ```
-* 隐含寻址
-  ```
-  操作数在默认的地址中
-  MUL BL
-  指令执行：AL*BL，结果放在AX中
-  ```
-
-
-## 代码生成器
-
-* 代码生成器：将优化后的三地址码转化为目标码
-* 目标码的三种形式：
-  <br/>
-  ~&emsp;绝对指令代码：能够立即执行的二进制代码，所有地址已经定位
-  <br/>
-  ~&emsp;可重新定位指令代码：待装配的机器语言模块，执行时由链接器把他们和某些程序连接起来，转换为可执行的二进制机器语言代码
-  <br/>
-  ~&emsp;汇编指令代码：尚未经过汇编器汇编成二进制的汇编代码
-* 代码生成主要考虑的问题：
-  <br/>
-  ~&emsp;如何使生成目标代码较短
-  <br/>
-  ~&emsp;如何充分利用寄存器，减少目标代码中访问存储单元次数
-  <br/>
-  ~&emsp;如何充分利用不同cpu指令系统的特点
-* 代码生成器的主要任务：
-  <br/>
-  ~&emsp;指令选择：代码生成器将中间码转换成目标机器码。一个中间码可以有多种机器码转换，所以代码生成器负责选择指令。
-   <br/> 
-  ~&emsp;寄存器申请：程序执行过程中可能需要保存一系列值。目标机器架构可能不允许所有的值都保存在CPU内存或寄存器。代码生成器决定寄存器保存哪些值。同样，也决定寄存器保存哪些值。
-  ~&emsp;指令顺序：一个代码生成器决定指令执行的顺序，它创建指令调度来执行它。
-* 一个目标原型非常复杂，我们不可能描述出全部细节，所以我们通常会将其简化为一个简单目标机原型。
-* 一个简单目标机原型：
-  <br/>
-  ~ 加载、保存、运算、跳转等操作
-  <br/>
-  ~ 内存按字节、寄存器、指针指向寻址或其他间接寻址
-  <br/>
-  ~ n个通用寄存器R0,R1,....,Rn-1
-  <br/>
-  ~ 所以运算分量都是整数
-  <br/>
-  ~ 指令之间可能有一个标号
-* 目标通常一个机器指令有几十上百个指令，为了简化通常只选取一些典型指令：
-  <br/>
-  ~ 加载指令：LD r, x
-  <br/>
-  ~ 保存指令：ST x,r
-  <br/>
-  ~ 运算指令：OP dst,src1,src2
-  <br/>
-  ~ 无条件跳转指令：BR L
-  <br/>
-  ~ 条件跳转指令：Bcond r,L
-  <br/>
-  ~ 压栈操作指令：
-  ```
-  push #1   将数字1压栈
-  push TOP  将寄存器TOP压栈
-  push @sp  将指针sp指向的值压栈
-  ```
-  <br/>
-  ~ 移动指令：
-  ```
-  MOVE R0,R1  将寄存器R0的值移入到R1中
-  MOVE #1 R0  将数字1移入寄存器R0中
-  MOVE #1 @TOP  将数字1移到寄存器指向的位置
-  MOVE #1 @(TOP+4)  将数字1移到寄存器指向的位置基础上再加4位的位置
-  ```
-  <br/>
-  ~ 比较指令：CMP R0,R1 比较两个寄存器中值的大小
-* 运算语句的三地址转目标代码：
-  ```
+
+*代码生成基本概念：
+·代码生成器：将优化后的三地址码转化为目标码的翻译程序
+·目标码的三种形式：
+  -- 绝对指令代码：能够立即执行的二进制代码，所有地址已经定位
+  -- 可重新定位指令代码：待装配的机器语言模块，执行时由链接器把他们和某些程序连接起来，转换为可执行的二进制机器语言代码
+  -- 汇编指令代码：尚未经过汇编器汇编成二进制的汇编代码
+·代码生成主要考虑的问题：
+  -- 如何使生成目标代码较短
+  -- 如何充分利用寄存器，减少目标代码中访问存储单元次数
+  -- 如何充分利用不同cpu指令系统的特点
+·代码生成器的主要任务：
+  -- 指令选择：代码生成器将中间码转换成目标机器码。一个中间码可以有多种机器码转换，所以代码生成器负责选择指令。
+  -- 寄存器申请：程序执行过程中可能需要保存一系列值。目标机器架构可能不允许所有的值都保存在CPU内存或寄存器。代码生成器决定寄存器保存哪些值。同样，也决定寄存器保存哪些值。
+  -- 指令顺序：一个代码生成器决定指令执行的顺序，它创建指令调度来执行它。
+·一个目标原型非常复杂，我们不可能描述出全部细节，所以我们通常会将其简化为一个简单目标机原型。
+·一个简单目标机原型：
+  -- 加载、保存、运算、跳转等操作
+  -- 内存按字节、寄存器、指针指向寻址或其他间接寻址
+  -- n个通用寄存器R0,R1,....,Rn-1
+  -- 所以运算分量都是整数
+  -- 指令之间可能有一个标号
+·寄存器：
+  -- TOP：存放作用域的基址
+  -- ZF：零标志ZF(Zero Flag)用来反映运算结果是否为0。如果运算结果为0，则其值为1，否则其值为0。在判断运算结果是否为0时，可使用此标志位。
+·目标通常一个机器指令有几十上百个指令，为了简化通常只选取一些典型指令：
+  -- 加载指令：LD r, x
+  -- 保存指令：ST x,r
+  -- 运算指令：OP dst,src1,src2
+     SUB R1,R1,R2  // R1=R1-R2
+  -- 无条件跳转指令：BR L
+  -- 条件跳转指令：Bcond r,L
+  -- 压栈操作指令：
+      push #1   将数字1压栈
+      push TOP  将寄存器TOP压栈
+      push @sp  将指针sp指向的值压栈
+  -- 移动指令：
+      MOVE R0,R1  将寄存器R0的值移入到R1中
+      MOVE #1 R0  将数字1移入寄存器R0中
+      MOVE #1 @TOP  将数字1移到寄存器指向的位置
+      MOVE #1 @(TOP+4)  将数字1移到寄存器指向的位置基础上再加4位的位置
+  -- 比较指令：CMP R0,R1 比较两个寄存器中值的大小
+  -- 代码段行号跳转：JMP @(TOP-8)
+·运算语句的三地址转目标代码：
   三地址码：
-  x=y-z
+    x=y-z
   目标代码：
-  LD R1,y       //R1=Y
-  LD R2,z       //R2=Z
-  SUB R1,R1,R2  //R1=R1-R2
-  ST x,R1       //X=R1
+    LD R1,y       //R1=Y
+    LD R2,z       //R2=Z
+    SUB R1,R1,R2  //R1=R1-R2
+    ST X,R1       //X=R1
   解析：优秀的代码生成器应该避免使用上面的全部4个指令，如果：
-  ①所需的分量已经在寄存器中了
-  ②运算结果不需要存放内存
-  ```
-
+    ①所需的分量已经在寄存器中了
+    ②运算结果不需要存放内存