脱壳学习(一)计算机底层基础
前言
心血来潮想写一篇关于逆向脱壳的教程,这次内容比较多想分为三次发布。今天第一篇主要讲的是基础理论,脱壳前必须了解的内容、知道计算机底层是什么、CPU是怎么处理数据的。
CPU架构及运行过程
说到计算机底层原理,首先要了解底层体系,也就是著名的冯诺依曼原理:
CPU从逻辑上分为三部分,分别是控制单元、运算单元和存储单元,这三部分由CPU内部总线连接起来。几乎所有的冯诺伊曼型计算机的CPU,其工作都可以分为5个阶段:取指令、指令译码、执行指令、访存取数、结果写回。
1。取指令阶段,是将内存中的指令读取到CPU中寄存器的过程,程序寄存器用于存储下一条指令所在的地址。
2。指令译码阶段,在取指令完成后,立马进入指令译码阶段,在指令译码阶段,指令译码器按照预定的指令格式,对取回的指令进行拆分和解释,识别区分出不同的指令类别以及各种获取操作数的方法。
3。执行指令阶段,译码完成后,就需要执行这一条指令了,此阶段的任务是完成指令所规定的各种操作,具体实现指令的功能。
4。访问取数阶段,根据指令的需要,有可能需要从内存中提取数据,此阶段的任务是:根据指令地址码,得到操作数在主存中的地址,并从主存中读取该操作数用于运算。
5。结果写回阶段,作为最后一个阶段,结果写回(WriteBack,WB)阶段把执行指令阶段的运行结果数据写回到CPU的内部寄存器中,以便被后续的指令快速地存取。
寄存器
以上基本上就是CPU运行的基本过程,程序在内存中装载,由CPU来运行,CPU的主要职责就是用来处理数据,CPU不断的通过总线发送请求并进入存储单元,这个过程很繁琐,会占用大量的资源,有一些内存页也是没有必要的,因此出现了寄存器。
63。。3231。。1615870
AH。AL。
AX。。。。。
EAX。。。。。。。。。。。。
RAX。。。。。。。。。。。。。。。。。。。
从图中我们可简单的了解到寄存器都说是在向后兼容,在RAX中EAX依然可以使用,不过指向了RAX的低位,EAX是AX数据扩展,不可分割两个AX,RAX同理,但AX可以分割成AH和AL分别对应高位和地位。除了上面AX、BX、CX、DX寄存器以外,其他寄存器均不可以分为两个独立的8位寄存器。
我们这里主要讲解各个寄存器的主要功能,所以我们以8086来进行探讨,8086是x86的前身,也就是16位处理器,8086处理器有14个寄存器,每个寄存器都有一个特有的名称AX,BX,CX,DX,SP,BP,SI,DI,IP,FLAG,CS,DS,SS,ES,但这些寄存器功能只有三种:
1。通用寄存器
AX,BX,CX,DX
这些寄存器是16位,能存放两个字节(8bit一个字节)AX、BX、CX、DX这四个寄存器一般用来存放数据,所以是数据寄存器。
AX(AccumulatorRegister):累加寄存器,它主要用于输入输出和大规模的指令运算。在汇编中最频繁使用
BX(BaseRegister):基址寄存器,用来存储基础访问地址,还可以用来寻址,即寻找物理内存地址。BX寄存器中存放的数据一般是用来作为偏移地址使用的
CX(CountRegister):计数寄存器,CX寄存器在迭代的操作中会循环计数,CX中的C被翻译为Counting也就是计数器的功能。当在汇编指令中使用循环LOOP指令时,可以通过CX来指定需要循环的次数,当CX的值是0时跳出循环
DX(dataRegister):数据寄存器,它也用于输入输出操作。它还与AX寄存器以及DX一起使用,用于涉及大数值的乘法和除法运算。
19,它在16位存储器中所存储的表示如下:
寄存器的存储方式是先存储低位,如果低位满足不了就存储高位,如果低位能够满足,高位用0补全,在其他低位能满足的情况下,其余位也用0补全。
段寄存器
段寄存器主要包含
CS(CodeSegment):代码寄存器,程序代码的基础位置
DS(DataSegment):数据寄存器,变量的基本位置
SS(StackSegment):栈寄存器,栈的基础位置
ES(ExtraSegment):其他寄存器,内存中变量的其他基本位置。
2。索引寄存器
BP(BasePointer):基础指针,它是栈寄存器上的偏移量,用来定位栈上变量
SP(StackPointer):栈指针,它是栈寄存器上的偏移量,用来定位栈顶
SI(SourceIndex):变址寄存器,用来拷贝源字符串
DI(DestinationIndex):目标变址寄存器,用来复制到目标字符串
这两个寄存器通过段寄存器确定基本地址也叫基地址,索引寄存器就是在基地址的基础上的偏移地址,通过基地址加上偏移地址,CPU就可以找到在内存中的准确位置。
3。状态和控制寄存器
IP(InstructionPointer):指令指针寄存器,它是从CodeSegment代码寄存器处的偏移来存储执行的下一条指令
FLAG:Flag寄存器用于存储当前进程的状态,这些状态有
位置(Direction):用于数据块的传输方向,是向上传输还是向下传输
中断标志位(Interrupt):1允许;0禁止
陷入位(Trap):确定每条指令执行完成后,CPU是否应该停止。1开启,0关闭
进位(Carry):设置最后一个无符号算术运算是否带有进位
溢出(Overflow):设置最后一个有符号运算是否溢出
符号(Sign):如果最后一次算术运算为负,则设置1负,0正
零位(Zero):如果最后一次算术运算结果为零,1零
辅助进位(AuxCarry):用于第三位到第四位的进位
奇偶校验(Parity):用于奇偶校验
结语
以上就是计算机底层的基本运行原理,虽然是一些浅显的概念,但是明白计算机运行的过程我们才能去实现对程序底层的控制,下一篇主要讲解反调试和绕过。