函数调用中堆栈的个人理解 - 痞子辉(2)_H5之家 - 中国HTML5教程资源分享第一站

　　ret：当指令指到ret指令行时，说明一个函数已经结束了，这时候rsp已经从被调用函数的栈指到了调用函数构建的返回地址位置。ret是将rsp所指栈顶地址中的内容赋值给PC，接下来将执行call function的下一条指令。

　　leave：相当于mov %esp, %ebp, pop ebp。头一条指令其实是把ebp所指的被调用函数的栈底作为新的栈顶，pop指令时相当于把被调用函数的栈底弹出，rsp指向返回地址。

　　int：通过其后加中断号，实现软件引发中断，linux操作系统中系统调用多有此实现，其他实时操作系统中在操作系统移植时，会有tick心脏函数也有此实现。

　　其他的汇编指令在此就不多讲了，因为汇编指令众多，硬件cpu寄存器也因硬件不同而不同，此节就讲了函数构建进入和离开函数时用到的几个汇编指令，这几条指令和栈变化有关。自己构建汇编函数，或者是在读linux操作系统的系统调用时会对其理解有帮助。硬件寄存器中rsp，和rbp用于指示栈顶和栈底。

3. linux中任务的堆栈，数据存放是如何？

linux的任务堆栈分为两种：内核态堆栈和用户态堆栈。接下来简单介绍一下这两个堆栈，如果以后有机会将详细介绍这两个堆栈。

1. 内核态堆栈

linux操作系统分为内核态和用户态。用户态代码访问代码和数据收到诸多限制，用户态主要是为程序员编写程序使用，处于用户态的代码不可以随便访问linux内核态的数据，这主要就是设置用户态的权限，安全考虑。但是用户态可以通过系统调用接口，中断，异常等访问指定内核态的内容。内核态主要是用于操作系统内核运行以及管理，可以无限制的访问内存地址和数据，权限比较大。

linux操作系统的进程是动态的，有生命周期，进程的运行和普通的程序运行一样，需要堆栈的帮助，如果在内核存储区域内为其提前分配堆栈的话，既浪费内核内存（任务地址大约3G的空间），也不能灵活的构建任务，所以linux操作系统在创建新的任务时，为其分配了8k的存储区域用于存放进程内核态的堆栈和线程描述符。线程描述符位于分配的存储区域的低地址区域，大小固定，而内核态堆栈则从存储区域的高地址开始向低地址延伸。如果之前版本为内核态堆栈和线程描述符分配4k的存储空间时，则需要为中断和异常分配额外的栈供其使用，防止任务堆栈溢出。

此图出自，

2. 用户态堆栈

对于32位的linux操作系统，每个任务都会有4G的寻址空间，其中0-3G为用户寻址空间，3G-4G为内核寻址空间。每个任务的创建都会有0-3G的用户寻址空间，但是3G-4G的内核寻址空间是属于所有任务共享的。这些地址都属于线性地址，需要通过地址映射转换成物理地址。为了实现每个任务在访问0-3G的用户空间时不至于混淆地址，每个任务的内存管理单元都会有一个属于自身的页目录pgd,在任务创建之初会创建新的pgd，任务会通过地址映射为0-3G空间映射物理地址。用户态的堆栈就在这0-3G的用户寻址空间中分配，和之前的main函数以及function函数构建堆栈一样，但是具体映射到哪个物理地址，还需要内存管理单元去做映射操作。总之，linux任务用户态的堆栈和普通应用程序一样，由操作系统分配和释放，对程序员来说不可见，不过因为操作系统的原因，任务用户程序寻址有限制。如果有机会之后介绍一下linux内存管理的个人理解。