完善内核

1：函数调用约定

参数传递方式---------存放在栈中

在函数未执行前发生进程切换，参数还是需要转移阵地，寄存器又太少，干脆直接放在内存中
为了避免多进程的参数覆盖问题，将参数放在进程自己的栈中。

参数压栈顺序---------从右向左，栈空间的清理员----------调用者（仅限在当前cdecl调用约定下）

由于编写函数的程序员或者调用函数的人都知道需要调用的参数，所以这些工作其实有谁做都可以，只需要双方做好约定即可。调用约定例如有cdecl，syscall，optlink，thiscall

cdecl ( C declaration，即 C 声明〉，起源于 C语言的一种调用约定，在c语言中，函数参数是从右到左的顺序入梭的。 GNU/Linux GCC，把这一约定作为准， x86 架构上的许多 C 编译器也都使用这个约定。在 cdecl 中，参数是在栈中传递的。 EAX、 ECX 和 EDX 寄存器是由调用者保存的，其余的寄存器由被调用者保存．函数的返回值存储在 EAX 寄存器。由调用者清理栈空间

2：汇编、c混编

为何要混编：

汇编可以直接操作寄存器，对底层设计更方便
由于C代码经过编译成汇编过程中会经过编译器的优化，所以有时为了高效率采用内联汇编。

混编的分类

单独的汇编和C分别编译成待重定位文件（目标文件），再链接成可执行文件
C中嵌入汇编，直接编译

系统调用：Linux内核提供给用户程序用来间接操作硬件的一套子程序，也称为操作系统功能调用

调用方式：通过中断描述符中唯一的系统调用入口0x80号中断，具体的子功能存在EAX中。区别于BIOS中断很多的中断号，是因为IDT中有很多已被预留的中断号。

混合编程总结：

在汇编代码中导出符号供外部引用是用的关键字 global，引用外部文件的符号是用的关键宇 extern。
在 C 代码中只要将符号定义为全局便可以被外部引用，引用外部符号时用 extern 声明即可。

2.1：内联汇编

扩展内联汇编要解决的是在同一个程序中C和汇编如何避免使用寄存器冲突

汇编执行前不知道那些寄存器C程序正在占用，所以用户在完成这步需要增加栈的压力，也会降低运行速度，因此这步由编译器来执行，汇编中提供要使用到的C程序中的变量和寄存器，编译器来提前进行保护

格式：asm (volatile) （"assembly code" : output : input : clobber/modify)

volatile等同于_ volatile _，和c中关键字volatile不一样：编译器不要优化代码，后面的指令保留原样 output:“操作数修饰符约束名” (C 变量名）
input :“［操作数修饰符］约束名”（ c 变量名)
clobber/modify:输入汇编代码执行后可能破坏的寄存器或者内存，来通知编译器保护

上面对output和input的要求称为“约束”，它用来把C代码中的操作数（变量、立即数）映射为汇编中所使用的操作数（寄存器，内存地址）

2.1.1：约束

寄存器约束，把C中操作数存入寄存器中

asm (”addl %%ebx, %%eax ”：”＝a”（ out_sum ）：“ a”（ in_a ），”b ”（ in_b));
“a” (in_a）表示把in_a存入eax中，b表示存入ebx中。
”＝a”（ out_sum ）表示为out_sum = eax的值
内存约束：把c变量的内存地址当作内联汇编代码的操作数，不需要寄存器做中转，直接进行内存读写，也就是汇编代码的操作数是变量的指针
立即数约束：传值的时候不通过内存和寄存器，直接作为立即数传给汇编代码，只能作为右值，放在 input 中。
通用约束

c语言中的volatile作用（同扩展内联汇编中的memory）

内存约束的内存地址，编译器可以知道，但如果有内存在汇编执行过程中被修改，就需要用在clobber/modify中加入“memory”来告诉gcc了。

memeory声明的另个作用是清除寄存器缓存：
内存的访问速度比cpu中的寄存器来说是比较慢的，所以gcc为了提速，把可能常用到的变量存入寄存器中，但这就带来一个问题，编译器编译程序时不知道变量的内存是否会发生变化，也就是说在程序运行过程中变量所在的内存可能会变化，改变的时间可以在CPU的线程调度过程，地点是其他线程的代码运行中。这就导致寄存器的值是“过时”的值

int main(void)
{
    int i;
    i = 1;
    i = 2;
    return i;
}
//没优化情况下
mov dword ptr[ebp-4],1
mov dword ptr[ebp-4],2
mov eax,dword ptr[ebp-4]	//访问内存的值
ret
//优化情况下
mov eax,2	//直接把变量的值放入寄存器中，[ebp-4]地址处的值如果变化，结果就会错误！
ret

因此volatile修饰变量，编译器就会放弃寄存器缓存的方法，采用标准寻址
memory声明告诉编译器变量所在的内存数据会改变，这样就可以从内存再读取一次新数据

占位符分为序号占位符和名称占位符

产生原因：

肯定是为了方便代码编写，也容易让编译器识别
寄存器约束中有一种r约束，即让编译器自主选择寄存器来映射C代码中的变量，但编写者不知道用哪个寄存器，所以引入占位符

扩展内联汇编中的占位符要有前缀%，所以描述寄存器要用两个%（%%ebx）

//序号占位符 支持10个操作数
asm("movb %h1, %0;"\
    :"=m"(in_b)\
    :"a"(in_a));
//%0指output %1指input，有多输入则记为%2，%3，%4...
//操作数默认是32位，根据指令对操作数的要求再取8位、16位等
//%和序号之间添加h表示取寄存器的低16位，添加b表示取低8位

//名称占位符	数量不受限制  规则 [名称]"约束名"(C变量)
asm("movb %[xx],%[yy];"\
	:[yy]"=m"(in_b)\
	:[xx]"a"(in_a));

2.1.2：机器模式

机器模式用来在机器层面上指定数据的大小和格式，因为约束不能准确的表示数据对象，因此机器模式从更细的粒度上进行描述。

如序号占位符的例子中%h1，h表示寄存器高位部分的一个字节(ah)
常用的包括：
在这里插入图片描述

3：编写打印字符函数

背景信息：

与显存的寄存器（CRT Controller Data Registers），默认情况下I/OAS位置1，则CRT的Address Register的端口地址为0x3D4，Data Register 的端口地址 0x3D5，其中AR是用来索引端口，DR是存储端口对应的寄存器，而索引为0x0E和0x0F的寄存器分别存储光标的坐标的高低8位
光标是字符的坐标，是一维的线性坐标，以0为起始的顺序。在默认的 80*25 模式下，每行80个字符共25 行，屏幕上可以容纳 2000个字符（坐标值范围0~1999）
视频段选择子的索引号为0x03

实现步骤：

备份调用环境
读取光标坐标
获取栈中字符
判断字符类型，如果是换行\n0xa、回车\r0xd、退格0x8行为符号就另外处理，不然直接当成显示字符打印出来（打印前判断是否需要滚屏）
更新光标坐标

文本换行方式有两种：（其实结果没有区别）

CRLF：windows下表示为“\r\n"，先回到行首再换行

LF：Linux下表示为"\n"，直接换行

链接时注意要按照“调用在前，实现在后”的顺序输入待链接文件。

int main(void)
{
    int i;
    i = 1;
    i = 2;
    return i;
}
//没优化情况下
mov dword ptr[ebp-4],1
mov dword ptr[ebp-4],2
mov eax,dword ptr[ebp-4]	//访问内存的值
ret
//优化情况下
mov eax,2	//直接把变量的值放入寄存器中，[ebp-4]地址处的值如果变化，结果就会错误！
ret

[6]完善内核（内联汇编、c混编）