看完这篇文章之后,终于明白了编译到底怎么回事。
1
对于同一个语句,有如下三种:高级语言、低级语言、机器语言的表示
C语言
a=b+1;汇编语言
mov -0xc(%ebp),%eax
add $0x1,%eax
mov %eax,-0x8(%ebp)机器语言
8b 45 f4
83 c0 01
89 45 f8
我们都知道,机器是只能做数字计算的,能够让机器去运算的、数字的语言就是机器语言,除此之外的所有计算机语言都是非机器语言。这样的相对于机器语言的高级语言都需要一个转换,从高级、机器不可理解,转换为机器可理解的机器语言。这样的一个转换过程就叫做编译(Compile)
,由编译器(Compiler)
来完成。
由C转换为汇编语言这一过程是由汇编器(Assembler)
来执行的。
C和汇编语言转换为机器语言都是由编译器来完成的。
2
这里面,C是可跨平台的,也可以说是与平台无关的。这里的平台有两种说法,一种是指计算机的体系(Architecture)
,另一种是指操作系统(Operate System)
,也可以是指两种的结合。不同的平台,他们所需要的执行机器语言的指令集是不同的。C的跨平台性是指,只需要编写一份不需要修改的C程序代码,就可以在不同体系、不同操作系统的计算机上运行。这都要靠编译器的功劳,编译器将C程序翻译为了适合当前计算机体系的机器语言。
下面说一下将C语言编译为机器语言的整个过程:
首先,我们写出一份C程序代码,命名该代码为hello.c
,这个代码文件,我们称之为源代码(Srouce Code)
。
然后我们运行编译器,对该源代码文件进行编译,在整个编译的过程中,编译器并不会执行该源代码,只是生成一份新的机器语言代码文件,如hello.out
。这份新生成的代码文件称为目标代码(Object Code)
或可执行代码(Executable)
。
3
对于编译过程,里面还涉及到具体的一些可以说的细节步骤。
在Linux
下,使用gcc
编译器:
预编译hello.c文件:
gcc -E -o hello.i hello.c
执行成功后就会生成一个新的hello.i
的文件,可以用编辑器(Vim)查看它的内容,这个文件就是经过预编译
后的内容。
预编译
又称为预处理,是做些代码文本的替换工作。预编译可以处理#
开头的指令,比如拷贝#include
包含的文件代码,#define
的宏定义的替换,条件编译等。
纯粹的进行编译:
gcc -S -o hello.s hello.i
把.i文件写为hello.c也行,就是跳过手动预编译,直接完成预编译和编译两个过程。这时会得到一个hello.s文件,打开看一下,里面是编译好的使用于当前体系结构的汇编代码。
把汇编代码处理为目标文件:
gcc -c -o hello.o hello.s
把.s文件换成.c也行,就是自动完成预编译、编译和汇编三个过程。现在得到一个hello.o文件,这是一个二进制文件,但不是最后的可执行二进制文件,因为它还缺少最后一步连接处理。
最后对目标文件.o文件进行连接,我们这里就一个.o文件所以简单,经常是需要有多个.o文件需要连接。连接执行:
gcc -o hello hello.o
如果把最后的.o文件写成.c,那就和最开始我们用hello.c编译时示范的那样了。实际上那样是完成了预编译、编译、汇编和连接一连串的过程。
-o
选项给输出的文件重新命名而不使用gcc默认的文件名。
想了解更多gcc的姿势可以到GNU的网站上去看看。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。