计算机系统基础学习笔记(2)-数据的位运算操作

C语言的位运算操作包括两类，逻辑运算操作和逻辑移位操作。

逻辑运算操作

C语言提供了四种按位逻辑操作符，分别是按位取反，按位与，按位或，按位异或。在编译时，编译器会根据操作数的宽度分别转换为不同的指令。

操作	C语言操作符	汇编指令
按位取反	~	notb、notw、notl
按位与	&	andb、andw、andl
按位或	l	orb、orw、orl
按位异或	^	xorb、xorw、xorl

注意: C语言的逻辑与(&&)、逻辑或(||)、逻辑非(!)并没有对应的机器指令，而是由多条指令联合来实现这些功能，完成以变量为单位的逻辑操作。

下面我们以一个简单的C语言程序test.c来了解逻辑运算操作过程。

#include <stdio.h>

void main() 
{
    int a=5;
    unsigned int b=3;
    short c=5;
    int d=0;
    
    a = ~a;
    b = ~b;
    c = ~c;
    d = a&b;
    d = a^b;
    d = a|b;
    
    return;
}

利用gcc命令将其进行编译成可执行文件。

gcc -o0 -m32 -g test.c -o test

利用objdump命令进行反汇编并将其重定向到test.txt文件方便查看。

objdump -S test>test.txt

main函数所对应的汇编指令如下所示。

000004ed <main>:
#include <stdio.h>

void main() 
{
 4ed:    55                       push   %ebp
 4ee:    89 e5                    mov    %esp,%ebp
 4f0:    83 ec 10                 sub    $0x10,%esp
 4f3:    e8 48 00 00 00           call   540 <__x86.get_pc_thunk.ax>
 4f8:    05 e4 1a 00 00           add    $0x1ae4,%eax
    int a=5;
 4fd:    c7 45 f4 05 00 00 00     movl   $0x5,-0xc(%ebp)
    unsigned int b=3;
 504:    c7 45 f8 03 00 00 00     movl   $0x3,-0x8(%ebp)
    short c=5;
 50b:    66 c7 45 f2 05 00        movw   $0x5,-0xe(%ebp)
    int d=0;
 511:    c7 45 fc 00 00 00 00     movl   $0x0,-0x4(%ebp)
    
    a = ~a;
 518:    f7 55 f4                 notl   -0xc(%ebp)
    b = ~b;
 51b:    f7 55 f8                 notl   -0x8(%ebp)
    c = ~c;
 51e:    66 f7 55 f2              notw   -0xe(%ebp)
    d = a&b;
 522:    8b 45 f4                 mov    -0xc(%ebp),%eax
 525:    23 45 f8                 and    -0x8(%ebp),%eax
 528:    89 45 fc                 mov    %eax,-0x4(%ebp)
    d = a^b;
 52b:    8b 45 f4                 mov    -0xc(%ebp),%eax
 52e:    33 45 f8                 xor    -0x8(%ebp),%eax
 531:    89 45 fc                 mov    %eax,-0x4(%ebp)
    d = a|b;
 534:    8b 45 f4                 mov    -0xc(%ebp),%eax
 537:    0b 45 f8                 or     -0x8(%ebp),%eax
 53a:    89 45 fc                 mov    %eax,-0x4(%ebp)
    
    return;
 53d:    90                       nop
}
 53e:    c9                       leave  
 53f:    c3                       ret

由以上代码可以看出a,b,c取反的三个操作分别对应以下指令。

    a = ~a;
 518:    f7 55 f4                 notl   -0xc(%ebp)
    b = ~b;
 51b:    f7 55 f8                 notl   -0x8(%ebp)
    c = ~c;
 51e:    66 f7 55 f2              notw   -0xe(%ebp)

其中变量a和变量b的取反指令都是notl,处理的是4字节的变量。而变量c的取反指令执行的是notw,执行的是2字节的变量。这也就说明了编译器会根据操作数的宽度分别转换为不同的指令。

下表给出C语言基本数据和类型和IA-32操作数类型的对应关系

C语言声明	汇编指令长度后缀	存储长度
(unsigned) char	b	8
(unsigned) short	w	16
(unsigned) int	l	32
(unsigned) long int	l	32
(unsigned) long long int	-	2 $\times$ 32
char *	l	32
float	s	32
double	l	64
long double	t	80/96

仍然以下面这样一个简单的C语言程序来理解逻辑与(&&)、逻辑或(||)、逻辑非(!)和按位逻辑操作符的区别。

#include <stdio.h>

void main() 
{
    int a=5;
    unsigned int b=3;
    short c=5;
    int d=0;
    
    a = !a;
    b = !b;
    c = !c;
    d = a&&b;
    d = a||b;
    
    return;
}

利用gcc命令将其进行编译，objdump命令进行反汇编之后，main函数所对应的汇编指令如下所示。

000004ed <main>:
#include <stdio.h>

void main() 
{
 4ed:    55                       push   %ebp
 4ee:    89 e5                    mov    %esp,%ebp
 4f0:    83 ec 10                 sub    $0x10,%esp
 4f3:    e8 82 00 00 00           call   57a <__x86.get_pc_thunk.ax>
 4f8:    05 e4 1a 00 00           add    $0x1ae4,%eax
    int a=5;
 4fd:    c7 45 f4 05 00 00 00     movl   $0x5,-0xc(%ebp)
    unsigned int b=3;
 504:    c7 45 f8 03 00 00 00     movl   $0x3,-0x8(%ebp)
    short c=5;
 50b:    66 c7 45 f2 05 00        movw   $0x5,-0xe(%ebp)
    int d=0;
 511:    c7 45 fc 00 00 00 00     movl   $0x0,-0x4(%ebp)
    
    a = !a;
 518:    83 7d f4 00              cmpl   $0x0,-0xc(%ebp)
 51c:    0f 94 c0                 sete   %al
 51f:    0f b6 c0                 movzbl %al,%eax
 522:    89 45 f4                 mov    %eax,-0xc(%ebp)
    b = !b;
 525:    83 7d f8 00              cmpl   $0x0,-0x8(%ebp)
 529:    0f 94 c0                 sete   %al
 52c:    0f b6 c0                 movzbl %al,%eax
 52f:    89 45 f8                 mov    %eax,-0x8(%ebp)
    c = !c;
 532:    66 83 7d f2 00           cmpw   $0x0,-0xe(%ebp)
 537:    0f 94 c0                 sete   %al
 53a:    0f b6 c0                 movzbl %al,%eax
 53d:    66 89 45 f2              mov    %ax,-0xe(%ebp)
    d = a&&b;
 541:    83 7d f4 00              cmpl   $0x0,-0xc(%ebp)
 545:    74 0d                    je     554 <main+0x67>
 547:    83 7d f8 00              cmpl   $0x0,-0x8(%ebp)
 54b:    74 07                    je     554 <main+0x67>
 54d:    b8 01 00 00 00           mov    $0x1,%eax
 552:    eb 05                    jmp    559 <main+0x6c>
 554:    b8 00 00 00 00           mov    $0x0,%eax
 559:    89 45 fc                 mov    %eax,-0x4(%ebp)
    d = a||b;
 55c:    83 7d f4 00              cmpl   $0x0,-0xc(%ebp)
 560:    75 06                    jne    568 <main+0x7b>
 562:    83 7d f8 00              cmpl   $0x0,-0x8(%ebp)
 566:    74 07                    je     56f <main+0x82>
 568:    b8 01 00 00 00           mov    $0x1,%eax
 56d:    eb 05                    jmp    574 <main+0x87>
 56f:    b8 00 00 00 00           mov    $0x0,%eax
 574:    89 45 fc                 mov    %eax,-0x4(%ebp)
    
    return;

机器指令逻辑非(!)实现的操作解释,以a = !a这个作为例子：

    a = !a;
 518:    83 7d f4 00              cmpl   $0x0,-0xc(%ebp)
 51c:    0f 94 c0                 sete   %al
 51f:    0f b6 c0                 movzbl %al,%eax
 522:    89 45 f4                 mov    %eax,-0xc(%ebp)

首先将变量a与常数0进行比较，如果相等就置寄存器al为1，不等则置为0，然后再把寄存器al的值扩展0扩展送到eax寄存器中，再从寄存器eax中送回到变量a的地址当中。

机器指令逻辑与(&&)实现的操作解释，以d = a&&b来解释。

    d = a&&b;
 541:    83 7d f4 00              cmpl   $0x0,-0xc(%ebp)
 545:    74 0d                    je     554 <main+0x67>
 547:    83 7d f8 00              cmpl   $0x0,-0x8(%ebp)
 54b:    74 07                    je     554 <main+0x67>
 54d:    b8 01 00 00 00           mov    $0x1,%eax
 552:    eb 05                    jmp    559 <main+0x6c>
 554:    b8 00 00 00 00           mov    $0x0,%eax
 559:    89 45 fc                 mov    %eax,-0x4(%ebp)

首先将变量a与0进行相比，如果变量a等于0，就跳到554这个位置，也就是执行指令mov $0x0,%eax，就是把0送到寄存器eax里面，再送到变量d当中。如果变量a不等于0，就用变量b与0相比，如果b等于0，也是跳转到554这个位置去将最终的结果设置为0，如果变量b也不等于0，就把1送到寄存器eax当中，将最终的结果设置为1。

机器指令逻辑或(||)实现的操作解释，以d = a||b来解释

    d = a||b;
 55c:    83 7d f4 00              cmpl   $0x0,-0xc(%ebp)
 560:    75 06                    jne    568 <main+0x7b>
 562:    83 7d f8 00              cmpl   $0x0,-0x8(%ebp)
 566:    74 07                    je     56f <main+0x82>
 568:    b8 01 00 00 00           mov    $0x1,%eax
 56d:    eb 05                    jmp    574 <main+0x87>
 56f:    b8 00 00 00 00           mov    $0x0,%eax
 574:    89 45 fc                 mov    %eax,-0x4(%ebp)

首先将变量a与0进行相比，如果变量a不等于0，就跳转到558这个位置，也就是执行指令mov $0x1,%eax，把1送到寄存器eax里面，无条件转到574这个位置，并将eax的值送到变量d当中。如果变量a等于0,就将变量b与0比较，如果b等于0，就跳转到56f这个位置，去将最终的结果设置为0。

逻辑移位操作

C语言的移位操作包括逻辑左移，算术左移，逻辑右移，算术右移等四种。

操作	C语言操作符	汇编指令
逻辑左移	<<	shlb、shlw、shll
算术左移	<<	salb、salw、sall
逻辑右移	>>	shrb、shrw、shrl
算术右移	>>	sarb、sarw、sarl

注意：IA-32中的其他移位指令没有对应的C语言操作，如想实现循环移位指令，需要编写多条语句来实现。

逻辑移位和算术移位的C语言操作符相同，编译器会根据操作数的不同来选择不同的指令。无符号数采用逻辑移位指令，有符号数采用算术移位指令。逻辑和算术的区别在于友移时最高位补0还是补符号位。算术右移补入符号位，逻辑右移补入0。

我们仍然以一个简单的C语言指令来为大家介绍逻辑移位操作的汇编指令。

#include <stdio.h>

void main()
{
    int a = 0x80000000;
    unsigned int b = 0x80000000;
    
    short c = 0x8000;
    unsigned short d = 0x8000;
    
    a=a>>4;
    b=b>>4;
    
    a=c;
    a=d;
    b=c;
    b=d;
    
    return;
}

利用gcc命令将其进行编译，objdump命令进行反汇编之后，main函数所对应的汇编指令如下所示

000004ed <main>:
#include <stdio.h>

void main()
{
 4ed:    55                       push   %ebp
 4ee:    89 e5                    mov    %esp,%ebp
 4f0:    83 ec 10                 sub    $0x10,%esp
 4f3:    e8 46 00 00 00           call   53e <__x86.get_pc_thunk.ax>
 4f8:    05 e4 1a 00 00           add    $0x1ae4,%eax
    int a = 0x80000000;
 4fd:    c7 45 f8 00 00 00 80     movl   $0x80000000,-0x8(%ebp)
    unsigned int b = 0x80000000;
 504:    c7 45 fc 00 00 00 80     movl   $0x80000000,-0x4(%ebp)
    
    short c = 0x8000;
 50b:    66 c7 45 f4 00 80        movw   $0x8000,-0xc(%ebp)
    unsigned short d = 0x8000;
 511:    66 c7 45 f6 00 80        movw   $0x8000,-0xa(%ebp)
    
    a=a>>4;
 517:    c1 7d f8 04              sarl   $0x4,-0x8(%ebp)
    b=b>>4;
 51b:    c1 6d fc 04              shrl   $0x4,-0x4(%ebp)
    
    a=c;
 51f:    0f bf 45 f4              movswl -0xc(%ebp),%eax
 523:    89 45 f8                 mov    %eax,-0x8(%ebp)
    a=d;
 526:    0f b7 45 f6              movzwl -0xa(%ebp),%eax
 52a:    89 45 f8                 mov    %eax,-0x8(%ebp)
    b=c;
 52d:    0f bf 45 f4              movswl -0xc(%ebp),%eax
 531:    89 45 fc                 mov    %eax,-0x4(%ebp)
    b=d;
 534:    0f b7 45 f6              movzwl -0xa(%ebp),%eax
 538:    89 45 fc                 mov    %eax,-0x4(%ebp)
    
    return;

从sarl $0x4,-0x8(%ebp)这条指令可以清楚的看到当执行a右移4位的操作时，因为a是有符号数，所以执行的就是算术右移，对应的汇编指令sarl。而执行b右移时，因为b是无符号数，所以执行的是逻辑右移指令，对应汇编指令shrl。

    a=c;
 51f:    0f bf 45 f4              movswl -0xc(%ebp),%eax
 523:    89 45 f8                 mov    %eax,-0x8(%ebp)
    a=d;
 526:    0f b7 45 f6              movzwl -0xa(%ebp),%eax
 52a:    89 45 f8                 mov    %eax,-0x8(%ebp)
    b=c;
 52d:    0f bf 45 f4              movswl -0xc(%ebp),%eax
 531:    89 45 fc                 mov    %eax,-0x4(%ebp)
    b=d;
 534:    0f b7 45 f6              movzwl -0xa(%ebp),%eax
 538:    89 45 fc                 mov    %eax,-0x4(%ebp)

由这8条指令可以看出，在执行a=c的时候，执行的是符号扩展指令，z=d时执行的是零扩展指令，b=c时执行的是符号扩展指令，b=d时执行的是零扩展指令。因此我们可以看出，执行符号扩展还是零扩展是由等号右边的变量类型决定的，与等号左边的变量类型无关。

位运算的作用

可实现特定的功能：取特定位、保留特定位
周期短速度快：左移、右移可用于实现快速的整数乘、除法
可实现其他功能：原位交换

PS：交换变量a和变量b的值

普通方法

c = a; a = b; b = c;

位操作交换法

a = a^b; b = b^a; a = a^b;

位操作法原理：

b = b^(a^b) = b^a^b = b^b^a = a
a = (a^b)^(b^(a^b)) = a^b^b^a^b = b

本次给大家分享的内容就到这里啦，觉得还不错的点个赞支持一下小编，你的肯定就是小编前进的动力。另外如果想了解更多计算机专业的知识和技巧的，献上我的个人博客北徯，另外需要各种资料的童鞋，可以关注我的微信公众号北徯，免费的PPT模板，各种资料等你来领。

计算机系统基础学习笔记(2)-数据的位运算操作

逻辑运算操作

逻辑移位操作

位运算的作用

PS：交换变量a和变量b的值

北徯

引用和评论

SH 和 BASH 有什么不同？

如何在 Bash 中使用 =~ 操作符？

Linux Bash 中 $? 的详细用法

计算机系统基础学习笔记(2)-数据的位运算操作

逻辑运算操作

逻辑移位操作

位运算的作用

PS：交换变量a和变量b的值

北徯

引用和评论

SH 和 BASH 有什么不同 ？

如何在 Bash 中使用 =~ 操作符 ？

Linux Bash 中 $? 的详细用法

SH 和 BASH 有什么不同？

如何在 Bash 中使用 =~ 操作符？