1

自定义类详解(结构体+枚举+联合体)

@[toc]

一、结构体

日常无法用int char float double short long 表示所有类型,复杂对象,把这些基础类型组合起来就是结构体类型。

1.1结构体声明

struct Stu
{
    char name[20];        //结构体成员变量
    int age;            
    char sex;
} S1,S2;//结构体变量

//特殊的结构体声明
struct                //匿名的结构体声明,但是只能定义一次,当然里面的成员变量不一定,也可以定义多个匿名结构体。
{
    char name[20];
}

1.2结构体的自引用

//代码1
struct Node
{
 int data;
 struct Node next;
};
//可行否?
如果可以,那sizeof(struct Node)是多少?
这是错误的引用方式

//代码2 正确的引用是用地址
struct Node
{
 int data;
 struct Node* next;
};

//代码3
typedef struct
{
 int data;
 Node* next;
}Node;
//这样写代码,可行否?->先有蛋先有鸡的问题,还没重命名就使用上了,不行
//解决方案:
typedef struct Node
{
 int data;
 struct Node* next;
}Node,*pnode;

1.3结构体定义和初始化

struct Point
{
 int x;
 int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu        //类型声明
{
 char name[15];//名字
 int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
 int data;
 struct Point p;
 struct Node* next; 
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

1.4结构体内存对齐

为什么结构在内存中存储不是和成员变量的大小之和一致,而且成员变量顺序改变后的大小也会发生改变,这是为什么?

  • 偏移量就是和起始地址相隔几个字节。

考点如何计算?

1.4.1首先掌握内存对齐的计算规则

  1. 第一个成员在与结构体变量偏移量为0的地址处,起始位置也是对齐的
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
    对齐数 = 编译器默认的一个对齐数 与 该成员变量大小的较小值。

    • VS中默认的值为8
    • Linux中没有默认对齐数,对齐数就是成员自身的大小
  3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
    体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

    (意思就是计算结构体大小时,结构体里面可能也有一个结构体,个结构体在对齐时是算自己本身的最大对齐数而不是包含它的结构体的对齐数,然后整个结构体最后对齐时,除了这个结构体的最大对齐数,还要看嵌套的这个结构体的最大对齐数,取最大值对齐。)

offsetof-宏,计算结构体成员相对起始位置的偏移量。

size_t offsetof( structName, memberName );
//offsetof例子
//<stddef.h>
struct Stu
{
    char name;
    int age;
}
printf("%u",offsetof(struct Stu,name));
printf("%u",offsetof(struct Stu,age));

1.4.2为什么存在内存对齐?

大部分参考资料如是说:

  1. 平台原因移植原因:

不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

  1. 性能原因:

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。

原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。32位机器一次可以访问4个字节,未对齐可能要访问两次,对齐就一次。

总体来说:

结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:

让占用空间小的成员尽量集中在一起。

//例如:
struct S1
{
 char c1;
 int i;
 char c2;
};
struct S2
{
 char c1;
 char c2;
 int i;
};
//S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。

1.5修改默认对齐数

#pragma pack(4)//修改编译器默认对齐数为4
#pragma pack()//取消修改恢复默认
#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
    //输出的结果是什么?
    printf("%d\n", sizeof(struct S1));//12 默认是8,int对齐数是4,char对齐数是1,c1占一字节,后面空三字节,接着4字节,最后补一字节,一共九个字节,差3字节补成4的倍数12
    printf("%d\n", sizeof(struct S2));//6,就是加在一起
    return 0;
}

//结论
//在对齐方式不合适的时候,我们可以自己更改默认对齐数。

1.6结构体传参

函数在传参的时候,形式参数是需要压栈的,所以系统会在空间和实践上有开销。

如果结构传参时,结构体的太大,参数压栈的时候系统开销过大,就会性能下降。

结论:

结构体传参的时候穿结构体的地址。

二、位段

2.1什么是位段

位段的声明和结构是类似的,有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int ,char(整型家族)

2.位段的成员名后边有一个冒号和一个数字。

对齐是为了节省时间牺牲空间,位段是为了节省空间牺牲时间。

有条件的话可以使用位段节省空间,前提知道它的比特位需要几个。

//位段例子
struct A
{
 int _a:2;
 int _b:5;
 int _c:10;
 int _d:30;
};
//这个位段的大小是:8字节,但是没有位段纯对齐是16字节。


//这里的内存分配是前面先开辟了4个字节,2+5+10一共用了17个比特位,还剩下15个比特位给d不够用,所这里重新开辟了4个字节给d用,一共是8个字节。
//剩下的15个字节用不用,取决于编译器,vs下和gcc可能不一样,c语言标准并没有规定,所以不跨平台。

2.2位段的内存分配

1、整型家族可以使用位段-int、unsigned int、signed int、char。

2、位段的空间按照1个字节或者4个字节开辟。

3、位段涉及很多不确定因素 ,如下,它是不跨平台的,注重可移植的程序应当避免使用位段。

00000000,从高地址开始还是低地址开始,C语言也没有规定;开辟了一个空间后下一个变量不够用,是否开新的空间,c语言也没有规定,由编译器决定,所以还是位段不跨平台。

//一个例子
struct S
{
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?
//从低位到高位(右边到左边),开辟空间不够,直接开辟使用下个空间 
//00000000 00000000 00000000 初始化,开辟了三个字节
//a:1010 b:1100 c:11 d:100
//按照位段的比特位数放入开辟的空间
//0 1100 010 - 000 00011 - 0000 0100
//0110 0010 - 0000 0011 - 0000 0100
//按照十六进制放的是
//62 03 04

2.3位段的跨平台问题

  1. int 位段被当成有符号数还是无符号数是不确定的。
  2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机

器会出问题。(:后面的数字 如果超过16,在16位机器下就用不了。)

  1. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。大小端是字节序,这个是比特位从右往左还是从左往右的问题,不一样。
  2. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是

舍弃剩余的位还是利用,这是不确定的。

总结:

跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

2.4位段的应用

在网络协议栈中,传输的数据就需要用到位段,发送的数据会封装起来,每一部分都是不同的信息。

如果没有位段,这里的每一部分的信息都是一个int/char之类的,会很大,位段可以节省空间,这个数据包的分配是很合理的,每一大段都是一个int型大小。

image-20231007005433848.png

三、枚举

枚举的存在就是为了一一列举,比如月份,星期,性别,都可以一一列举

1.1枚举的定义

enum Day//星期    //enum Day , enum Sex , enum Color 都是枚举类型。
{
 Mon,
 Tues,
 Wed,
 Thur,
 Fri,
 Sat,
 Sun
};
enum Sex//性别       //{}中的内容是枚举类型的可能取值,也叫 枚举常量
{
 MALE,
 FEMALE,
 SECRET
};
enum Color//颜色  //这些可能取值都是有值的,默认从0开始,依次递增1,当然在声明枚举类型的时候也可以赋初值;
{                    //赋初值后自己会往下加1;
 RED=1,                //这是常量,所以赋初值不是赋值,它是初始化。
 GREEN=2,
 BLUE=3    
};

emum Clolr = RED;//直接拿枚举常量给枚举变量赋值,才不会类型差异。
Color = 5;        //5是int型,容易出现问题,当然c里面还是可以用,c++不行。

1.2为什么使用枚举?(优点)

我们可以使用 #define 定义常量,为什么非要使用枚举?

枚举的优点:

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
  3. 便于调试

test.c 预编译->编译->汇编->链接-> test.exe(这个时候调试的是预编译后的代码,此时完成了define 的替换,不便于观察)

所以在c/c++中定义常量是多考虑枚举,#define不是一个理想的方法。

  1. 使用方便,一次可以定义多个常量

四、联合(共用体)

联合体的成员共用一片内存空间,改一个成员的值,全部成员的值都会变,所以一般就用一个成员,其他不用,节省空间。

联合体的大小至少是最大成员的大小。

联合体就像结构体,可以用->和匿名联合体,也可以用 . 来引用。

//1.联合类型的声明
union Un
{
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));//4


//2.特点
union Un
{
 int i;
 char c;
};
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);


//3.联合体大小的计算:
//当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
    union Un1
{
 char c[5];
 int i;
};
union Un2
{
 short c[7];//2 - 8 ->2
 int i;        //4 - 8 ->4
};            //最大对齐数4
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));//8    占5.差3,最大成员对齐到8
printf("%d\n", sizeof(union Un2));//16 占14,差2,最大成员要对齐到最大16

Hhh_灏
24 声望3 粉丝