C语言内存字节对齐规则20180718

合集下载

C语言的字节对齐及#pragmapack的使用

C语言的字节对齐及#pragmapack的使用

C语言的字节对齐及#pragmapack的使用C编译器的缺省字节对齐方式(自然对界)在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。

在结构中,编译器为结构的每个成员按其自然对界(alignment)条件分配空间。

各个成员按照它们被声明的顺序在内存中顺序存储(成员之间可能有插入的空字节),第一个成员的地址和整个结构的地址相同。

C编译器缺省的结构成员自然对界条件为“N字节对齐”,N即该成员数据类型的长度。

如int型成员的自然对界条件为4字节对齐,而double类型的结构成员的自然对界条件为8字节对齐。

若该成员的起始偏移不位于该成员的“默认自然对界条件”上,则在前一个节面后面添加适当个数的空字节。

C编译器缺省的结构整体的自然对界条件为:该结构所有成员中要求的最大自然对界条件。

若结构体各成员长度之和不为“结构整体自然对界条件的整数倍,则在最后一个成员后填充空字节。

例子1(分析结构各成员的默认字节对界条界条件和结构整体的默认字节对界条件):struct Test{char x1; // 成员x1为char型(其起始地址必须1字节对界),其偏移地址为0char x2; // 成员x2为char型(其起始地址必须1字节对界,其偏移地址为1float x3; // 成员x3为float型(其起始地址必须4字节对界),编译器在x2和x3之间填充了两个空字节,其偏移地址为4char x4; // 成员x4为char型(其起始地址必须1字节对界),其偏移地址为8};因为T est结构体中,最大的成员为flaot x3,因些此结构体的自然对界条件为4字节对齐。

则结构体长度就为12字节,内存布局为1100 1111 1000。

例子2:#include <stdio.h>//#pragma pack(2)typedef struct{int aa1; //4个字节对齐 1111char bb1;//1个字节对齐 1short cc1;//2个字节对齐 011char dd1; //1个字节对齐 1} testlength1;int length1 = sizeof(testlength1); //4个字节对齐,占用字节1111 1011 1000,length = 12typedef struct{char bb2;//1个字节对齐 1int aa2; //4个字节对齐 01111short cc2;//2个字节对齐 11char dd2; //1个字节对齐 1} testlength2;int length2 = sizeof(testlength2); //4个字节对齐,占用字节1011 1111 1000,length = 12typedef struct{char bb3; //1个字节对齐 1char dd3; //1个字节对齐 1int aa3; //4个字节对齐 001111short cc23//2个字节对齐 11} testlength3;int length3 = sizeof(testlength3); //4个字节对齐,占用字节1100 1111 1100,length = 12typedef struct{char bb4; //1个字节对齐 1char dd4; //1个字节对齐 1short cc4;//2个字节对齐 11int aa4; //4个字节对齐 1111} testlength4;int length4 = sizeof(testlength4); //4个字节对齐,占用字节1111 1111,length = 8int main(void){printf("length1 = %d.\n",length1);printf("length2 = %d.\n",length2);printf("length3 = %d.\n",length3);printf("length4 = %d.\n",length4);return0;}改变缺省的对界条件(指定对界)· 使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。

字节对齐原则

字节对齐原则

字节对齐原则这个问题也是困扰了我很久的⼀个问题:为了加快数据存取的速度,编译器默认情况下会对结构体成员和结构体本⾝存储位置进⾏处理,使其存放的起始地址是⼀定字节数的倍数,⽽不是顺序存放,称为字节对齐.设对齐字节数为n(n = 1,2,4,8,16),每个成员内存长度为Li,Max(Li)为最⼤的成员内存长度,字节对齐规则是:1. 结构体对象的起始地址能够被Max(Li)所整除;2. 结构体中每个成员相对于起始地址的偏移量,即对齐值应是min(n,Li)的倍数.若不满⾜对齐值的要求,编译器会在成员之间填充若⼲个字节;3. 结构体的总长度值应是min(n,Max)(Li)的倍数,若不满⾜总长度值的要求,编译器在为最后⼀个成员分配空间后,会在其后填充若⼲个字节. (VC默认的对齐字节数n=8)开不懂,请看下⾯例⼦:#include <iostream>using namespace std;// 1加1+编译器补充的2个再加上int 的4个(编译器⾃动加的)typedef struct node1 // 1+1+(2)+4 = 8{char c1;char c2;int a;}str1 ;typedef struct str2 // 1+(3)+4+1+(3) = 12{char c1;int a;char c2;}str2 ;typedef struct str3 // 5+(3)+4+2+(2) = 16{char c1[5];int b;short c;}str3 ;typedef struct str4 // 5+(1)+(2)+4 = 12{char c1[5];short c;int b;}str4 ;typedef struct str5 // 1+1+(6)+8 = 16{char c1;char c2;double a;}str5 ;typedef struct str6 // 1+(7)+8+1+(7) = 24{char c1;double a;char c2;}str6 ;typedef struct str7{char c1;str1 s; // 相当于吧str1的结构放在这 char,char,intdouble b;}str7 ; // 1+1+1+(1)+4+4 = 12int main(){str1 s1;str2 s2;str3 s3;str4 s4;str5 s5;str5 s6;str7 s7;str8 s8;cout << "s1 = " << sizeof(s1)<<endl;cout << "s2 = " << sizeof(s2)<<endl; cout << "s3 = " << sizeof(s3)<<endl; cout << "s4 = " << sizeof(s4)<<endl; cout << "s5 = " << sizeof(s5)<<endl; cout << "s6 = " << sizeof(s6)<<endl; cout << "s7 = " << sizeof(s7)<<endl; cout << "s8 = " << sizeof(s8)<<endl; return0;}图解:str1str2:str3:str4:str5:str6:。

c语言字节对齐原理

c语言字节对齐原理

c语言字节对齐原理C语言中的字节对齐原理是指在内存中分配变量存储空间时,为了提高访问效率和内存利用率,系统会按照一定的规则进行对齐操作。

字节对齐原理在C语言中非常重要,对于程序的正确性和性能都有着重要的影响。

字节对齐的原理是为了优化内存访问速度和空间利用率,避免因为不对齐而导致的性能降低。

在C语言中,变量的存储空间是以字节为单位进行分配的,而不同的数据类型在内存中所占的字节数是不同的。

字节对齐的目的是为了确保不同类型的变量在内存中的起始地址是对齐的,这样可以提高访问效率。

C语言中的字节对齐规则是由编译器来决定的,不同的编译器可能有不同的对齐规则。

一般来说,编译器会按照变量的自然对齐大小进行对齐。

自然对齐是指变量所占的字节数,例如char类型的变量自然对齐为1字节,int类型的变量自然对齐为4字节。

在进行字节对齐时,编译器会在变量之间插入一些空白字节,使得变量的起始地址能够满足对齐要求。

这样一来,虽然会浪费一些空间,但可以提高内存的访问效率。

例如,如果int类型的变量要求按4字节对齐,而其起始地址为0x1000,那么在其后紧接着的变量的起始地址就必须是0x1004,即起始地址必须是4的倍数。

字节对齐的规则并不是固定的,它受到编译器的影响。

有些编译器的默认对齐规则可能是按照变量的自然对齐大小来对齐的,而有些编译器可能会有一些特殊的对齐规则。

此外,开发人员也可以通过编译器提供的指令来手动控制字节对齐的方式。

字节对齐的原理和规则虽然复杂,但它对于程序的正确性和性能优化至关重要。

如果变量没有按照正确的对齐方式进行存储,可能会导致内存访问错误,甚至引发程序崩溃。

而且,字节对齐也会影响程序的性能,如果变量没有按照对齐要求进行存储,可能会导致内存访问速度变慢,从而影响程序的执行效率。

为了正确地使用字节对齐,开发人员需要了解编译器的对齐规则,并且在编写代码时遵循这些规则。

在一些特殊情况下,开发人员也可以使用编译器提供的指令来手动控制字节对齐的方式,以满足特定的需求。

c语言结构体中的数组字节对齐

c语言结构体中的数组字节对齐

C语言结构体中的数组字节对齐在C语言中,结构体是一种用户自定义的数据类型,用于将不同类型的数据组合在一起。

结构体中常常包含多个成员变量,其中可能有数组类型的成员变量。

在结构体中使用数组时,需要了解数组字节对齐的概念和规则,以确保内存的最佳利用和访问的效率。

什么是字节对齐字节对齐是指在将数据存储在计算机内存中时,按照特定规则进行调整,以确保数据的存储和访问的效率。

字节对齐的规则可以对齐数据的起始地址或者数据的长度。

计算机中的数据存储是按照字节(Byte)来划分的,一个字节通常由8个二进制位组成。

字节对齐的主要目的是为了节省内存和提高访问效率。

在C语言中,结构体中的成员变量通常按照字节对齐的规则来排列。

C语言结构体中的数组字节对齐规则在C语言中,结构体中的数组字节对齐规则通常遵循以下原则:1.结构体的起始地址必须是所有成员变量所要求对齐方式的最小公倍数。

2.结构体中的每个成员变量的地址必须是它本身的大小的整数倍。

3.结构体的总大小必须是其最大成员变量大小的整数倍。

根据字节对齐规则,如果结构体中的成员变量的累计大小不是字节对齐的倍数,编译器会在成员变量之间添加填充字节,以满足对齐要求。

这些填充字节在结构体的占用空间中不可访问。

填充字节的目的是将后续成员变量的地址对齐,以提高内存访问效率。

数组字节对齐的示例为了更好地理解数组字节对齐的规则,我们来看一个示例。

#include <stdio.h>struct MyStruct {char c;int i;char arr[3];};int main() {struct MyStruct s;printf("sizeof(MyStruct) = %lu\n", sizeof(struct MyStruct));printf("sizeof(s.c) = %lu\n", sizeof(s.c));printf("sizeof(s.i) = %lu\n", sizeof(s.i));printf("sizeof(s.arr) = %lu\n", sizeof(s.arr));return 0;}输出结果:sizeof(MyStruct) = 12sizeof(s.c) = 1sizeof(s.i) = 4sizeof(s.arr) = 3在这个示例中,我们定义了一个包含一个字符类型变量、一个整型变量和一个长度为3的字符数组的结构体MyStruct。

C语言字节对齐

C语言字节对齐

C语言字节对齐字节对齐的由来程序在运行时会将数据临时存放在内存中,芯片内核需要对这些数据进行计算,不断的读取内存以获得数据,并将计算结果写入内存。

计算机体系经过若干年的发展,最终确定了以8bits作为其基本的存储单元——byte(字节),这是每个地址所对应的最小访问单元,在C语言中对应一个char型的变量。

下图为芯片内核访问内存的示意图。

芯片内核通过控制总线控制内存的动作,通过地址总线告知内存地址,数据总线上出现交互的数据。

图1访问内存示意图假设上图是8位机的示意图,那么数据总线的宽度是8bits,由8根数据线组成,这样芯片内核与内存之间一次就可以同时交换8个bits的数据,正好是一个字节。

图中右侧的每个小格子代表一个存储地址,对应一个字节。

下面通过一段C语言代码来具体看看芯片内核与内存之间的数据交互过程。

char data[2];data[0]=2;data[1]=data[0]+1;第一行代码定义了2个字节的数组data。

假设data数组被编译到地址0x100,那么data[0]这个字节就被存储在地址为0x100的内存空间,data[1]这个字节就被存储在地址为0x101的内存空间。

第二行对应的硬件动作是将数据2存入到data[0]中,也就是将数据2存入到内存中的0x100地址,执行这条语句时,芯片内核对控制总线、地址总线和数据总线进行操作,控制总线上出现写信号,地址总线上出现数据0x100,数据总线上出现数据0x02。

此时内存就知道需要将数据2写入到地址0x100中,完成一次写操作。

第三行先读出data[0]中的数据,芯片内核将控制总线置为读信号,将地址总线置为0x100,此时,内存就会从其内部取出0x100地址中的数据,也就是数据2,2将出现在数据总线上,此时芯片内核就会通过数据总线读取到data[0]中的数据了。

接下来芯片内核计算2+1=3,需要将数字3写入到data[1]中,芯片内核将控制总线置为写信号,将地址总线置为0x101,将数据总线置为3,内存接收到这些信号后,就会将数据3存入到其内部0x101地址中,完成本次操作。

c语言结构体内存对齐规则

c语言结构体内存对齐规则

c语言结构体内存对齐规则C语言结构体内存对齐规则一、引言在C语言中,结构体是一种用户自定义的数据类型,它可以包含不同类型的数据成员,这些数据成员按照一定的内存对齐规则在内存中排列。

本文将介绍C语言结构体内存对齐的规则和原因,以及如何通过调整结构体成员的顺序和插入填充成员来优化内存使用效率。

二、内存对齐的原因内存对齐是为了提高程序的运行效率和节省内存空间。

当结构体成员按照自然对齐的方式排列时,访问这些成员的速度更快。

此外,内存对齐还可以避免由于数据成员在内存中的存放位置不一致而导致的访问错误。

三、内存对齐的规则1. 基本对齐规则:结构体成员的起始地址必须是该成员大小的整数倍。

例如,一个4字节大小的成员必须从4字节对齐的地址开始。

2. 数据成员的对齐规则:C语言中的基本数据类型在内存中的对齐要求如下:- char类型的对齐要求为1字节;- short类型的对齐要求为2字节;- int类型的对齐要求为4字节;- long类型的对齐要求为8字节;- float类型的对齐要求为4字节;- double类型的对齐要求为8字节;- 指针类型的对齐要求为4字节或8字节,取决于系统的位数。

3. 结构体成员的对齐规则:结构体成员的对齐要求为其自身大小和当前对齐基数中较小的那个。

对齐基数是指前面所有成员中最大的对齐要求。

例如,如果前面的成员中最大的对齐要求为4字节,而当前成员的大小为2字节,则当前成员的对齐要求为2字节。

4. 结构体的总大小:结构体的总大小是所有成员大小之和,但是要满足对齐规则,可能需要插入一些填充成员。

填充成员的大小取决于对齐基数和当前成员的对齐要求之间的差距。

四、内存对齐的例子假设有如下结构体定义:```struct example {char c;int i;short s;};```根据内存对齐的规则,该结构体的对齐基数为4字节(int类型的对齐要求),因此,结构体的总大小应为12字节。

在内存中的排列方式如下:```| c |填充| i | s |```其中,c占用1字节,i占用4字节,s占用2字节。

【C语言】字节对齐(内存对齐)

【C语言】字节对齐(内存对齐)

【C语⾔】字节对齐(内存对齐)数据对齐1)平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常2)硬件原因:经过内存对齐之后,CPU的内存访问速度⼤⼤提升。

1. 对齐原则:【原则1】数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第⼀个数据成员放在offset为0的地⽅,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员⾃⾝长度中,⽐较⼩的那个进⾏。

【原则2】结构(或联合)的整体对齐规则:在数据成员完成各⾃对齐之后,结构(或联合)本⾝也要进⾏对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最⼤数据成员长度中,⽐较⼩的那个进⾏。

【原则3】结构体作为成员:如果⼀个结构⾥有某些结构体成员,则结构体成员要从其内部最⼤元素⼤⼩的整数倍地址开始存储。

备注:数组成员按长度按数组类型长度计算,如char t[9],在第1步中数据⾃⾝长度按1算,累加结构体时长度为9;第2步中,找最⼤数据长度时,如果结构体T有复杂类型成员A,该A成员的长度为该复杂类型成员A的最⼤成员长度。

⼩结:当#pragma pack的n值等于或超过所有数据成员长度的时候,这个n值的⼤⼩将不产⽣任何效果。

【注意】(对齐位数跟处理器位数和编译器都有关)VS, VC等编译器默认是#pragma pack(8),所以测试我们的规则会正常;注意gcc默认是#pragma pack(4),并且gcc只⽀持1,2,4对齐。

套⽤三原则⾥计算的对齐值是不能⼤于#pragma pack指定的n值。

2. ⾃然对齐:存放变量的地址要是该变量数据类型⼤⼩的整数倍。

如:存放int型数据的地址⼀定要是4的倍数,存放short型数据的地址⼀定要是2的倍数。

3. 改变缺省的对界条件(指定对界):使⽤伪指令#pragma pack (n),C编译器将按照n个字节对齐。

c结构体字节对齐规则

c结构体字节对齐规则

c结构体字节对齐规则在C语言中,结构体是一种自定义数据类型,用于组合不同类型的变量。

结构体的内存布局是由字节对齐规则决定的。

字节对齐是为了优化内存访问效率和提高程序性能而设计的。

本文将详细介绍C结构体的字节对齐规则。

字节对齐是指结构体中各个成员变量在内存中的对齐方式。

由于硬件和操作系统的不同,字节对齐的规则也可能有所差异。

C语言的标准并没有规定具体的字节对齐规则,而是由编译器来自行决定。

在不同的编译器中,字节对齐规则可能有所不同。

C结构体的字节对齐规则遵循以下原则:1. 自然对齐:结构体的起始地址必须是其成员变量中字节对齐要求的整数倍。

例如,对齐要求为4字节的成员变量必须从4的倍数地址开始。

2. 最大对齐原则:结构体的字节对齐要求取决于其成员变量中对齐要求最高的成员。

对齐要求高的成员变量的起始地址必须是其对齐要求的整数倍。

3. 结构体对齐:结构体本身也要进行字节对齐,其对齐要求取决于结构体中最大对齐要求的成员变量。

4. 成员变量顺序:结构体中的成员变量按照定义的顺序排列。

如果中间存在对齐填充的空间,则会在成员变量之间插入。

下面以一个例子来说明C结构体字节对齐规则:```cstruct Example {char a;int b;char c;};```在这个例子中,结构体`Example`中包含三个成员变量:`a`、`b`和`c`。

`a`和`c`的类型为`char`,`b`的类型为`int`。

在大多数编译器中,`char`类型的对齐要求为1字节,`int`类型的对齐要求为4字节(根据具体的编译器和操作系统可能有所不同)。

根据最大对齐原则,结构体`Example`的对齐要求为4字节,因为`b`的对齐要求最高。

因此,`a`的起始地址为0,`b`的起始地址为4,`c`的起始地址为8。

`a`和`c`之间会插入两个字节的对齐填充。

根据以上规则,结构体的大小为12字节(4字节对齐)。

可以通过`sizeof`运算符来验证结构体的大小:```cprintf("Size of struct Example: %zu\n", sizeof(struct Example));```输出结果应为12。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

C语言内存字节对齐规则
在C语言面试和考试中经常会遇到内存字节对齐的问题。

今天就来对字节对齐的知识进行小结一下。

首先说说为什么要对齐。

为了提高效率,计算机从内存中取数据是按照一个固定长度的。

以32位机为例,它每次取32个位,也就是4个字节(每字节8个位,计算机基础知识,别说不知道)。

字节对齐有什么好处?以int型数据为例,如果它在内存中存放的位置按4字节对齐,也就是说1个int的数据全部落在计算机一次取数的区间内,那么只需要取一次就可以了。

如图a-1。

如果不对齐,很不巧,这个int数据刚好跨越了取数的边界,这样就需要取两次才能把这个int的数据全部取到,这样效率也就降低了。

图:a-1
图:a-2
内存对齐是会浪费一些空间的。

但是这种空间上得浪费却可以减少取数的时间。

这是典型的一种以空间换时间的做法。

空间与时间孰优孰略这个每个人都有自己的看法,但是C 语言既然采取了这种以空间换时间的策略,就必然有它的道理。

况且,在存储器越来越便宜的今天,这一点点的空间上的浪费就不算什么了。

需要说明的是,字节对齐不同的编译器可能会采用不同的优化策略,以下以GCC为例讲解结构体的对齐.
一、原则:
1.结构体内成员按自身按自身长度自对齐。

自身长度,如char=1,short=2,int=4,double=8,。

所谓自对齐,指的是该成员的起始位置的内存地址必须是它自身长度的整数倍。

如int只能以0,4,8这类的地址开始
2.结构体的总大小为结构体的有效对齐值的整数倍
结构体的有效对齐值的确定:
1)当未明确指定时,以结构体中最长的成员的长度为其有效值
2)当用#pragma pack(n)指定时,以n和结构体中最长的成员的长度中较小者为其值。

3)当用__attribute__ ((__packed__))指定长度时,强制按照此值为结构体的有效对齐值
二、例子
1)
struct AA{ //结构体的有效对齐值为其中最大的成员即int的长度4
char a;
int b;
char c;
}aa
结果,sizeof(aa)=12
何解?首先假设结构体内存起始地址为0,那么地址的分布如下
0 a
1
2
3
4 b
5 b
6 b
7 b
8 c
9
10
11
char的字对齐长度为1,所以可以在任何地址开始,但是,int自对齐长度为4,必须以4的倍数地址开始。

所以,尽管1-3空着,但b也只能从4开始。

再加上c后,整个结构体的总长度为9,结构体的有效对齐值为其中最大的成员即int的长度4,所以,结构体的大小向上扩展到12,即9-11的地址空着。

2) //结构体的有效对齐值为其中最大的成员即int的长度4
struct AA{
char a;
char c;
int b;
}aa
sizeof(aa)=8,为什么呢
0 a
1 c
2
3
4 b
5 b
6 b
7 b
因为c为char类型,字对齐长度为1,所以可以有效的利用1-3间的空格。

看见了吧,变量定义的位置的不同时有可能影响结构体的大小的哦!
3)
#pragma pack(2) //结构体的有效对齐长度在pack指定的2和int的4中取较小的值2
struct AA{
char a;
int b;
char c;
}aa
sizeof(aa)=10,
为什么呢?a到c只占9字节长度,因为结构体的有效对齐长度在pack指定的2和int 的4中取较小的值2。

故取2的倍数10。

如果当pack指定为8呢?那就仍然按4来对齐,结果仍然是12。

4)
struct AA{
char a;
int b;
char c;
}__attribute__((__8__))aa
8对齐,故取8的倍数16.
如果其指定2,则结果为10
如果pragma pack和__attribute__ 同时指定呢?以__attribute__ 的为准。

需要说明的是,不管pragma pack和__attribute__如何指定,结构体内部成员的自对齐仍然按照其自身的对齐值。

另外,不同的编译器可能会对内存的分布进行优化,
例如有些编译器会把立体1中的程序优化成例题2的样子。

但这属于编译器的问题,
这里不做详细讨论。

如果要作为编程的参考的话,最好当做编译器不会做优化,尽量在保持代码清晰的情况下,自己手动将例题1优化成例题2的样子。

如果是做题的话,按照以上原则做就可以了,不用考虑不同编译器的特性。

相关文档
最新文档