sizeof的用法
全面解析sizeof的用法
以下代码使用平台是Windows7 64bits+VS2012。
sizeof是C/C++中的一个操作符(operator),其作用就是返回一个对象或者类型所占的内存字节数,使用频繁,有必须对齐有个全面的了解。
1.Sizeof的基本语法
sizeof有三种语法形式,如下:
(1)sizeof( object ); // sizeof( 对象);
(2)sizeof( type_name ); // sizeof( 类型);
(3)sizeof object; // sizeof 对象;
第三种语法结构虽然正确,为简单统一,均使用一、二中写法。
例如:
int i;
sizeof( i ); // ok
sizeof i; // ok
sizeof( int ); // ok
sizeof int; // error
2.sizeof计算基本类型与表示式
sizeof计算对象的大小也是转换成对对象类型的计算,也就是说,同种类型的不同对象其sizeof值都是一致的。这里,对象可以进一步延伸至表达式,即sizeof可以对一个表达式求值,编译器根据表达式的最终结果类型来确定大小,sizeof是编译时进行运算,与运行时无关,不会对表达式进行计算。
考察如下代码:
#include
using namespace std;
int main(int argc,char* argv[])
{
cout<<"sizeof(char)="< cout<<"sizeof(short)="< cout<<"sizeof(int)="< cout<<"sizeof(long)="< cout<<"sizeof(long long)="< cout<<"sizeof(float)="< cout<<"sizeof(double)="< int i=8; cout<<"i="< cout<<"sizeof(i)="< cout<<"sizeof(i)="< cout<<"i="< } 在64bits的Windows下运行结果是 sizeof(char)=1 sizeof(short)=2 sizeof(int)=4 sizeof(long)=4 sizeof(long long)=4 sizeof(float)=4 sizeof(double)=8 i=8 sizeof(i)=4 sizeof(i)=4 i=8 注意两点, 第一:i的值并未发生改变,表明sizeof括号内的表达式并没有执行,sizeof在编译时求其表达式的运算结果的类型,sizeof运算与运行时无关。sizeof(i)等价于sizeof(int),sizeof(i=5)等价于sizeof(int),也就是说在可执行代码中,并不包含i=5这个表达式,它早在编译阶段就被处理了。 第二:long int是否占8字节,与编译器的实现有关,Visual C++在VS2012中使用的编译器是cl.exe,在64bits的Windows下仍然将long编译为4字节,要想使用8字节长整型,保险起见,使用long long型。 3.sizeof计算结构体 sizeof作用于基本数据类型,在特定的平台和特定的编译中,结果是确定的,如果使用sizeof 计算结构体的大小,情况稍微复杂一下。考察如下程序 struct S1 { char c; int i; }; cout<<”sizeof(S1)=”< sizeof(S1)结果是8,并不是想象中的sizeof(char)+sizeof(int)=5。这是因为结构体或者类成员变量具有不同类型时,需要进程成员变量的对齐,计算机组成原理中说明,对齐的目的是减少访存指令周期,提高CPU存储速度。 3.1内存对齐的原则 1) 结构体变量的首地址能够被其最宽基本类型成员的大小所整除; 2) 结构体每个成员相对于结构体首地址的偏移量都是成员大小的整数倍,如有需要编译器会在成员之间加上填充字节; 3) 结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节。 有了以上三个内存对齐的原则,就可以轻松应对嵌套结构体类型的内存对齐。如下:struct S2 { char c1; S1 s; char c2 }; 在寻找S2的最宽基本数据类型时,包括其嵌套的结构体中的成员,从S1中寻找出最宽结构体数据类型是int,因此S2的最宽数据类型是int。S1 s在结构体S2中的对齐也是按前面三个准则进行,因此sizeof(S2)=sizeof(char)+pad(3)+sizeof(S1)+1+pad(3)=1+3+8+1+3=16字节,其中pad(3)表示填充3个字节。 结构体某个成员相对于结构体首地址的偏移量可以通过宏offsetof()来获得,这个宏也在stddef.h中定义,如下: #define offsetof(s,m) (size_t)&(((s *)0)->m) 例如,想要获得S2中c的偏移量,方法为 size_t pos = offsetof(S2, c); // pos等于4 3.2预处理编译器指导指令#pragma pack #pragma pack( n ),n为字节对齐数,其取值为1、2、4、8、16,默认是8,表明最宽数据类型不超过8。如果这个值比结构体成员的sizeof值小,那么该成员的偏移量应该以此值为准,即是说,结构体成员的偏移量应该取二者的最小值,公式如下: offsetof( item ) = min( n, sizeof( item ) )。 考察如下代码: #pragma pack(push) // 将当前pack设置压栈保存 #pragma pack(2) // 必须在结构体定义之前使用 struct S1 { char c; int i; }; struct S2 { char c1; S1 s; char c2 }; #pragma pack(pop) // 恢复先前的pack设置 因此,sizeof(S2)=sizeof(char)+pad(1)+sizeof(S1)+1+pad(1)=1+1+6+1=10字节。 3.3空结构体 C/C++中不允许长度为0的数据类型存在。对于“空结构体”(不含数据成员)的大小不为0,而是1。“空结构体”变量也得被存储,这样编译器也就只能为其分配一个字节的空间用于占位了。如下: struct S3 { }; sizeof( S3 ); // 结果为1 3.4 位域结构体 有些信息在存储时,并不需要占用一个完整的字节,而只需占几个或一个二进制位。例如在存放一个开关量时,只有0和1 两种状态,用一位二进位即可。为了节省存储空间, 并使处理简便,C语言又提供了一种数据结构,称为"位域"或"位段"。以位域变量成员变量结构体的叫做位域结构体。 位域结构体的定义形式: struct 位域结构名 { 位域列表}; 位域列表的形式为:类型说明符位域名:位域长度。 使用位域的主要目的是压缩存储,其大致规则为: (1) 如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止; (2) 如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍; (3) 如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式,Dev-C++采取压缩方式; (4) 如果位域字段之间穿插着非位域字段,则不进行压缩; (5) 整个结构体的总大小为最宽基本类型成员大小的整数倍。 (6)位域可以无位域名,这时它只用来作填充或调整位置。无名的位域是不能使用的。例如: struct k { int a:1 int :2 //该2位不能使用 int b:3 int c:2 }; 考察如下代码: struct BFS1 { char f1 : 3; char f2 : 4; char f3 : 5; }; struct BFS2 { char f1 : 3; int i : 4; char f2 : 5; }; struct BFS3 { char f1 : 3; char f2; char f3 : 5; }; 考察以上代码,得出: (1)sizeof(BFS1)==2。当相邻位域类型不同,在VS中其sizeof(BFS2)=1+4+1+pad(2)=8,位域变量i的偏移量无需是4的倍数,紧随f1的后一字节存储,但位域结构体BFS2的总 大小必须是sizeof(int)的整数倍。在Dev-C++中为sizeof(BFS2)=2,相邻的位域字段的类型不同时,采取了压缩存储。 (2)sizeof(BFS3)==3,当非位域字段穿插在其中,不会产生压缩,在VS和Dev-C++中得到的大小均为3。 4. sizeof计算联合体 结构体在内存组织上是顺序式的,联合体则是重叠式,各成员共享一段内存,所以整个联合体的sizeof也就是每个成员sizeof的最大值。结构体的成员也可以是构造类型,这里,构造类型成员是被作为整体考虑的。 所以,下面例子中,U的sizeof值等于sizeof(s)。 union U { int i; char c; S1 s; }; 5. sizeof计算类 考察如下代码: #include using namespace std; class Small{}; class class LessFunc{ int num; void func1(){}; }; class MoreFunc{ int num; void func1(){}; int func2(){return 1;}; }; class NeedAlign{ char c; double d; int i; }; class Virtual{ int num; virtual void func(){}; }; int main(int argc,char* argv[]) { cout< cout< cout< cout< cout< } 注意一点,C++中类同结构体没有本质的区别,结构体同样可以包含成员函数,构造函数,析构函数,虚函数和继承,但一般不这么使用,沿用了C的结构体使用习惯。类与结构体唯一的区别就是结构体的成员的默认权限是public,而类是private。 基于以上这点,再考察从程序的输出结果,得出如下结论: (1)类同结构体一样,C++中不允许长度为0的数据类型存在,虽然类无任何成员,但该类的对象仍然占用1个字节。 (2)类的成员函数并不影响类对象占用的空间,类对象的大小是由它数据成员决定的。(3)类和结构体一样,同样需要对齐,具体对齐的规则见上文结构体的内存对齐。 (4)类如果包含虚函数,编译器会在类对象中插入一个指向虚函数表的指针,以帮助实现虚函数的动态调用。所以,该类的对象的大小至少比不包含虚函数时多4个字节。如果考虑内存对齐,可能还要多些。如果使用数据成员之间的对齐,当类对象至少包含一个数据成员,且拥有虚函数,那么该对象的大小至少是8B,读者可自行推导。 6. sizeof计算指针变量 指针是C、C++的灵魂,它记录了另一个对象的地址。既然是来存放地址的,那么它当然等于计算机内部地址总线的宽度。所以在32位计算机中,一个指针变量的返回值必定是4(以字节为单位),可以推导,在将来的64位系统中指针变量的sizeof结果为8。 char* pc = "abc"; int* pi=new int[10]; string* ps; char** ppc = &pc; void (*pf)(); // 函数指针 char testfunc(){ return …k?; } sizeof( pc ); // 结果为4 sizeof( pi ); // 结果为4 sizeof( ps ); // 结果为4 sizeof( ppc ); // 结果为4 sizeof( pf ); // 结果为4 sizeof( &testfunc ); // 结果为4 sizeof( testfunc ()); // 结果为1 sizeof(*( testfunc) ()); // 结果为1 考察以上代码,得出如下结论: (1) 指针变量的sizeof值与指针所指的对象类型没有任何关系,与指针申请多少空间没有关系,所有的指针变量所占内存大小均相等。那为什么在本机64bits系统下,指针变量大小仍然是4个字节,因为使用32位编译器编译得到程序是32位,故指针大小是4字节,可自行修改编译器版本,不再赘述。 (2) &testfunc代表一个函数指针,指针大小是4,所以sizeof(&testfunc)==4。testfunc()代表一次函数调用,返回值类型是char,所以sizeof(testfunc())==sizeof(char)==1。testfunc 名本身就是一个函数指针,所以(*testfunc)()也是一次函数调用, sizeof((*testfunc)())==sizeof(char)==1。 7. sizeof计算数组 当sizeof作用于数组时,求取的是数组所有元素所占用的大小。参考如下代码: int A[3][5]; char c[]="123456"; double*(*d)[3][6]; cout< cout< cout< cout< cout< cout< cout< cout< cout< 考察以上代码,得出如下结论: (1)A的数据类型是int[3][5],A[4]的数据类型是int[5],A[0][0]数据类型是int。所以sizeof(A)==sizeof(int[3][5])==3*5*sizeof(int)==60, sizeof(A[4])==sizeof(int[5])=5*sizeof(int)==20,sizeof(A[0][0])==sizeof(int)==4。 尽管A[4]的下标越界,但不会造成运行时错误,因为sizeof运算只关心数据类型,在编译阶段就已经完成。 (2)由于字符串以空字符?\0?结尾,所以c的数据类型是char[7],所以sizeof(c)=sizeof (char[7])==7。 (3)d是一个指针,不管它指向的西乡是什么数据类型,自身大小永远是4,。所以sizeof (d)==4。sizeof(*d)的数据类型是double*[3][6],所以 sizeof(*d)==sizeof(double*[3][6])==3*6*sizeof(double*)==18*4==72。 同理,可以推算出sizeof(**d)==sizeof(double*[6])==6*sizeof(double*)==24, sizeof(***d)==sizeof(double*)==4,sizeof(****d)=sizeof(double)==8。 当数组作为函数形参时,下面的i和j的值应该是多少呢? void foo1(char a1[3]) { int i = sizeof( a1 ); // i == ? } void foo2(char a2[]) { int j = sizeof( a2); // j == ? } 也许当你试图回答j的值时已经意识到i答错了,是的,i!=3。这里函数参数a1已不再是数组类型,而是蜕变成指针,相当于char* a1,为什么?仔细想想就不难明白,我们调用函数foo1时,程序会在栈上分配一个大小为3的数组吗?不会!数组是“传址”的,调用者只需将实参的地址传递过去,所以a1自然为指针类型(char*),i的值也就为4,同样j 也是4。 参考文献: [1]陈刚.C++高级进阶教程[M].武汉:武汉大学出版社,2008. [2]https://www.360docs.net/doc/ab17551591.html,/freefalcon/article/details/54839 sizeof计算含有虚函数的类的空间大小 当我们计算一种数据类型所占用的空间大小时,很easy,sizeof就可以解决掉。如果我们计算一个类,一个空类,或者一个含有虚函数然后又派生子类时,这时候他们所占用的内存空间是如何变化的呢?下面我们就通过代码来介绍下。 一个不含有虚函数的普通类与其派生类的内存关系 class Base { public: Base(int x):a(x) {} void print() { cout<sizeof计算含有虚函数的类的空间大小