C语言中的数据对齐问题

之前看过一些文章写的对齐的原理或者说是方式,有的不尽完备,有的根本是以偏盖全,没有揭露数据对齐问题的实质。本人经过多次测试及搜索相关资料,总结出数据对齐问题的两个判断原则跟大家分享。文中有很多表述不够专业,请见谅。

    一个结构体变量定义完之后,其在内存中的存储并不等于其所包含元素的宽度之和。

例一:

                                       #include <iostream>

                                      using namespace std;

                                         struct X

                                         {

                                               char a;

                                              int b;

                                               double c;

                                          }S1;

                                      void main()

                                    {

                                        cout << sizeof(S1) << endl;

                                        cout << sizeof(S1.a) << endl;

                                         cout << sizeof(S1.b) << endl;

                                        cout << sizeof(S1.c) << endl;

                                     }

     比如例一中的结构体变量S1定义之后,经测试,会发现sizeof(S1)= 16,其值不等于sizeof(S1.a) = 1、sizeof(S1.b) = 4和 sizeof(S1.c) = 8三者之和,这里面就存在存储对齐问题。

    原则一:结构体中元素是按照定义顺序一个一个放到内存中去的,但并不是紧密排列的。从结构体存储的首地址开始,每一个元素放置到内存中时,它都会认为内存是以它自己的大小来划分的,因此元素放置的位置一定会在自己宽度的整数倍上开始(以结构体变量首地址为0计算)。

    比如此例,首先系统会将字符型变量a存入第0个字节(相对地址,指内存开辟的首地址);然后在存放整形变量b时,会以4个字节为单位进行存储,由于第一个 四字节模块已有数据,因此它会存入第二个四字节模块,也就是存入到4~8字节;同理,存放双精度实型变量c时,由于其宽度为8,其存放时会以8个字节为单 位存储,也就是会找到第一个空的且是8的整数倍的位置开始存储,此例中,此例中,由于头一个8字节模块已被占用,所以将c存入第二个8字节模块。整体存储 示意图如图1所示。

   考虑另外一个实例。

例二:

                                          struct X

                                            {

                                                char a;

                                                double b;

                                                int c;

                                             }S2;

    在例二中仅仅是将double型的变量和int型的变量互换了位置。测试程序不变,测试结果却截然不同,sizeof(S2)=24,不同于我们按照原则一计算出的8+8+4=20,这就引出了我们的第二原则。

   

   原则二:在经过第一原则分析后,检查计算出的存储单元是否为所有元素中最宽的元素的长度的整数倍,是,则结束;若不是,则补齐为它的整数倍。

    例二中,我们分析完后的存储长度为20字节,不是最宽元素长度8的整数倍,因此将它补齐到8的整数倍,也就是24。这样就没问题了。其存储示意图如图2所示。

    掌握了这两个原则,就能够分析所有数据存储对齐问题了。再来看几个例子,应用以上两个原则来判断。

例三:

                                              struct X

                                              {

                                                   double a;

                                                    char b;

                                                    int c;     

                                              }S3;

    首先根据原则一来分析。按照定义的顺序,先存储double型的a,存储在第0~7个字节;其次是char型的b,存储在第8个字节;接下来是int型的 c,顺序检查后发现前面三个四字节模块都被占用,因此存储在第4个四字节模块,也就是第12~15字节。按照第一原则分析得到16个字节,16正好是最宽 元素a的宽度8的整数倍,因此结构体变量S3所占存储空间就是16个字节。存储结构如图3所示。

例四:

                                              struct X

                                              {

                                                  double a;

                                                  char b;

                                                    int c;

                                                    char d;   

                                              }S4;

    仍然首先按照第一原则分析,得到的字节数为8+4+4+1=17;再按照第二原则补齐,则结构体变量S4所占存储空间为24。存储结构如图4所示:

例五:

                                              struct X

                                               {

                                                  double a;

                                                   char b;

                                                   int c;

                                                   char d;

                                                   int e;

                                               }S5;

    同样结合原则一和原则二分析,可知在S4的基础上在结构体内部变量定义最后加入一个int型变量后,结构体所占空间并未增加,仍为24。存储结构示意图如图5所示。

例六:

    如果将例五中加入的变量e放到第一个定义的位置,则情况就不同了。结构体所占存储空间会变为32。其存储结构示意图如图6所示。

                                             struct X

                                              {

                                                  int e;

                                                  double a;

                                                   char b;

                                                  int c;

                                                   char d;

                                              }S6;

    补充:前面所介绍的都是元素为基本数据类型的结构体,那么含有指针、数组或是其它结构体变量或联合体变量时该如何呢?

    1.包含指针类型的情况。只要记住指针本身所占的存储空间是4个字节就行了,而不必看它是指向什么类型的指针。

例七:

                     struct X              struct Y               struct Z

                     {                      {                       {     

                        char *a;              int *b;                  double *c;

                     };                     };                      };

    经测试,可知sizeof(X)、sizeof(Y)和sizeof(Z)的值都为4。

    2.含有构造数据类型(数组、结构体和联合体)的情况。首 先要明确的是计算存储空间时要把构造体看作一个整体来为其开辟存储空间;其次要明确的是在最后补齐时是按照所有元素中的基本数据类型元素的最长宽度来补齐 的,也就是说虽然要把构造体看作整体,但在补齐的时候并不会按照所含结构体所占存储空间的长度来补齐的(即使它可能是最长的)。

例八:

                                      struct X

                                      {

                                           char a;

                                           int b;

                                          double c;

                                      };

                                      struct Y

                                      {

                                           char a;

                                            X b;

                                       };

    经测试,可知sizeof(X)为16,sizeof(Y)为24。即计算Y的存储长度时,在存放第二个元素b时的初始位置是在double型的长度8的整数倍处,而非16的整数倍处,即系统为b所分配的存储空间是第8~23个字节。

    如果将Y的两个元素char型的a和X型的b调换定义顺 序,则系统为b分配的存储位置是第0~15个字节,为a分配的是第16个字节,加起来一共17个字节,不是最长基本类型double所占宽度8的整数倍, 因此要补齐到8的整数倍,即24。测试后可得sizeof(Y)的值为24。

    由于结构体所占空间与其内部元素的类型有关,而且与不同类型元素的排列有关,因此在定义结构体时,在元素类型及数量确定之后,我们还应该注意一下其内部元素的定义顺序。

作者: landuochong   发布时间: 2010-12-02