bss段代码段及数据段的区别.doc

上传人：B*** IP属地：四川上传时间：2019-04-24 格式：DOC 页数：11 大小：82KB 积分：15 举报 版权申诉

已阅读5页，还剩6页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

一个程序本质上都是由 bss段、data段、text段三个组成的。这样的概念，不知道最初来源于哪里的规定，但在当前的计算机程序设计中是很重要的一个基本概念。而且在嵌入式系统的设计中也非常重要，牵涉到嵌入式系统运行时的内存大小分配，存储单元占用空间大小的问题。在采用段式内存管理的架构中（比如intel的80x86系统），bss段（Block Started by Symbol segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域，一般在初始化时bss 段部分将会清零。bss段属于静态内存分配，即程序一开始就将其清零了。比如，在C语言之类的程序编译完成之后，已初始化的全局变量保存在.data 段中，未初始化的全局变量保存在.bss 段中。在Programming ground up里对.bss的解释为：There is another section called the .bss. This section is like the data section, except that it doesnt take up space in the executable.text和data段都在可执行文件中（在嵌入式系统里一般是固化在镜像文件中），由系统从可执行文件中加载；而bss段不在可执行文件中，由系统初始化。【例一】用cl编译两个小程序如下：程序1:int ar30000;void main().程序2:int ar300000 = 1, 2, 3, 4, 5, 6 ;void main(). 发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解，于是手工编译了一下，并使用了/FAs编译选项来查看了一下其各自的.asm，发现在程序1.asm中ar的定义如下：_BSS SEGMENT?ar3PAHA DD 0493e0H DUP (?) ; ar_BSS ENDS而在程序2.asm中，ar被定义为：_DATA SEGMENT?ar3PAHA DD 01H ; arDD 02HDD 03HORG $+1199988_DATA ENDS区别很明显，一个位于.bss段，而另一个位于.data段，两者的区别在于：全局的未初始化变量存在于.bss段中，具体体现为一个占位符；全局的已初始化变量存于.data段中；而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的，其内容由操作系统初始化（清零）；而.data却需要占用，其内容由程序初始化，因此造成了上述情况。【例二】编译如下程序（test.cpp）:#include #define LEN 1002000int inbssLEN;float fA;int indataLEN=1,2,3,4,5,6,7,8,9;double dbB = 100.0;const int cst = 100;int main(void)int run100 = 1,2,3,4,5,6,7,8,9;for(int i=0; iLEN; +i)printf(%d , inbssi);return 0;命令：cl /FA test.cpp 回车 (/FA:产生汇编代码)产生的汇编代码(test.asm):TITLE test.cpp.386Pinclude listing.incif Version gt 510.model FLATelse_TEXT SEGMENT PARA USE32 PUBLIC CODE_TEXT ENDS_DATA SEGMENT DWORD USE32 PUBLIC DATA_DATA ENDSCONST SEGMENT DWORD USE32 PUBLIC CONSTCONST ENDS_BSS SEGMENT DWORD USE32 PUBLIC BSS_BSS ENDS_TLS SEGMENT DWORD USE32 PUBLIC TLS_TLS ENDSFLAT GROUP _DATA, CONST, _BSSASSUME CS: FLAT, DS: FLAT, SS: FLATendifPUBLIC ?inbss3PAHA ; inbssPUBLIC ?fA3MA ; fAPUBLIC ?indata3PAHA ; indataPUBLIC ?dbB3NA ; dbB_BSS SEGMENT?inbss3PAHA DD 0f4a10H DUP (?) ; inbss?fA3MA DD 01H DUP (?) ; fA_BSS ENDS_DATA SEGMENT?indata3PAHA DD 01H ; indataDD 02HDD 03HDD 04HDD 05HDD 06HDD 07HDD 08HDD 09HORG $+4007964?dbB3NA DQ 04059000000000000r ; 100 ; dbB_DATA ENDSPUBLIC _mainEXTRN _printf:NEAR_DATA SEGMENT$SG537 DB %d , 00H_DATA ENDS_TEXT SEGMENT_run$ = -400_i$ = -404_main PROC NEAR; File test.cpp; Line 13push ebpmov ebp, espsub esp, 404 ; 00000194Hpush edi; Line 14mov DWORD PTR _run$ebp, 1mov DWORD PTR _run$ebp+4, 2mov DWORD PTR _run$ebp+8, 3mov DWORD PTR _run$ebp+12, 4mov DWORD PTR _run$ebp+16, 5mov DWORD PTR _run$ebp+20, 6mov DWORD PTR _run$ebp+24, 7mov DWORD PTR _run$ebp+28, 8mov DWORD PTR _run$ebp+32, 9mov ecx, 91 ; 0000005bHxor eax, eaxlea edi, DWORD PTR _run$ebp+36rep stosd; Line 15mov DWORD PTR _i$ebp, 0jmp SHORT $L534$L535:mov eax, DWORD PTR _i$ebpadd eax, 1mov DWORD PTR _i$ebp, eax$L534:cmp DWORD PTR _i$ebp, 1002000 ; 000f4a10Hjge SHORT $L536; Line 16mov ecx, DWORD PTR _i$ebpmov edx, DWORD PTR ?inbss3PAHAecx*4push edxpush OFFSET FLAT:$SG537call _printfadd esp, 8jmp SHORT $L535$L536:; Line 17xor eax, eax; Line 18pop edimov esp, ebppop ebpret 0_main ENDP_TEXT ENDSEND通过汇编文件可以看到，数组inbss和indata位于不同的段（inbss位于bss段，而indata位于data段）若把test.cpp中的indata数组拿掉，查看生成的exe文件的大小，可以发现，indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组，exe文件大小跟没拿掉时相差无几。说明了：bss段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。data（已手动初始化的数据）段则为数据分配空间，数据保存在目标文件中。数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到，然后链接器得到这个大小的内存块，紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。ld 时把所有的目标文件的代码段组合成一个代码段,把所有的数据段组合成一个数据段.#BSS段：BSS段（bss segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。数据段：数据段（data segment）通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。代码段：代码段（code segment/text segment）通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定，并且内存区域通常属于只读, 某些架构也允许代码段为可写，即允许修改程序。在代码段中，也有可能包含一些只读的常数变量，例如字符串常量等。代码段是存放了程序代码的数据，假如机器中有数个进程运行相同的一个程序，那么它们就可以使用同一个代码段。堆（heap）：堆是用于存放进程运行中被动态分配的内存段，它的大小并不固定，可动态扩张或缩减。当进程调用malloc等函数分配内存时，新分配的内存就被动态添加到堆上（堆被扩张）；当利用free等函数释放内存时，被释放的内存从堆中被剔除（堆被缩减）栈(stack)：栈又称堆栈，是用户存放程序临时创建的局部变量，也就是说我们函数括弧“”中定义的变量（但不包括static声明的变量，static意味着在数据段中存放变量）。除此以外，在函数被调用时，其参数也会被压入发起调用的进程栈中，并且待到调用结束后，函数的返回值也会被存放回栈中。由于栈的先进先出特点，所以栈特别方便用来保存/恢复调用现场。从这个意义上讲，我们可以把堆栈看成一个寄存、交换临时数据的内存区。-没初始化的全局变量（bss段），只在编译后生成文件的时候会比初始化的全局变量占空间小。加载的时候，如果是大型操作系统上，通常加载器帮你把bss段初始化为0，当然已经初始化的全局变量直接从你的可执行文件拷贝对应的值。要注意，bss全局变量的地址空间不是加载的时候分配的，同样是链接的时候分配的。如果在嵌入式里，很可能没加载器，你的程序是直接由bootload程序加载到内存的。这个时候，bss区域是否被清0，要看写bootload代码的人了。因为这种bootload通常要自己写的。-BSS是“Block Started by Symbol”的缩写，意为“以符号开始的块”。BSS是Unix链接器产生的未初始化数据段。其他的段分别是包含程序代码的“text”段和包含已初始化数据的“data”段。 BSS段的变量只有名称和大小却没有值。此名后来被许多文件格式使用，包括PE。“以符号开始的块”指的是编译器处理未初始化数据的地方。BSS节不包含任何数据，只是简单的维护开始和结束的地址，以便内存区能在运行时被有效地清零。BSS节在应用程序的二进制映象文件中并不存在。在采用段式内存管理的架构中（比如intel的80x86系统），bss段（Block Started by Symbol segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域，一般在初始化时bss 段部分将会清零。bss段属于静态内存分配，即程序一开始就将其清零了。比如，在C语言之类的程序编译完成之后，已初始化的全局变量保存在.data 段中，未初始化的全局变量保存在.bss 段中。text和data段都在可执行文件中（在嵌入式系统里一般是固化在镜像文件中），由系统从可执行文件中加载；而bss段不在可执行文件中，由系统初始化。-一. 在c中分为这几个存储区1.栈 - 由编译器自动分配释放。2.堆 - 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。3.全局区（静态区），全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。程序结束释放。4.另外还有一个专门放常量的地方。程序结束释放。在函数体中定义的变量通常是在栈上，用malloc, calloc, realloc等分配内存的函数分配得到的是在堆上。在所有函数体外定义的是全局量，加了static修饰符后不管在哪里都存放在全局区（静态区）,在所有函数体外定义的static变量表示在该文件中有效，不能extern到别的文件用，在函数体内定义的static表示只在该函数体内有效。另外，函数中的adgfdf这样的字符串存放在常量区。比如：int a = 0; /全局初始化区char *p1; /全局未初始化区void main()int b; /栈char s = abc; /栈char *p2; /栈char *p3 = 123456; /123456post.content在常量区，p3在栈上static int c = 0; /全局（静态）初始化区p1 = (char *)malloc(10); /分配得来得10字节的区域在堆区p2 = (char *)malloc(20); /分配得来得20字节的区域在堆区strcpy(p1, 123456);/123456post.content放在常量区，编译器可能会将它与p3所指向的123456优化成一块二. 在C+中，内存分成5个区，他们分别是堆、栈、自由存储区、全局/静态存储区和常量存储区1.栈，就是那些由编译器在需要的时候分配，在不需要的时候自动清除的变量的存储区。里面的变量通常是局部变量、函数参数等。2.堆，就是那些由new分配的内存块，他们的释放编译器不去管，由我们的应用程序去控制，一般一个new就要对应一个delete。如果程序员没有释放掉，那么在程序结束后，操作系统会自动回收。3.自由存储区，就是那些由malloc等分配的内存块，他和堆是十分相似的，不过它是用free来结束自己的生命的。4.全局/静态存储区，全局变量和静态变量被分配到同一块内存中，在以前的C语言中，全局变量又分为初始化的和未初始化的，在C+里面没有这个区分了，他们共同占用同一块内存区。5.常量存储区，这是一块比较特殊的存储区，他们里面存放的是常量，不允许修改（当然，你要通过非正当手段也可以修改）三. 谈谈堆与栈的关系与区别具体地说，现代计算机(串行执行机制)，都直接在代码底层支持栈的数据结构。这体现在，有专门的寄存器指向栈所在的地址，有专门的机器指令完成数据入栈出栈的操作。这种机制的特点是效率高，支持的数据有限，一般是整数，指针，浮点数等系统直接支持的数据类型，并不直接支持其他的数据结构。因为栈的这种特点，对栈的使用在程序中是非常频繁的。对子程序的调用就是直接利用栈完成的。机器的call指令里隐含了把返回地址推入栈，然后跳转至子程序地址的操作，而子程序中的ret指令则隐含从堆栈中弹出返回地址并跳转之前的操作。C/C+中的自动变量是直接利用栈的例子，这也就是为什么当函数返回时，该函数的自动变量自动失效的原因。和栈不同，堆的数据结构并不是由系统(无论是机器系统还是操作系统)支持的，而是由函数库提供的。基本的 malloc/realloc/free 函数维护了一套内部的堆数据结构。当程序使用这些函数去获得新的内存空间时，这套函数首先试图从内部堆中寻找可用的内存空间，如果没有可以使用的内存空间，则试图利用系统调用来动态增加程序数据段的内存大小，新分配得到的空间首先被组织进内部堆中去，然后再以适当的形式返回给调用者。当程序释放分配的内存空间时，这片内存空间被返回内部堆结构中，可能会被适当的处理(比如和其他空闲空间合并成更大的空闲空间)，以更适合下一次内存分配申请。这套复杂的分配机制实际上相当于一个内存分配的缓冲池(Cache)，使用这套机制有如下若干原因：1. 系统调用可能不支持任意大小的内存分配。有些系统的系统调用只支持固定大小及其倍数的内存请求(按页分配)；这样的话对于大量的小内存分类来说会造成浪费。2. 系统调用申请内存可能是代价昂贵的。系统调用可能涉及用户态和核心态的转换。3. 没有管理的内存分配在大量复杂内存的分配释放操作下很容易造成内存碎片。堆和栈的对比从以上知识可知，栈是系统提供的功能，特点是快速高效，缺点是有限制，数据不灵活；而栈是函数库提供的功能，特点是灵活方便，数据适应面广泛，但是效率有一定降低。栈是系统数据结构，对于进程/线程是唯一的；堆是函数库内部数据结构，不一定唯一。不同堆分配的内存无法互相操作。栈空间分静态分配和动态分配两种。静态分配是编译器完成的，比如自动变量(auto)的分配。动态分配由alloca函数完成。栈的动态分配无需释放(是自动的)，也就没有释放函数。为可移植的程序起见，栈的动态分配操作是不被鼓励的！堆空间的分配总是动态的，虽然程序结束时所有的数据空间都会被释放回系统，但是精确的申请内存/ 释放内存匹配是良好程序的基本要素。1.碎片问题：对于堆来讲，频繁的new/delete势必会造成内存空间的不连续，从而造成大量的碎片，使程序效率降低。对于栈来讲，则不会存在这个问题，因为栈是先进后出的队列，他们是如此的一一对应，以至于永远都不可能有一个内存块从栈中间弹出，在他弹出之前，在他上面的后进的栈内容已经被弹出，详细的可以参考数据结构，这里我们就不再一一讨论了。2.生长方向：对于堆来讲，生长方向是向上的，也就是向着内存地址增加的方向；对于栈来讲，它的生长方向是向下的，是向着内存地址减小的方向增长。3.分配方式：堆都是动态分配的，没有静态分配的堆。栈有2种分配方式：静态分配和动态分配。静态分配是编译器完成的，比如局部变量的分配。动态分配由 alloca函数进行分配，但是栈的动态分配和堆是不同的，他的动态分配是由编译器进行释放，无需我们手工实现。4.分配效率：栈是机器系统提供的数据结构，计算机会在底层对栈提供支持：分配专门的寄存器存放栈的地址，压栈出栈都有专门的指令执行，这就决定了栈的效率比较高。堆则是C/C+函数库提供的，它的机制是很复杂的，例如为了分配一块内存，库函数会按照一定的算法（具体的算法可以参考数据结构/操作系统）在堆内存中搜索可用的足够大小的空间，如果没有足够大小的空间（可能是由于内存碎片太多），就有可能调用系统功能去增加程序数据段的内存空间，这样就有机会分到足够大小的内存，然后进行返回。显然，堆的效率比栈要低得多。明确区分堆与栈:在bbs上，堆与栈的区分问题，似乎是一个永恒的话题，由此可见，初学者对此往往是混淆不清的，所以我决定拿他第一个开刀。首先，我们举一个例子：void f()int* p=new int5;这条短短的一句话就包含了堆与栈，看到new，我们首先就应该想到，我们分配了一块堆内存，那么指针 p呢？他分配的是一块栈内存，所以这句话的意思就是：在栈内存中存放了一个指向一块堆内存的指针p。在程序会先确定在堆中分配内存的大小，然后调用operator new分配内存，然后返回这块内存的首地址，放入栈中，他在VC6下的汇编代码如下：00401028 push 14h0040102A call operator new (00401060)0040102F add esp,400401032 mov dword ptr ebp-8,eax00401035 mov eax,dword ptr ebp-800401038 mov dword ptr ebp-4,eax这里，我们为了简单并没有释放内存，那么该怎么去释放呢？是delete p么？澳，错了，应该是delete p，这是为了告诉编译器：我删除的是一个数组，VC6就会根据相应的Cookie信息去进行释放内存的工作。好了，我们回到我们的主题：堆和栈究竟有什么区别？主要的区别由以下几点：1、管理方式不同；2、空间大小不同；3、能否产生碎片不同；4、生长方向不同；5、分配方式不同；6、分配效率不同；管理方式：对于栈来讲，是由编译器自动管理，无需我们手工控制；对于堆来说，释放工作由程序员控制，容易产生memory leak。空间大小：一般来讲在32位系统下，堆内存可以达到4G的空间，从这个角度来看堆内存几乎是没有什么限制的。但是对于栈来讲，一般都是有一定的空间大小的，例如，在VC6下面，默认的栈空间大小是1M（好像是，记不清楚了）。当然，我们可以修改：打开工程，依次操作菜单如下：Project-Setting-Link，在Cate

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

bss段代码段及数据段的区别.doc

文档简介

温馨提示

最新文档

评论

bss段代码段及数据段的区别.doc

文档简介

温馨提示

最新文档

评论

相关文档