Linux内存管理详解_第1页
Linux内存管理详解_第2页
免费预览已结束,剩余14页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、虚拟地址即使是现代操作系统中,内存依然是计算机中很宝贵的资源,看看你电脑几个T固态硬盘,再看看内存大小就知道了。为了充分利用和管理系统内存资源,Linux采用虚拟内存管理技术,利用虚拟内存技术让每个进程都有4GB互不干涉的虚拟地址空间。进程初始化分配和操作的都是基于这个虚拟地址,只有当进程需要实际访问内存资源的时候才会建立虚拟地址和物理地址的映射,调入物理内存页。打个不是很恰当的比方,这个原理其实和现在的某某网盘一样。假如你的网盘空间是1TB,真以为就一口气给了你这么大空间吗?那还是太年轻,都是在你往里面放东西的时候才给你分配空间,你放多少就分多少实际空间给你,但你和你朋友看起来就像大家都拥有

2、1TB空间一样。虚拟地址的好处o避免用户直接访问物理内存地址,防止一些破坏性操作,保护操作系统o每个进程都被分配了4GB的虚拟内存,用户程序可使用比实际物理内存更大的地址空间芒程m用户空间3GB进程C用户空间3GB4GB的进程虚拟地址空间被分成两部分:用户空间和内核空间芒程岂用户空亘3GB1GB用户空间内核空间物理地址上面章节我们已经知道不管是用户空间还是内核空间,使用的地址都是虚拟地址,当需进程要实际访问内存的时候,会由内核的请求分页机制产生缺页异常调入物理内存页。把虚拟地址转换成内存的物理地址,这中间涉及利用MMU内存管理单元(MemoryManagementUnit)对虚拟地址分段和分页

3、(段页式)地址转换,关于分段和分页的具体流程,这里不再赘述,可以参考任何一本计算机组成原理教材描述。aw厲昨段页式内存管理地址转换Linux内核会将物理内存分为3个管理区,分别是:ZONE_DMADMA内存区域。包含0MB16MB之间的内存页框,可以由老式基于ISA的设备通过DMA使用,直接映射到内核的地址空间。ZONE_NORMAL普通内存区域。包含16MB896MB之间的内存页框,常规页框,直接映射到内核的地址空间。ZONE_HIGHMEM高端内存区域。包含896MB以上的内存页框,不进行直接映射,可以通过永久映射和临时映射进行这部分内存页框的访问。物理内存区划分用户空间用户进程能访问的是

4、用户空间,每个进程都有自己独立的用户空间,虚拟地址范围从从0x00000000至OxBFFFFFFF总容量3G。用户进程通常只能访问用户空间的虚拟地址,只有在执行内陷操作或系统调用时才能访问内核空间。进程与内存进程(执行的程序)占用的用户空间按照访问属性一致的地址空间存放在一起的原则,划分成5个不同的内存区域。访问属性指的是“可读、可写、可执行等。o代码段代码段是用来存放可执行文件的操作指令,可执行程序在内存中的镜像。代码段需要防止在运行时被非法修改,所以只准许读取操作,它是不可写的。o数据段数据段用来存放可执行文件中已初始化全局变量,换句话说就是存放程序静态分配的变量和全局变量。oBSS段B

5、SS段包含了程序中未初始化的全局变量,在内存中bss段全部置零。o堆heap堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)。o栈stack栈是用户存放程序临时创建的局部变量,也就是函数中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方

6、便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。上述几种内存区域中数据段、BSS段、堆通常是被连续存储在内存中,在位置上是连续的,而代码段和栈往往会被独立存放。堆和栈两个区域在i386体系结构中栈向下扩展、堆向上扩展,相对而生。你也可以在linux下用size命令查看编译后程序的各个内存区域大小:lemon#size/usr/local/sbin/sshdtextdatabssdechexfilename19245321241242689623638402411c0/usr/local/sbin/sshd内核空间在x8632位系统里,Linux内核地

7、址空间是指虚拟地址从OxCO000000开始到OxFFFFFFFF为止的高端内存地址空间,总计1G的容量,包括了内核镜像、物理页面表、驱动程序等运行在内核空间直接映射区直接映射区DirectMemoryRegion:从内核空间起始地址开始,最大896M的内核空间地址区间,为直接内存映射区。直接映射区的896MB的线性地址直接与物理地址的前896MB进行映射,也就是说线性地址和分配的物理地址都是连续的。内核地址空间的线性地址0xC0000001所对应的物理地址为0x00000001,它们之间相差一个偏移量PAGE_OFFSET=0xC0000000该区域的线性地址和物理地址存在线性转换关系线性地

8、址二PAGE_OFFSET+物理地址也可以用virt_to_phys()函数将内核虚拟空间中的线性地址转化为物理地址。高端内存线性地址空间内核空间线性地址从896M到1G的区间,容量128MB的地址区间是高端内存线性地址空间,为什么叫高端内存线性地址空间?下面给你解释一下:前面已经说过,内核空间的总大小1GB,从内核空间起始地址开始的896MB的线性地址可以直接映射到物理地址大小为896MB的地址区间。所以,内核空间拿出了最后的128M地址区间,划分成下面三个高端内存映射区,以达到对整个物理地址范围的寻址。而在64位的系统上就不存在这样的问题了,因为可用的线性地址空间远大于可安装的内存。动态内

9、存映射区vmallocRegion该区域由内核函数vmalloc来分配,特点是:线性空间连续,但是对应的物理地址空间不一定连续。vmalloc分配的线性地址所对应的物理页可能处于低端内存,也可能处于高端内存。永久内存映射区PersistentKernelMappingRegion该区域可访问高端内存。访问方法是使用alloc_page(_GFP_HIGHMEM)分配高端内存页或者使用kmap函数将分配到的高端内存映射到该区域。固定映射区FixingkernelMappingRegion该区域和4G的顶端只有4k的隔离带,其每个地址项都服务于特定的用途,如ACPI_BASE等。叵逗疋肓映更区oS

10、OM-4G永久内存映幻区4MEBKELtt128M的法性世址®壬到物湮地址的奇娠内存ZON匚4ORMAL*ZONbDMA8S0M安主保护因或sr/EiBr.i直接時抠B-h0SK1内核空间物理内存映射上面讲的有点多,先别着急进入下一节,在这之前我们再来回顾一下上面所讲的内容。如果认真看完上面的章节,我这里再画了一张图,现在你的脑海中应该有这样一个内存管理的全局图。用户空问3GB3GB内楼空巨1GBiasc电口空间$684ME内核空间用户空间全图用户空间进程的地址管理模型:wm_arem_struet内存数据结构要让内核管理系统中的虚拟内存,必然要从中抽象出内存管理数据结构,内存管理操

11、作如分配、释放等都基于这些数据结构操作,这里列举两个管理虚拟内存区域的数据结构。用户空间内存数据结构在前面进程与内存章节我们提到,Linux进程可以划分为5个不同的内存区域,分别是:代码段、数据段、BSS、堆、栈,内核管理这些区域的方式是,将这些内存区域抽象成vm_area_struet的内存管理对象。vm_area_struet是描述进程地址空间的基本管理单元,一个进程往往需要多个vm_area_struet来描述它的用户空间虚拟地址,需要使用链表和红黑树来组织各个vm_area_struet。链表用于需要遍历全部节点的时候用,而红黑树适用于在地址空间中定位特定内存区域。内核为了内存区域上的

12、各种不同操作都能获得高性能,所以同时使用了这两种数据结构。内核空间动态分配内存数据结构在内核空间章节我们提到过动态内存映射区,该区域由内核函数vmalloc来分配,特点是:线性空间连续,但是对应的物理地址空间不一定连续。vmalloc分配的线性地址所对应的物理页可能处于低端内存,也可能处于高端内存。vmalloe分配的地址贝V限于vmalloe_start与vmalloe_end之间。每一块vmalloe分配的内核虚拟内存都对应一个vm_struet结构体,不同的内核空间虚拟地址之间有4k大小的防越界空闲区间隔区。与用户空间的虚拟地址特性一样,这些虚拟地址与物理内存没有简单的映射关系,必须通过

13、内核页表才可转换为物理地址或物理页,它们有可能尚未被映射,当发生缺页时才真正分配物理页面。因走刁牢珥肘区4ME打配地址4KvmsllK対配地lit4KVIHjlllQC舟配他址4ME安主-呉护区阪8b/b聂小E96IJvm_structvm_strucfvin_struct动态内存映射前面分析了Linux内存管理机制,下面深入学习物理内存管理和虚拟内存分配。通过前面的学习我们知道,程序可没这么好骗,任你内存管理把虚拟地址空间玩出花来,到最后还是要给程序实实在在的物理内存,不然程序就要罢工了。所以物理内存这么重要的资源一定要好好管理起来使用(物理内存,就是你实实在在的内存条),那么内核是如何管理

14、物理内存的呢?物理内存管理在Linux系统中通过分段和分页机制,把物理内存划分4K大小的内存页Page(也称作页框PageFrame),物理内存的分配和回收都是基于内存页进行,把物理内存分页管理的好处大大的。假如系统请求小块内存,可以预先分配一页给它,避免了反复的申请和释放小块内存带来频繁的系统开销。假如系统需要大块内存,则可以用多页内存拼凑,而不必要求大块连续内存。你看不管内存大小都能收放自如,分页机制多么完美的解决方案!But,理想很丰满,现实很骨感。如果就直接这样把内存分页使用,不再加额外的管理还是存在一些问题,下面我们来看下,系统在多次分配和释放物理页的时候会遇到哪些问题。物理页管理面

15、临问题物理内存页分配会出现外部碎片和内部碎片问题,所谓的内部和外部是针对页框内外而言,一个页框内的内存碎片是内部碎片,多个页框间的碎片是外部碎片。外部碎片当需要分配大块内存的时候,要用好几页组合起来才够,而系统分配物理内存页的时候会尽量分配连续的内存页面,频繁的分配与回收物理页导致大量的小块内存夹杂在已分配页面中间,形成外部碎片,举个例子:外部碎片内部碎片物理内存是按页来分配的,这样当实际只需要很小内存的时候,也会分配至少是4K大小的页面,而内核中有很多需要以字节为单位分配内存的场景,这样本来只想要几个字节而已却不得不分配一页内存,除去用掉的字节剩下的就形成了内部碎片。内部碎片页面管理算法方法

16、总比困难多,因为存在上面的这些问题,聪明的程序员灵机一动,引入了页面管理算法来解决上述的碎片问题。Buddy(伙伴)分配算法Linux内核引入了伙伴系统算法(Buddysystem),什么意思呢?就是把相同大小的页框块用链表串起来,页框块就像手拉手的好伙伴,也是这个算法名字的由来。具体的,所有的空闲页框分组为11个块链表,每个块链表分别包含大小为1,2,4,8,16,32,64,128,256,512和1024个连续页框的页框块。最大可以申请1024个连续页框,对应4MB大小的连续内存。伙伴系统因为任何正整数都可以由2'n的和组成,所以总能找到合适大小的内存块分配出去,减少了外部碎片产

17、生。分配实例比如:我需要申请4个页框,但是长度为4个连续页框块链表没有空闲的页框块,伙伴系统会从连续8个页框块的链表获取一个,并将其拆分为两个连续4个页框块,取其中一个,另外一个放入连续4个页框块的空闲链表中。释放的时候会检查,释放的这几个页框前后的页框是否空闲,能否组成下一级长度的块。命令查看lemon#cat/proc/buddyinfoNode0,zoneDMA10002110113Node0,zoneDMA323198410849404773403021848911806732330Node0,zoneNormal4243837404160354386610121223001slab分

18、配器看到这里你可能会想,有了伙伴系统这下总可以管理好物理内存了吧?不,还不够,否则就没有slab分配器什么事了。那什么是slab分配器呢?一般来说,内核对象的生命周期是这样的:分配内存-初始化-释放内存,内核中有大量的小对象,比如文件描述结构对象、任务描述结构对象,如果按照伙伴系统按页分配和释放内存,对小对象频繁的执行分配内存-初始化-释放内存会非常消耗性能。伙伴系统分配出去的内存还是以页框为单位,而对于内核的很多场景都是分配小片内存,远用不到一页内存大小的空间。slab分配器,通过将内存按使用对象不同再划分成不同大小的空间,应用于内核对象的缓存。伙伴系统和slab不是二选一的关系,slab内

19、存分配器是对伙伴分配算法的补充。原理对于每个内核中的相同类型的对象,如task_struet、file_struet等需要重复使用的小型内核数据对象,都会有个slab缓存池,缓存住大量常用的已经初始化的对象,每当要申请这种类型的对象时,就从缓存池的slab列表中分配一个出去;而当要释放时,将其重新保存在该列表中,而不是直接返回给伙伴系统,从而避免内部碎片,同时也大大提高了内存分配性能。主要优点slab内存管理基于内核小对象,不用每次都分配一页内存,充分利用内存空间,避免内部碎片。slab对内核中频繁创建和释放的小对象做缓存,重复利用一些相同的对象,减少内存分配次数。数据结构slab分配器kme

20、m_eaehe是一个eache_ehain的链表组成节点,代表的是个内核中的相同类型的对象高速缓存,每个kmem_cache通常是一段连续的内存块,包含了三种类型的slabs链表:slabs_full(完全分配的slab链表)slabs_partial(部分分配的slab链表)slabs_empty(没有被分配对象的slab链表)kmem_eaehe中有个重要的结构体kmem_list3包含了以上三个数据结构的声明。st,ul'ttniEE_l.i_st3structllt.hEadslabspartial;3structYtst_headslibs_full;"昇(1寓II

21、宅闲酋mZbJIS述符打slructListhad5labs_"Free;/*Y'?id&*isl.ab!j''士、!unsiqidLongfreezebjectsunsigned.inTfree_limitj1unsignedtntcolour_next;/*er-nodecachec<iLoring:-spinlock._tltst_lock;'.1ul'.airay_cjcb£'*shared;h.Tstmctarray_-cache*alien;an(XtKernodes*/unsigneitLnnqne

22、xt_reap;.-i1intfrtauehtd;-.;tlwi-u-打kmem_list3内核源码slab是slab分配器的最小单位,在实现上一个slab由一个或多个连续的物理页组成(通常只有一页)。单个slab可以在slab链表之间移动,例如如果一个半满slabs_partial链表被分配了对象后变满了,就要从slabs_partial中删除,同时插入到全满slabs_full链表中去。内核slab对象的分配过程是这样的:1. 如果slabs_partial链表还有未分配的空间,分配对象,若分配之后变满,移动slab到slabs_full链表2. 如果slabs_partial链表没有未分

23、配的空间,进入下一步3. 如果slabs_empty链表还有未分配的空间,分配对象,同时移动slab进入slabs_partial链表4. 如果slabs_empty为空,请求伙伴系统分页,创建一个新的空闲slab,按步骤3分配对象7EElatE_p&rtial5l3bE_enpty-荐三闹5st'?Ku蛊了三?£lat£_pQr:ial育空丽甜?SlEti5_fUllstsrslab分配图解命令查看上面说的都是理论,比较抽象,动动手来看看系统中的slab吧!你可以通过cat/proc/slabinfo命令,实际查看系统中slab信息。-Hfeg足|

24、1;nJMMcACERv*T*flU'曲air>cfi_tfrrrerfuai«o""afEdnnrni:k_*3mcawrikr"lutUlTl"m£crraridhiaUf*srid_a«.呜伦百MiL呻q血血畔Httjg叮WlxLB4I9KfHUhHfiwnan9eaap«4bpnl如1j>feAablis再r:TuMJjliKI-TU曲帕I;thiHtlffiI:thNbEfs4:touiblflfil:tdMblin1 :laMbSrsI.«toublK.2 sTJUtlKE

25、-tLJUbK1 ifUMbllK?JtJUbkH2 dtMt-lnL®申n作:sLabdaiaai;tLvHaiaar十1卄击懾B:tsLiFNJiaaivii-MTA&:iLrHdiaai;LiWJi印L4IJrtKlJlJl印e<-LMauai!山諂m?k9.4山心恰PliLjMJtaT4*Lb韓C;ftljMfeClBa-:iiA£<1£-0Q*cisioocl目目sisicnraslabinfo查询slabtop实时显示内核slab内存缓存信息。Active/TotalObjects(驚used)Active-JTotalSlabs厲

26、used)Active/TotalCaches(%ue(1)Active/TotalSize(奄jsd)HinimumFAveragefMaxiuiumObject:3794240/39103&6(99.):L03652/103652(100.0):123/211(58.3%):536147.47K/644963.3QK(98.6);Q.01K/0.17Kf8.0QK0BJSACTIVEUSEOBJSIZE5LAB50BM5LABCACHE51在NfiWE5307102530079990.10K:643901925956QKbufferh出d5919403823499A6-20K195

27、972073388ICdentry.99512194D239A0.04K19561027824K.ext4_extentstatus935281LflGB1S98&3_3_abffl.B-39瞄1ccm0.93K_£1CL1*5692-abjir34GL1S2144KeKt4_inode_GacherertndrUInJslabtop查询slab高速缓存的分类slab高速缓存分为两大类,通用高速缓存和专用高速缓存。通用高速缓存slab分配器中用kmem_cache来描述高速缓存的结构,它本身也需要slab分配器对其进行高速缓存。eache_cache保存着对高速缓存描述符的高

28、速缓存,是一种通用高速缓存,保存在eache_chain链表中的第一个元素。另外,slab分配器所提供的小块连续内存的分配,也是通用高速缓存实现的。通用高速缓存所提供的对象具有几何分布的大小,范围为32至到131072字节。内核中提供了kmalloc()和kfree()两个接口分别进行内存的申请和释放。专用高速缓存内核为专用高速缓存的申请和释放提供了一套完整的接口,根据所传入的参数为指定的对象分配slab缓存。专用高速缓存的申请和释放kmem_cache_create()用于对一个指定的对象创建高速缓存。它从cache_cache普通高速缓存中为新的专有缓存分配一个高速缓存描述符,并把这个描述

29、符插入到高速缓存描述符形成的eache_chain链表中。kmem_cache_destory()用于撤消和从cache_chain链表上删除高速缓存。slab的申请和释放slab数据结构在内核中的定义,如下:stru'.tslabstiuc:ListheadItst;用i-s1abilAkeme_Ltst3*/unsignedlonqcolfluroff;严谟航曲的弄亀偏移voidilab'Pii'j.qj卜时®unsignedintinuse;ofobjsactiveinslab(2哙卄配出出的Wfe*/kmeni_bjfcfl_tfree;/土下-十亍1

30、卅对隹的F桩*funinedshortnodeid;rj|hJ|冲匚i慝I,WluTl,T«J/;slab结构体内核代码kmem_cache_alloc()在其参数所指定的高速缓存中分配一个slab,对应的kmem_cache_free()在其参数所指定的高速缓存中释放一个slab。虚拟内存分配前面讨论的都是对物理内存的管理,Linux通过虚拟内存管理,欺骗了用户程序假装每个程序都有4G的虚拟内存寻址空间(如果这里不懂我说啥,建议回头看下别再说你不懂Linux内存管理了,10张图给你安排的明明白白!)。所以我们来研究下虚拟内存的分配,这里包括用户空间虚拟内存和内核空间虚拟内存。注意,

31、分配的虚拟内存还没有映射到物理内存,只有当访问申请的虚拟内存时,才会发生缺页异常,再通过上面介绍的伙伴系统和slab分配器申请物理内存。用户空间内存分配mallocmalloc用于申请用户空间的虚拟内存,当申请小于128KB小内存的时,malloc使用sbrk或brk分配内存;当申请大于128KB的内存时,使用mmap函数申请内存;存在问题由于brk/sbrk/mmap属于系统调用,如果每次申请内存都要产生系统调用开销,cpu在用户态和内核态之间频繁切换,非常影响性能。而且,堆是从低地址往高地址增长,如果低地址的内存没有被释放,高地址的内存就不能被回收,容易产生内存碎片。解决因此,malloc米用的是内存池的实现方式,先申请一大块内存,然后将内存分成不同大小的内存块,然后用户申请内存时,直接从内存池中选择一块相近的内存块分配出去。内核空间细分区域kmallockmalloc()分配的虚拟地址范围在内核空间的直接内存映射区。按字节为单位虚拟内存,一般用于分配小块内存,释放内存对应于kfree,可以分配连续的物理内存。函数原型在<linux/kmalloc.h>中声明,一般情况下在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论