内核中断,异常,抢占总结篇_第1页
内核中断,异常,抢占总结篇_第2页
内核中断,异常,抢占总结篇_第3页
内核中断,异常,抢占总结篇_第4页
内核中断,异常,抢占总结篇_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、内核中断,异常,抢占总结篇、基本概念中断分为同步中断和异步中断。同步中断是由CPU控制单元产生的,同步”是指只有在一条指令执行完毕后,CPU才会发出中断,而不是发生在代码指令执行期间,比如系统调用。 而异步中断是由其他硬件设备依照CPU时钟信号产生的,即意味着中断能够在指令之间发生,例如键盘中断。按照In tel的微处理器手册,同步中断和异步中断也分别称为异常(或者软件中断) 和中断。中断大家都比较熟悉,是由硬件设备产生的。异常的产生源有两种:一种是由程序的错误产生的,内核通过发送一个Unix程序员都熟悉的信号来处理异常;第二种时内核必须处理的异常条件产生的,此时内核执行恢复异常需要的所有步骤

2、,例如缺页,或对内核服务的一个请求(系统调用,通过一条int指令)。有一个知识点值得了解:内核态能够触发的唯一异常就是缺页异常,其他的都是用户态触发的。二、硬中断、软中断、异常之间的抢占关系硬中断可以被另一个优先级比自己高的硬中断中断”不能被同级(同一种硬中断) 或低级的硬中断中断”更不能被软中断中断”软中断可以被硬中断 中断”但是不会被另一个软中断中断”在一个CPU上,软中断总是串行执行。所以在单处理器上,对软中断的数据结构进行访问不需要加任何同步原语。(关于这一点,我对深入理解linux内核第三版 P223页中保护可延迟函数所访问的数据结构有疑问,书上说保护可延迟函数(软中断)所访问的数据

3、结构应采取的措施:对于单处理器的情况,在单处理器上不存在竞争条件,这是因为可延迟函数(软中断)的执行总是在一个CPU上串行执行-也就是说,一个可延迟函数不会被另一个可延迟函数中断。因此,根本不需要同步原语。我认为:一个软中断虽然不会被另一个软中断中断”,但是可能被硬中断中断”,而硬中断最后还是要执行到软中断,因此还是会形成对资源的临界区访问。我觉得在保护软中断时,应该关闭本地软中断,比如用local_bh_disable )还没写完这篇博客,就知道我在这个问题上错了。附上在Linux内核开发中文邮件列表上某位仁兄提供的解答。开始处理软中断的情况主要是1、中断退出执行的irq_exit2、内核线

4、程ksoftirqd3、local_bh_enable而asmli nkage void do_softirq(void)un sig ned long flags; struct thread_ info *curctx; union irq_ctx *irqctx;u32 *isp;if (inn terrupt()return;可以看到,innterrupt判断,当前若是从硬件中断退出后执行的irq_exit进入的do_softirq ,则立即返回,可以避免你说的情况本文最后还将附上一篇软中断源码的分析,很详细地说明了这个问题。硬中断和软中断都可以抢占(或者称为中断)异常(最典型的是系统

5、调用),但是异常不能 抢占硬中断和软中断。硬中断和软中断(只要是中断上下文) 执行的时候都不允许内核抢占, 换句话说,中断上下 文中永远不允许进程切换。(个人理解,由于中断处理程序都需要较快地完成,而且中断处理程序可以嵌套,因此中断处理程序必须不能阻塞,否则性能就非常不能保证了。)三、用户抢占和内核抢占抢占分两种情况:用户抢占和内核抢占,其中内核抢占在Lin ux2.5.4版本发布时被并入内核的,通SMP 一样作为内核的一项标准可选配置。1、 用户抢占:内核即将返回用户空间的时候,如果need resched标志被设置,会导致 schedule()被调用,此时就会发生用户抢占。在内核返回用户空

6、间的时候,它知道自己是安全的。所以,内核无论是在从中断处理程序还是在系统调用后返回,都会检查need resched标志。如果它被设置了,那么,内核会选择一个其他(更合适的)进程投入运行。在内核抢占还没有出现的时候,内核所有的抢占情况都是用户抢占。2、内核抢占:内核抢占是指,一个在内核态运行的进程,可能在执行内核函数期间被另一 个进程取代。不是在内核的任何一个地方都可以发生内核抢占的。内核不能被抢占的情况如下:1) 内核正进行中断处理。在Linux内核中进程不能抢占中断(中断只能被其他中断中止、抢占,进程不能中止、抢占中断),在中断例程中不允许进行进程调度。进程调度函数schedule()会对

7、此作出判断,如果是在中断中调用,会打印出错信息。2) 内核正在进行中断上下文的Bottom Half(中断的底半部)处理。硬件中断返回前会执行软 中断,此时仍然处于中断上下文中。3)内核的代码段正持有 spin lock自旋锁、writelock/readlock 读写锁等锁,处干这些锁的保护状态中。内核中的这些锁是为了在SMP系统中短时间内保证不同 CPU上运行的进程并发执行的正确性。当持有这些锁时,内核不应该被抢占。4) 内核正在执行调度程序Scheduler。抢占的原因就是为了进行新的调度,没有理由将调 度程序抢占掉再运行调度程序。5)内核正在对每个 CPU"私有"的

8、数据结构操作(Per-CPU date structures)。在SMP中,对于per-CPU数据结构未用spinlocks保护,因为这些数据结构隐含地被保护了 (不同的CPU 有不一样的per-CPU数据,其他CPU上运行的进程不会用到另一个 CPU的per-CPU数据)。 但是如果允许抢占,但一个进程被抢占后重新调度,有可能调度到其他的CPU上去,这时定义的Per-CPU变量就会有问题,这时应禁抢占。除了上述情况,在内核的任何地方都可能发生内核抢占,内核抢占发生的时机一般在:1)当从中断处理程序正在执行,且返回内核空间之前。2) 当内核代码再一次具有可抢占性的时候,如解锁(spin_u n

9、lock_bh )及使能软中断 (local_bh_e nable)等。3) 如果内核中的任务显式的调用schedule()。4) 如果内核中的任务阻塞(这同样也会导致调用schedule。)。内核抢占主要是为实时系统来设计的,但也不是在所有情况下都是最优的,因为抢占也需要调度和同步开销,在某些情况下甚至要关闭内核抢占。以下是一篇关于开启和关闭内核抢占性能测试的文章。http:/www.ibm.eom/developerworks/c n/l inu x/l-nptl/i ndex.html四、怎么对内核临界区进行保护在进程内核数据结构的互斥同步访问时,我们最常用的办法是:信号量(睡眠等待),

10、自旋 锁(自旋等待),中断禁止和软中断禁止。往往需要几种方法配合使用才能达到我们想要的 结果。1、保护异常(最典型的是系统调用)所访问的数据结构此时最常选用的是信号量, 因为信号量原语允许进程睡眠到资源变为可用,对大部分系统调用而言,这是所期望的行为。信号量的工作方式在单处理器系统和多处理器系统上完全相同。只有在访问每 CPU变量的情况下,必须显式地禁用内核抢占,其他情况下内核抢占不会出 现问题。2、保护中断所访问的数据结构1)单处理器情况下:假如数据结构只被这一种中断访问,则完全可以不加同步原语,因为中断不能被同一种中断 中断”假如数据结构被多个中断处理程序访问,则必须通过禁用本 地中断来保

11、护临界区。2) 多处理器情况下:除了必须禁用本地中断,还必须使用自旋锁来避免来自其他CPU的 干扰。可以使用如 spin_lock_irq()来完成这两件事情。3、保护可延迟函数(软中断和 tasklet )所访问的数据结构1) 单处理器情况下:在单处理器系统上不存在竞争条件,因为可延迟函数的执行在一个CPU上是串行的,一个可延迟函数不会被另一个可延迟函数所中断。因此无需同步原语。2) 多处理器情况下:需要自旋锁来加以保护。由于软中断和tasklet并发程度不同,加锁情况也不同。同一软中断可以在不同CPU上运行,因此无论一个或多个软中断,都必须用如spin_lock加以保护。同一 taskle

12、t不能在不同CPU上运行,因此无需加锁;不同 tasklet可 以在不同CPU上运行,因此也需要如 spin_lock的锁加以保护。4、保护由异常和中断访问的数据结构单处理器情况下:1) 对中断而言:中断不能被异常中断”无需考虑异常的干扰。第1条一样,如果此数据结构只被一种中断访问,则可不加同步原语;否则要禁用本地中断。2)对异常而言:异常的优先级低,如需访问共享数据结构,必须先禁用本地中断。多处理器情况下:1) 对中断而言:除了单处理器考虑的情况外,还必须用自旋锁排除其他CPU的干扰。2) 对异常而言:除了单处理器考虑的情况外,还必须用自旋锁排除其他CPU的干扰。5、保护由异常和可延迟函数访

13、问的数据结构单处理器情况下:1 )对可延迟函数而言:可延迟函数不能被异常中断”无需考虑异常的干扰。在每个CPU上可延迟函数串行执行,不存在竞争条件,因此不用同步原语。2 )对异常而言:异常的优先级低,如需访问共享数据结构,必须先禁用本地软中断。多处理器情况下:1) 对中断而言:除了单处理器考虑的情况外,还必须用自旋锁排除其他CPU的干扰。2) 对异常而言:除了单处理器考虑的情况外,还必须用自旋锁排除其他CPU的干扰。6、保护由中断和可延迟函数访问的数据机构 单处理器情况下:1 )对中断而言:中断不能被可延迟函数中断”无需考虑可延迟函数的干扰。第1条一样,如果此数据结构只被一种中断访问,则可不加

14、同步原语;否则要禁用本地中断。2 )对可延迟函数而言:可延迟函数的优先级低,如需访问共享数据结构,必须先禁用本地 中断。多处理器情况下:1) 对中断而言:除了单处理器上考虑的外,还必须用自旋锁排除其他CPU的干扰。2) 对可延迟函数而言:除了单处理器上考虑的外,还必须用自旋锁排除其他CPU的干扰。7、保护由异常、中断和可延迟函数访问的数据结构单处理器情况下:1)对中断而言:优先级最高,无需考虑其他两种的影响。第1条一样,如果此数据结构只被一种中断访问,则可不加同步原语;否则要禁用本地中断。2 )对可延迟函数而言:可延迟函数的优先级低,如需访问共享数据结构,必须先禁用本地 中断。3)对异常而言:

15、可延迟函数的优先级低,如需访问共享数据结构,必须先禁用本地中断。 禁用了本地中断,也就相当于禁用了本地软中断。多处理器情况下:1) 对中断而言:除了单处理器上考虑的外,还必须用自旋锁排除其他CPU的干扰。2) 对可延迟函数而言:除了单处理器上考虑的外,还必须用自旋锁排除其他CPU的干扰。3) 对异常而言:除了单处理器上考虑的外,还必须用自旋锁排除其他CPU的干扰。五、软中断源码分析之所以说软中断的执行时是串行的,是因为在软中断执行时,对于从硬中断进来的即将要执行的新的软中断会采取屏蔽措施,不让他们立即运行,而是保存起来,延迟一会,等自身的软中断执行完毕后,再执行那些保存起来的软中断,从而达到串

16、行的目的。cpp view pla in copypri nt?1. /2. do_IRQ函数执行完硬件ISR 后退出时调用此函数。3. /4. void irq_exit(void)5. .9.acco un t_system_vtime(curre nt);trace_hardirq_exit();sub_preempt_co un t(IRQ

17、_EXIT_OFFSET);/判断当前是否有硬件中断嵌套,并且是否有软中断在/ pen di ng状态,注意:这里只有两个条件同时满足/时,才有可能调用 do_softirq()进入软中断。也就是/说确认当前所有硬件中断处理完成,且有硬件中断安装了/软中断处理时理时才会进入。/if (!i n_in terrupt() && local_softirq_pe ndin g()/其实这里就是调用 do_softirq()执行/in voke_softirq();preempt_e nable_ no _resched();# ifndef _ARCH_HAS_DO_SOFTIRQ

18、asmli nkage void do_softirq(void)_u32 pending;unsignedlong flags;/这个函数判断,如果当前有硬件中断嵌套,或/有软中断正在执行时候,则马上返回。在这个/入口判断主要是为了和ksoftirqd 互斥。/if (inn terrupt()return;/关中断执行以下代码/local_irq_save(flags);/判断是否有pen di ng 的软中断需要处理。/pending = local_softirq_pe ndin g();/如果有则调用_do_softirq()进行实际处理/if (pe nding)_do_softi

19、rq();/开中断继续执行50. /51. Iocal_irq_restore(flags);52. 53. /54. /最大软中断调用次数为10次。55. /56. #define MAX_SOFTIRQ_RESTART 1057. asmlinkage void _do_softirq(void)58. 59. /60. /软件中断处理结构,此结构中包括了ISR中61. /注册的回调函数。62. /63. structsoftirq_act ion *h;64. _u32 pending;65.intmax_restart = MAX_SOFTIRQ_RESTART;66.intcpu;6

20、7./68./得到当前所有pending的软中断。69./70.pending :=local_softirq_pe ndin g();71. acco un t_system_vtime(curre nt);72. /73. /执行到这里要屏蔽其他软中断,这里也就证实了74. /每个CPU上同时运行的软中断只能有一个。75. /76. _local_bh_disable( un sig nedlong )_built in _retur n_address(0);77. trace_softirq_e nter();78. /79. /针对SMP得到当前正在处理的CPU80. /81. cp

21、u= smp_processor_id();82. /83. / /循环标志84. /85. r estart:86. /87. /每次循环在允许硬件ISR强占前,首先重置软中断88. /的标志位。89. /90. /* Reset the pending bitmask before en abli ng irqs */91. set_softirq_pe ndin g(0);92. /93./到这里才开中断运行,注意:以前运行状态一直是关中断94./运行,这时当前处理软中断才可能被硬件中断抢占。也就95./是说在进入软中断时不是一开始就会被硬件中断抢占。只有96./在这里以后的代码才可能被

22、硬件中断抢占。97./98.local_irq_e nable();99./100./这里要注意,以下代码运行时能被硬件中断抢占,但101./这个硬件ISR执行完成后,他的所注册的软中断无法马上运行,102./别忘了,目前虽是开硬件中断执行,但前面的_local_bh_disable()103./函数屏蔽了软中断。所以这种环境下只能被硬件中断抢占,但这104./个硬中断注册的软中断回调函数无法运行。要问为什么,那是因为105./ _local_bh_disable()函数设置了一个标志当作互斥量,而这个106./标志正是上面的irq exit()和do softirq()函数中的107./in

23、n terrupt()函数判断的条件之一,也就是说in_in terrupt()108./函数不仅检测硬中断而且还判断了软中断。所以在这个环境下触发109.能/硬中断时注册的软中断, 根本无法重新进入到这个函数中来,只日匕110./是做一个标志,等待下面的重复循环(最大 MAX_SOFTIRQ_RESTART)111./才可能处理到这个时候触发的硬件中断所注册的软中断。112./113./114./得到软中断向量表。115./116.h :=softirq_vec;117./118./循环处理所有softirq软中断注册函数。119./120.do 121./122./如果对应的软中断设置pe

24、 ndi ng标志则表明123./需要进一步处理他所注册的函数。124./125.if (pending & 1) 126./127./在这里执行了这个软中断所注册的回调函数。128./129.h->act ion( h);130.rcu_bh_qsctr_ in c(cpu);131.132./133./继续找,直到把软中断向量表中所有pen di ng 的软134./中断处理完成。135./136.h+;137./138./从代码里能看出按位操作,表明一次循环只139./处理32个软中断的回调函数。140./141.pending >>= 1;142. while

25、 (pe ndin g);143./144./关中断执行以下代码。注意:这里又关中断了,下面的145./代码执行过程中硬件中断无法抢占。146./147.local_irq_disable();148./149./前面提到过,在刚才开硬件中断执仃环境时只能被硬件中断150./抢占,在这个时候是无法处理软中断的,因为刚才开中151./断执行过程中可能多次被硬件中断抢占,每抢占一次就有可152./能注册一个软中断,所以要再重新取一次所有的软中断。153./以便下面的代码进行处理后跳回到restart处重复执行。154./155.pending =:local_softirq_pe ndin g()

26、;156./157./如果在上面的开中断执行环境中触发了硬件中断,且每个都158./注册了一个软中断的话,这个软中断会设置pending 位,159./但在当前一直屏敝软中断的环境下无法得到执仃,前面提160./到过,因为irq_exit()和do_softirq()根本无法进入到161./这个处理过程中来。这个在上面周详的记录过了。那么在162./这里又有了一个执行的机会。注意:虽然当前环境一直是163./处于屏敝软中断执行的环境中,但在这里又给出了一个执行164./刚才在开中断环境过程中触发硬件中断时所注册的软中断的165./机会,其实只要理解了软中断机制就会知道,无非是在一些特166./

27、定环境下调用ISR 注册到软中断向量表里的函数而已。167./168./169./如果刚才触发的硬件中断注册了软中断,并且重复执行次数170./没有到10次的话,那么则跳转到restart标志处重复以上171./所介绍的所有步骤:设置软中断标志位,重新开中断执行.172./注意:这里是要两个条件都满足的情况下才可能重复以上步骤。173./174.if (pe nding && -max_restart)175.goto restart;176./177./如果以上步骤重复了10次后更有pending的软中断的话,178./那么系统在一定时间内可能达到了一个峰值,为了平衡这点。1

28、79./系统专门建立了一个 ksoftirqd线程来处理,这样避免在180./定时间内负荷太大。这个ksoftirqd线程本身是个大循环,181./在某些条件下为了不负载过重,他是能被其他进程抢占的,182./但注意,他是显示的调用了 1preempt_xxx()和 schedule。183./才会被抢占和转换的。这么做的原因是因为在他一旦调用184./local_softirq_pe ndi ng()函数检测到有 pen di ng的软中断185./需要处理的时候,则会显示的调用do_softirq()来处理软中186./断。也就是说,下面代码唤醒的ksoftirqd线程有可能会回187./

29、到这个函数当中来,尤其是在系统需要响应非常多软中断的情况188./下,他的调用入口是do_softirq(),这也就是为什么在 do_softirq()189./的入口处也会用inn terrupt()函数来判断是否有软中断190./正在处理的原因了,目的还是为了防止重入。ksoftirqd实现191./看下面对ksoftirqd()函数的分析。192./193.if (pe nding)194./195./此函数实际是调用 wake_up_process()来唤醒 ksoftirqd196./197.wakeup_softirqd();198.trace_softirq_exit();199

30、.acco un t_system_vtime(curre nt);200./201./到取后才开软中断执仃环境,允许软中断执仃。注意:这里202./使用的不是local_bh_enable(),不会再次触发 do_softirq()203./的调用。204./205._local_bh_e nable();206. 207. staticintksoftirqd(void * _bin d_cpu)208. 209./210./显示调用此函数设置当前进程的静态优先级。当然,211./这个优先级会随调度器策略而变化。212./213.set_user_ni ce(curre nt, 19);2

31、14./215./设置当前进程不允许被挂启216./217.curre nt->flags |= PF_NOFREEZE;218./219./设置当前进程状态为可中断的状态,这种睡眠状220./态可响应信号处理等。221./222.set_curre nt_state(TASK_INTERRUPTIBLE);223./224./下面是个大循环,循环判断当前进程是否会停止,225./不会则继续判断当前是否有pen di ng的软中断需226./要处理。227./228.while (!kthread_should_stop() 229./230./如果能进行处理,那么在此处理期间内禁止23

32、1./当前进程被抢占。232./233.preempt_disable();234./235./首先判断系统当前没有需要处理的pen di ng状态的236./软中断237./238.if (!local_softirq_pe ndin g() 239./240./没有的话在主动放弃 CPU前先要允许抢占,因为241./一直是在不允许抢占状态下执行的代码。242./243.preempt_e nable_ no _resched();244./245./显示调用此函数主动放弃 CPU将当前进程放入睡眠队列,246./并转换新的进程执行(调度器相关不记录在此)247./248.schedule(

33、);249./250./注意:如果当前显示调用 schedule。函数主动转换的进251./程再次被调度执行的话,那么将从调用这个函数的下一条252./语句开始执行。也就是说,在这里当前进程再次被执行的253./话,将会执行下面的 preempt_disable()函数。254./255./256./当进程再度被调度时, 在以下处理期间内禁止当前进程257./被抢占。258./259.preempt_disable();260.261./262./设置当前进程为运行状态。注意:已设置了当前进程不可抢占263./在进入循环后,以上两个分支不论走哪个都会执行到这里。一是264./进入循环时就有pe

34、n di ng的软中断需要执行时。二是进入循环时265./没有pen di ng的软中断,当前进程再次被调度获得CPU时继续266./执行时。267./268._set_curre nt_state(TASK_RUNNING);269/270/循环判断是否有pending的软中断,如果有则调用 do_softirq()271/来做具体处理。注意:这里又是个do softirq()的入口点,272/那么在_do_softirq()当中循环处理10 次软中断的回调函数273/后,如果更有pen di ng的话,会又调用到这里。那么在这里则274/又会有可能去调用_do_softirq()来处理软中

35、断回调函数。在前275/面介绍_do_softirq()时已提到过,处理10 次还处理不完的276/话说明系统正处于繁忙状态。根据以上分析,我们能试想如果在277/系统非常繁忙时,这个进程将会和 do_softirq()相互交替执行,278/这时此进程占用 CPU应该会非常高,虽然下面的 con d_resched()279/理进程可能会函数做了一些处理,他在处理完-轮软中断后当前处280/因被调度而减少CPU负荷,不过在非常繁忙时这个进程仍然有可281/能大量占用CPU。282/283while (local_softirq_pe ndin g() 284/* Preempt disable stops cpu going offline.285If already offline.we'll be on wrong CPU:286don 't process */287if (cpu_is_ offlin e(long )_bin d_cpu)288/289/如果当前被关联的CPU无法继续处理则跳转290/到 wait_to_die标记出,等待结束并退出。291/292goto wait_to_die;293/294./执行 do_softirq()来处理具体的软中断回调函数。注295./意:如果此时有一个正在处理的软中断的话,则会马上296./返回,还记得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论