版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Android - Init进程对信号的处理流程在Android中,当一个进程退出(exit())时,会向它的父进程发送一个SIGCHLD信号。父进程收到该信号后,会释放分配给该子进程的系统资源;并且父进程需要调用wait()或waitpid()等待子进程结束。如果父进程没有做这种处理,且父进程初始化时也没有调用signal(SIGCHLD, SIG_IGN)来显示忽略对SIGCHLD的处理,这时子进程将一直保持当前的退出状态,不会完全退出。这样的子进程不能被调度,所做的只是在进程列表中占据一个位置,保存了该进程的PID、终止状态、CPU使用时间等信息;我们将这种进程称为“Zombie”进程,
2、即僵尸进程。在Linux中,设置僵尸进程的目的是维护子进程的一些信息,以供父进程后续查询获取。特殊的,如果一个父进程终止,那么它的所有僵尸子进程的父进程将被设置为Init进程(PID为1),并由Init进程负责回收这些僵尸进程(Init进程将wait()/waitpid()它们,并清除它们在进程列表中的信息)。由于僵尸进程仍会在进程列表中占据一个位置,而Linux所支持的最大进程数量是有限的;超过这个界限值后,我们就无法创建进程。所以,我们有必要清理那些僵尸进程,以保证系统的正常运作。接下来,我们分析下Init进程是如何处理SIGCHLD信号的。在Init.cpp中,我们是通过signal_h
3、andler_init()来初始化SIGCHLD信号处理的:cpp view plain copy 在CODE上查看代码片派生到我的代码片void signal_handler_init() / Create a signalling mechanism for SIGCHLD. int s2; /socketpair()创造一对未命名的、相互连接的UNIX域套接字 if (socketpair(AF_UNIX, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, 0, s) = -1) ERROR("socketpair failed: %sn&
4、quot;, strerror(errno); exit(1); signal_write_fd = s0; signal_read_fd = s1; / Write to signal_write_fd if we catch SIGCHLD. struct sigaction act; memset(&act, 0, sizeof(act); act.sa_handler = SIGCHLD_handler;/设置信号处理函数句柄,当有信号产生时,会向上面创建的socket写入数据,epoll监控到该socket对中的fd可读时,就会调用注册的函数去处理该事件 act.sa_fla
5、gs = SA_NOCLDSTOP;/设置标志,表示只有当子进程终止时才接受SIGCHID信号 sigaction(SIGCHLD, &act, 0);/初始化SIGCHLD信号处理方式 reap_any_outstanding_children();/处理这之前退出的子进程 register_epoll_handler(signal_read_fd, handle_signal); 我们通过sigaction()函数来初始化信号。在act参数中,指定了信号处理函数:SIGCHLD_handler();如果有信号到来,就会调用该函数处理;同时,在参数act中,我们还设置了SA_NOCL
6、DSTOP标志,表示只有当子进程终止时才接受SIGCHLD信号。Linux中,信号是一种软中断,所以信号的到来会终止当前进程正在处理的操作。所以,我们在注册的信号处理函数中不要调一些不可重入的函数。并且,Linux不会对信号做排队处理,在一个信号的处理期间不管再收到多少个信号,当前信号处理完毕后,内核也只会再发送一个信号给进程;所以这里就存在信号丢失的可能。为了避免丢失信号,我们注册的信号处理函数操作应该越高效、越快越好。而我们处理SIGCHLD信号时,父进程会做等待操作,这个时间是比较长的。为了解决这个问题,上面的信号初始化代码中创建了一对未命名且相关联的本地socket用于线程间通信。注册
7、的信号处理函数是SIGCHLD_handler():cpp view plain copy 在CODE上查看代码片派生到我的代码片static void SIGCHLD_handler(int) if (TEMP_FAILURE_RETRY(write(signal_write_fd, "1", 1) = -1) ERROR("write(signal_write_fd) failed: %sn", strerror(errno); cpp view plain copy 在CODE上查看代码片派生到我的代码片#define TEMP_FAILURE_R
8、ETRY(exp) ( decltype(exp) _rc; do _rc = (exp); while (_rc = -1 && errno = EINTR); _rc; ) 当有信号到来时,只要向socket中写入数据,这个过程是很快的,此时信号的处理就转移到socket的响应中去进行了;这样就不会影响下一个信号的处理。同时,write()函数外围嵌套了一个do.while循环,循环条件是write()发生错误且当前的错误号为EINTR(EINTR :此调用被信号所中断),即当前write()是由于有中断到来而发生错误时,操作将再次执行;其他情况下,write()函数只会执
9、行一次。再初始化完信号处理后,就会调用reap_any_outstanding_children() 处理这之前的进程退出情况:cpp view plain copy 在CODE上查看代码片派生到我的代码片static void reap_any_outstanding_children() while (wait_for_one_process() wait_for_one_process()主要调用waitpid()等待子进程结束,当该进程代表的服务需要重启时,会对它做一些设置、清理工作。最后,通过epoll_ctl()向epoll_fd注册本地socket,监听其是否可读;并注册了epo
10、ll事件的处理函数:cpp view plain copy 在CODE上查看代码片派生到我的代码片register_epoll_handler(signal_read_fd, handle_signal); cpp view plain copy 在CODE上查看代码片派生到我的代码片void register_epoll_handler(int fd, void (*fn)() epoll_event ev; ev.events = EPOLLIN;/对文件描述符可读 ev.data.ptr = reinterpret_cast<void*>(fn);/保存指定的函数指针,用于后
11、续的事件处理 if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, fd, &ev) = -1) /向epoll_fd添加要监听的fd,比如property、keychord和signal事件监听 ERROR("epoll_ctl failed: %sn", strerror(errno); 我们以Zygote进程退出为例,来看下SIGCHLD信号处理的具体流程。Zygote进程在init.rc中被声明为Service并由Init进程创建。当Zygote进程退出时,将向Init进程发送SIGCHLD信号。前面的代码已经完成了信号的初始化操作,
12、所以当信号到来时会调用SIGCHLD_handler()函数处理,它的处理就是直接通过socket写入一个数据就立刻返回;这时,SIGCHLD的处理就转移到socket事件的响应上。我们通过epoll_ctl注册了本地socket,并监听它是否可读;这时由于之前的write()调用,此时socket有数据可读,此刻会调用注册的handle_signal()函数进行处理:cpp view plain copy 在CODE上查看代码片派生到我的代码片static void handle_signal() / Clear outstanding requests. char buf32; read(
13、signal_read_fd, buf, sizeof(buf); reap_any_outstanding_children(); 它会将socket的数据的独到buf中,并调用reap_any_outstanding_children()函数处理子进程的退出及服务的重启操作:cpp view plain copy 在CODE上查看代码片派生到我的代码片static void reap_any_outstanding_children() while (wait_for_one_process() cpp view plain copy 在CODE上查看代码片派生到我的代码片static b
14、ool wait_for_one_process() int status; pid_t pid = TEMP_FAILURE_RETRY(waitpid(-1, &status, WNOHANG);/等待子进程结束,并获取到它的pid进程号,WNOHANG表明若没有进程结束,则立即返回. if (pid = 0) return false; else if (pid = -1) ERROR("waitpid failed: %sn", strerror(errno); return false; service* svc = service_find_by_pid
15、(pid);/根据pid,在链表中找到这个服务信息 std:string name; if (svc) name = android:base:StringPrintf("Service '%s' (pid %d)", svc->name, pid); else name = android:base:StringPrintf("Untracked pid %d", pid); NOTICE("%s %sn", name.c_str(), DescribeStatus(status).c_str(); if (!
16、svc) return true; / TODO: all the code from here down should be a member function on service. /如果该服务进程没有设定SVC_ONESHOT标志,或者设置了SVC_RESTART标志,则先杀掉当前的进程,在重新创建新的进程; /以避免后面重启进程时,因当前服务进程已经存在而发生错误. if (!(svc->flags & SVC_ONESHOT) | (svc->flags & SVC_RESTART) NOTICE("Service '%s' (
17、pid %d) killing any children in process groupn", svc->name, pid); kill(-pid, SIGKILL); / Remove any sockets we may have created. /如果之前为这个服务进程创建过socket,这时我们需要清除掉该socket for (socketinfo* si = svc->sockets; si; si = si->next) char tmp128; snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"
18、;/%s", si->name); unlink(tmp);/删除这个socket设备文件 if (svc->flags & SVC_EXEC) /服务完全退出,清除掉所有信息,并将该服务从svc-slist中移除 INFO("SVC_EXEC pid %d finished.n", svc->pid); waiting_for_exec = false; list_remove(&svc->slist); free(svc->name); free(svc); return true; svc->pid = 0
19、; svc->flags &= (SVC_RUNNING); / Oneshot processes go into the disabled state on exit, / except when manually restarted. /如果该服务进程带有SVC_ONESHOT标志,且没有SVC_RESTART标志,则表明该服务无需重启 if (svc->flags & SVC_ONESHOT) && !(svc->flags & SVC_RESTART) svc->flags |= SVC_DISABLED; / Disa
20、bled and reset processes do not get restarted automatically. /如果服务带有SVC_RESET标志,表示服务无需重启 if (svc->flags & (SVC_DISABLED | SVC_RESET) /从结果看SVC_RESET标志的判断优先级最高 svc->NotifyStateChange("stopped"); return true; /到此,我们可以得知一个服务进程在init.rc中只要没有声明SVC_ONESHOT和SVC_RESET标志,当该进程死亡时,就会被重启; /但是,
21、如果一个服务进程带有SVC_CRITICAL标志,且没有SVC_RESTART标志,当它crash、重启的次数超过4此时,系统会自动重启并进入recovery模式 time_t now = gettime(); if (svc->flags & SVC_CRITICAL) && !(svc->flags & SVC_RESTART) if (svc->time_crashed + CRITICAL_CRASH_WINDOW >= now) if (+svc->nr_crashed > CRITICAL_CRASH_THRESH
22、OLD) ERROR("critical process '%s' exited %d times in %d minutes; " "rebooting into covery moden", svc->name, CRITICAL_CRASH_THRESHOLD, CRITICAL_CRASH_WINDOW / 60); android_reboot(ANDROID_RB_RESTART2, 0, "recovery"); return true; else svc->time_crashed = no
23、w; svc->nr_crashed = 1; svc->flags &= (SVC_RESTART); svc->flags |= SVC_RESTARTING;/为服务加上重启标志,表明它需要重启;后续工作要以此判断 / Execute all onrestart commands for this service. struct listnode* node; list_for_each(node, &svc->mands) /如果服务有onrestart选项,则遍历进程重启时需要执行的命令列表,并执行 command* cmd = node_to
24、_item(node, struct command, clist); cmd->func(cmd->nargs, cmd->args); svc->NotifyStateChange("restarting"); return true; 该函数中的处理主要这几个要点:调用waitpid()等待子进程结束,waitpid()的返回值就是子进程的进程号。如果没有子进程退出,由于设置了WONHANG标志,waitpid()就会立即返回而不会挂起。嵌套的TEMP_FAILURE_RETRY()含义与之前介绍的类似,当waitpid()返回错误且错误码是E
25、INTR,将重复调用itpid()。根据pid,从service_list列表中找到对应进程对应的service信息。如果该服务进程的定义在init.rc中没有设定SVC_ONESHOT标志,或者设置了SVC_RESTART标志,则先杀掉当前的进程,再重新创建新的进程;以避免后面重新创建进程时,因当前服务进程已经存在而发生错误。如果为当前服务创建了socket,则清除这个socket。如果该服务进程带有SVC_ONESHOT标志,且没有SVC_RESTART标志,则表明该服务无需重启。如果服务带有SVC_RESET标志,表示服务无需重启。如果一个服务进程带有SVC_CRITICAL标志,且没有
26、SVC_RESTART标志,当它crash、重启的次数超过4此时,系统会自动重启并进入recovery模式。如果服务判断为需要重启,则为该服务加上重启标志SVC_RESTARTING,表明它需要重新启动;后续工作要以此判断。/重要最后,如果服务有onrestart选项,则遍历服务重启时需要执行的命令列表,并执行这些命令如果这个子进程所代表的服务需要重启,则会为该服务加上SVC_RESTARTING标志。在之前介绍Init进程初始化流程时,我们分析过,当Init进程处理完,它就会进入一个循环化身为守护进程,处理signal、property和keychord等服务:cpp view plain
27、copy 在CODE上查看代码片派生到我的代码片while (true) if (!waiting_for_exec) execute_one_command();/执行命令列表中的命令 restart_processes();/启动服务列表中的进程 int timeout = -1; if (process_needs_restart) timeout = (process_needs_restart - gettime() * 1000; if (timeout < 0) timeout = 0; if (!action_queue_empty() | cur_action) tim
28、eout = 0; bootchart_sample(&timeout);/bootchart是一个用可视化方式对启动过程进行性能分析的工具;需要定时唤醒进程 epoll_event ev; int nr = TEMP_FAILURE_RETRY(epoll_wait(epoll_fd, &ev, 1, timeout);/开始轮询,epoll_wait()等待事件产生 if (nr = -1) ERROR("epoll_wait failed: %sn", strerror(errno); else if (nr = 1) (void (*)() ev.data.ptr)();/调用epoll_event事件存储的函数指针处理事件 其中,它会循环调用restart_processes()去重启在service_list列表中带有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版南京大学与京东集团电商人才培养合作合同4篇
- 2025年度钢管行业市场调研与分析服务合同
- 二零二五年度企业废弃包装物清运合同模板
- 二零二五年度农庄农业保险合同模板
- 2025年度农业科技创新实验基地租赁合同范本3篇
- 二零二五版内参内容策划与制作合同4篇
- 2025年度个人反担保合同模板(保险业务风险防范)
- 二零二五年度泥水工施工技术创新与推广合同4篇
- 二零二五年度现代农业科技项目质押担保合同3篇
- 二零二五年度瓷砖电商平台销售代理合同2篇
- 液化气站其他危险和有害因素辨识及分析
- 建筑工程施工安全管理思路及措施
- 高中语文教学课例《劝学》课程思政核心素养教学设计及总结反思
- 中国农业银行小微企业信贷业务贷后管理办法规定
- 领导干部的情绪管理教学课件
- 初中英语-Unit2 My dream job(writing)教学课件设计
- 市政道路建设工程竣工验收质量自评报告
- 优秀支行行长推荐材料
- 中国版梅尼埃病诊断指南解读
- 暨南大学《经济学》考博历年真题详解(宏观经济学部分)
- 药店员工教育培训资料
评论
0/150
提交评论