Linux进程信号

发布于：2025-06-23 ⋅ 阅读:(81) ⋅ 点赞:(0)

目录

信号入门

1. 生活角度的信号

2. 技术应用角度的信号

3. 注意

4. 信号概念

5. 用kill -l命令可以查看系统定义的信号列表

6. 信号处理常见方式概览

产生信号

1. 通过终端按键产生信号

2. 调用系统函数向进程发信号

3. 由软件条件产生信号

4. 硬件异常产生信号

信号捕捉初识

模拟一下野指针异常

总结思考一下

信号处理机制核心逻辑

核心结论

阻塞信号

1. 信号其他相关常见概念

2. 在内核中的表示

3. sigset_t

4. 信号集操作函数

1. int sigemptyset(sigset_t *set)

2. int sigfillset(sigset_t *set)

3. int sigaddset(sigset_t *set, int signo)

4. int sigdelset(sigset_t *set, int signo)

5. int sigismember(const sigset_t *set, int signo)

sigprocmask

sigpending

捕捉信号

1. 内核如何实现信号的捕捉

2. sigaction

可重入函数

volatile

信号入门

1. 生活角度的信号

你在网上买了很多件商品，再等待不同商品快递的到来。但即便快递没有到来，你也知道快递来临时，你该怎么处理快递。也就是你能“识别快递”

当快递员到了你楼下，你也收到快递到来的通知，但是你正在打游戏，需5min之后才能去取快递。那么在在这5min之内，你并没有下去去取快递，但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行，可以理解成“在合适的时候去取”。

在收到通知，再到你拿到快递期间，是有一个时间窗口的，在这段时间，你并没有拿到快递，但是你知道有一个快递已经来了。本质上是你“记住了有一个快递要去取”

当你时间合适，顺利拿到快递之后，就要开始处理快递了。而处理快递一般方式有三种：1. 执行默认动作（幸福的打开快递，使用商品）2. 执行自定义动作（快递是零食，你要送给你的女朋友）3. 忽略快递（快递拿上来之后，扔到床头，继续开一把游戏）

快递到来的整个过程，对你来讲是异步的，你不能准确断定快递员什么时候给你打电话

2. 技术应用角度的信号

1. 用户输入命令,在Shell下启动一个前台进程。

. 用户按下Ctrl-C ,这个键盘输入产生一个硬件中断，被OS获取，解释成信号，发送给目标前台进程

. 前台进程因为收到信号，进而引起进程退出
[hb@localhost code_test]$ cat sig.c 
#include <stdio.h>
 
int main()
{
 while(1){
 printf("I am a process, I am waiting signal!\n");
 sleep(1);
 }
}
 
[lsf@localhost code_test]$ ./sig 
I am a process, I am waiting signal!
I am a process, I am waiting signal!
I am a process, I am waiting signal!
^C
[lsf@localhost code_test]$ 
请将生活例子和 Ctrl-C 信号处理过程相结合，解释一下信号处理过程：进程就是你，操作系统就是快递员，信号就是快递

3. 注意

1. Ctrl-C 产生的信号只能发给前台进程。一个命令后面加个&可以放到后台运行,这样Shell不必等待进程结束就可以接受新的命令,启动新的进程。

2. Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像 Ctrl-C 这种控制键产生的信号。

3. 前台进程在运行过程中用户随时可能按下 Ctrl-C 而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到 SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步 (Asynchronous)的。

4. 信号概念

信号是进程之间事件异步通知的一种方式，属于软中断。

5. 用kill -l命令可以查看系统定义的信号列表

每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到,例如其中有定义 #define SIGINT 2

编号34以上的是实时信号,本章只讨论编号34以下的信号,不讨论实时信号。这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal

6. 信号处理常见方式概览

(sigaction函数稍后详细介绍),可选的处理动作有以下三种:

1. 忽略此信号。

2. 执行该信号的默认处理动作。

3. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉 (Catch)一个信号。

产生信号

1. 通过终端按键产生信号

SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump。

Core Dump

首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误, 事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug（事后调试）。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的, 因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K: $ ulimit -c 1024

然后写一个死循环程序:

前台运行这个程序,然后在终端键入Ctrl-C（貌似不行）或Ctrl-\（介个可以）:

ulimit命令改变了Shell进程的Resource Limit,test进程的PCB由Shell进程复制而来,所以也具有和Shell进程相同的Resource Limit值,这样就可以产生Core Dump了。使用core文件：

我们只需要在gdb上使用core-file [core文件名]就可以快速定位到错误代码地方。

2. 调用系统函数向进程发信号

首先在后台执行死循环程序,然后用kill命令给它发SIGSEGV信号。

4568是test进程的id。之所以要再次回车才显示 Segmentation fault ,是因为在4568进程终止掉之前已经回到了Shell提示符等待用户输入下一条命令,Shell不希望Segmentation fault信息和用户的输入交错在一起,所以等用户输入命令之后才显示。

指定发送某种信号的kill命令可以有多种写法,上面的命令还可以写成 kill -SIGSEGV 4568 或 kill -11 4568 , 11是信号SIGSEGV的编号。以往遇到的段错误都是由非法内存访问产生的,而这个程序本身没错, 给它发SIGSEGV也能产生段错误。

kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。raise函数可以给当前进程发送指定的信号(自己给自己发信号)。
#include <signal.h>
int kill(pid_t pid, int signo);  // 向指定进程发送信号
int raise(int signo);            // 向当前进程发送信号
这两个函数都是成功返回0,错误返回-1。
abort函数使当前进程接收到信号而异常终止。
#include <stdlib.h>
void abort(void);
就像exit函数一样,abort函数总是会成功的,所以没有返回值。
3. 由软件条件产生信号

SIGPIPE是一种由软件条件产生的信号,在“管道”中已经介绍过了。咱们主要介绍alarm函数和SIGALRM信号。
#include <unistd.h>
unsigned int alarm(unsigned int seconds);
调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动
作是终止当前进程。
这个函数的返回值是0或者是以前设定的闹钟时间还余下的秒数。打个比方,某人要小睡一觉,设定闹钟为30分钟之后响,20分钟后被人吵醒了,还想多睡一会儿,于是重新设定闹钟为15分钟之后响,“以前设定的闹钟时间还余下的时间”就是10分钟。如果seconds值为0,表示取消以前设定的闹钟,函数的返回值仍然是以前设定的闹钟时间还余下的秒数。

4. 硬件异常产生信号

硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。

信号捕捉初识
#include <stdio.h>
#include <signal.h>
 
void handler(int sig)
{
 printf("catch a sig : %d\n", sig);
}
 
int main()
{
 signal(2, handler); //前文提到过，信号是可以被自定义捕捉的，siganl函数就是来进行信号捕捉的，提前了
解一下
 while(1);
 return 0;
}
 
[lsf@localhost code_test]$ ./sig 
^Ccatch a sig : 2
^Ccatch a sig : 2
^Ccatch a sig : 2
^Ccatch a sig : 2
^\Quit (core dumped)
[hb@localhost code_test]$ 
我们会发现我们ctrl+c无法终止进程了，因为被我们自定义动作处理了。

模拟一下野指针异常
//默认行为
[hb@localhost code_test]$ cat sig.c 
#include <stdio.h>
#include <signal.h>
 
void handler(int sig)
{
 printf("catch a sig : %d\n", sig);
}
 
int main()
{
 //signal(SIGSEGV, handler);
 sleep(1);
 int *p = NULL;
 *p = 100;
 
 while(1);
 return 0;
}
[lsf@localhost code_test]$ ./sig 
Segmentation fault (core dumped)
[lsf@localhost code_test]$ 
 
//捕捉行为
[hb@localhost code_test]$ cat sig.c 
#include <stdio.h>
#include <signal.h>
 
void handler(int sig)
{
 printf("catch a sig : %d\n", sig);
}
 
int main()
{
 signal(SIGSEGV, handler);
 sleep(1);
 int *p = NULL;
 *p = 100;
 
 while(1);
 return 0;
}
[lsf@localhost code_test]$ ./sig 
[lsf@localhost code_test]$ ./sig 
catch a sig : 11
catch a sig : 11
catch a sig : 11
由此可以确认，我们在C/C++当中除零，内存越界等异常，在系统层面上，是被当成信号处理的。

总结思考一下

上面所说的所有信号产生，最终都要有OS来进行执行，为什么？OS是进程的管理者

信号的处理是否是立即处理的？在合适的时候

信号如果不是被立即处理，那么信号是否需要暂时被进程记录下来？记录在哪里最合适呢？是的。如果进程当前无法立即处理信号（例如信号被阻塞，或进程正在执行不可中断的系统调用），内核会将该信号标记为 "pending"（待处理），暂时记录下来。由内核在进程的 Pending Signal Set（待处理信号集） 中记录。这是每个进程独有的内核数据结构，用于存储已到达但未被处理的信号。

一个进程在没有收到信号的时候，能否能知道，自己应该对合法信号作何处理呢？进程 即使未收到信号，也能预先知道所有合法信号的处理方式，这是通过内核为每个进程维护的 信号处理表（Signal Disposition Table） 实现的。

如何理解OS向进程发送信号？能否描述一下完整的发送处理过程？

信号处理机制核心逻辑

信号生成

来源：用户（Ctrl+C）、系统调用（kill）、内核事件（子进程退出）、硬件异常（除零错误）。

类型：标准信号（1-31，如 SIGINT）、实时信号（34-64，如 SIGRTMIN）。

信号记录

Pending Set（待处理集合）：信号生成后暂存于此，等待递送。

Blocked Mask（阻塞掩码）：屏蔽指定信号（暂不递送，但保留在 Pending Set 中）。

实时信号：可排队（不丢失），标准信号：可能合并（仅保留一次）。

信号处理

处理方式表（Signal Disposition）：每个信号对应三种行为：

默认（如终止、忽略）、

忽略（显式丢弃）、

自定义处理函数（用户注册的 Handler）。

触发时机：进程从内核态返回用户态时（如系统调用结束、中断处理完成）。

内核流程

发送信号：kill → 权限检查 → 标记目标进程的 Pending Set。

递送信号：检查未被 Blocked 的信号 → 查处理表 → 执行默认 / 自定义操作。

处理结束：若为自定义 Handler，执行后通过 sigreturn 系统调用恢复现场。

核心结论

信号是异步事件：进程无法预知何时收到信号，但通过 处理方式表 预定义应对逻辑。

内核管理状态：通过 Pending Set 记录待处理信号，Blocked Mask 控制递送，处理表 决定行为。

实时性差异：实时信号可靠（排队），标准信号可能丢失（合并）。

阻塞信号

1. 信号其他相关常见概念

实际执行信号的处理动作称为信号递达(Delivery)

信号从产生到递达之间的状态,称为信号未决(Pending)。

进程可以选择阻塞 (Block )某个信号。

被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.

注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

2. 在内核中的表示

信号在内核中的表示示意图

每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。

SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。

SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。

3. sigset_t

从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

4. 信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。

1. int sigemptyset(sigset_t *set)

功能：初始化 set 为空集合（不包含任何信号）。

参数：set 为待初始化的信号集指针。

返回值：成功返回 0，失败返回 -1 并设置 errno。

示例：
sigset_t mask;
sigemptyset(&mask);  // mask = ∅
2. int sigfillset(sigset_t *set)

功能：初始化 set 为包含所有合法信号的集合。

参数：set 为待初始化的信号集指针。

返回值：成功返回 0，失败返回 -1 并设置 errno。

示例：
sigset_t all_signals;
sigfillset(&all_signals);  // all_signals = {所有信号}
3. int sigaddset(sigset_t *set, int signo)

功能：将信号 signo 添加到集合 set 中。

参数：

set：目标信号集指针。

signo：信号编号（如 SIGINT、SIGTERM）。

返回值：成功返回 0，失败返回 -1（如 signo 无效）。

示例：
sigaddset(&mask, SIGINT);  // mask = {SIGINT}
4. int sigdelset(sigset_t *set, int signo)

功能：从集合 set 中移除信号 signo。

参数：同 sigaddset。

返回值：成功返回 0，失败返回 -1。

示例：
sigdelset(&mask, SIGTERM);  // 如果 mask 包含 SIGTERM，则移除它
5. int sigismember(const sigset_t *set, int signo)

功能：检查信号 signo 是否在集合 set 中。

参数：同 sigaddset。

返回值：

1：信号在集合中。

0：信号不在集合中。

-1：错误（如 signo 无效）。

示例：
if (sigismember(&mask, SIGQUIT) == 1) {
    printf("SIGQUIT 在集合中\n");
}
sigprocmask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。
#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 
返回值:若成功则为0,若出错则为-1 
如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。

sigpending
#include <signal.h>
sigpending
读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。 下面用刚学的几个函数做个实验。程
序如下:
程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会使SIGINT信号处于未决状态,按Ctrl-\仍然可以终止程序,因为SIGQUIT信号没有阻塞。

捕捉信号

1. 内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。当前正在执行 main函数,这时发生中断或异常切换到内核态。在中断处理完毕后要返回用户态的main函数之前检查到有信号 SIGQUIT递达。内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler 和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。如果没有新的信号要递达,这次再返回用户态就是恢复 main函数的上下文继续执行了。

2. sigaction
#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact); 
sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo 是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:

将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。

当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_ﬂags字段包含一些选项,本章的代码都把sa_ﬂags设为0,sa_sigaction是实时信号的处理函数,本章不详细解释这两个字段,有兴趣的同学可以在了解一下。

可重入函数

main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从 sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。

像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之, 如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。想一下,为什么两个不同的控制流程调用同一个函数,访问它的同一个局部变量或参数就不会造成错乱？因为局部变量的生命周期只在函数创建时的栈区有效。

如果一个函数符合以下条件之一则是不可重入的:

调用了malloc或free,因为malloc也是用全局链表来管理堆的。

调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile

该关键字在C当中我们已经有所涉猎，今天我们站在信号的角度重新理解一下
[lsf@localhost code_test]$ cat sig.c 
#include <stdio.h>
#include <signal.h>
 
int flag = 0;
 
void handler(int sig)
{
 printf("chage flag 0 to 1\n");
 flag = 1;
}
 
int main()
{
 signal(2, handler);
 while(!flag);
 printf("process quit normal\n");
 return 0;
}
 
[lsf@localhost code_test]$ cat Makefile 
sig:sig.c
 gcc -o sig sig.c #-O2
.PHONY:clean
clean:
 rm -f sig
 
[slf@localhost code_test]$ ./sig 
^Cchage flag 0 to 1
process quit normal
标准情况下，键入 CTRL-C ,2号信号被捕捉，执行自定义动作，修改 flag＝1 ， while 条件不满足,退出循环，进程退出

这个时候我们把Makefile文件里的#-02解放开，让编译器采用2级优化的方式优化。
[lsf@localhost code_test]$ ./sig 
^Cchage flag 0 to 1
^Cchage flag 0 to 1
^Cchage flag 0 to 1
优化情况下，键入 CTRL-C ,2号信号被捕捉，执行自定义动作，修改 flag＝1 ，但是 while 条件依旧满足,进程继续运行！但是很明显ﬂag肯定已经被修改了，但是为何循环依旧执行？很明显， while 循环检查的ﬂag，并不是内存中最新的ﬂag，这就存在了数据二异性的问题。 while 检测的ﬂag其实已经因为优化，被放在了 CPU寄存器当中。如何解决呢？很明显需要 volatile
volatile int flag = 0;
volatile 作用：保持内存的可见性，告知编译器，被该关键字修饰的变量，不允许被优化，对该变量的任何操作，都必须在真实的内存中进行操作