【Linux系统编程】:信号(2)——信号的产生

news/2024/12/23 16:19:03 标签: linux, 运维, 服务器

1.前言

我们会讲解五种信号产生的方式:

  • 通过终端按键产生信号,比如键盘上的Ctrl+C。
  • kill命令。本质上是调用kill()
  • 调用函数接口产生信号
  • 硬件异常产生信号
  • 软件条件产生信号
    前两种在前一篇文章中做了介绍,本文介绍下面三种.

2. 调用函数产生信号

2.1 kill()在这里插入图片描述

sig是信号编码,pid是捕获信号的进程pid。
我们编写一个程序proc.c,

#include <stdio.h>
#include <unistd.h>

int main()
{
    while(1)
    {
        printf("I am a process, pid: %d\n", getpid());
        sleep(1);
    }
}

利用mykill中的kill()杀掉它,

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
using namespace std;
//argv*[]:mykill pid signal
int main(int argc, char const *argv[])
{
    if(argc != 3)
    {
        cout << "usage: ./mykill signal pid" << endl;//告诉用户用法
        exit(1);
    }
    int signo= atoi(argv[1]);
    int pid = atoi(argv[2]);
    int ret = kill(pid, signo);
    if(ret == -1)
    {
        perror("kill");
        exit(2);
    }
    //kill函数返回值:成功返回0,失败返回-1
    return 0;
}

在这里插入图片描述

2.2 raise()

在这里插入图片描述
raise(sig)是对kill(getpid(),sig)的封装。

2.3 abort()

在这里插入图片描述
我们编写代码来测试一下abort函数,

#include <iostream>
#include <cstdlib>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
using namespace std;

void myhandler(int signo)
{
    cout << "process get a signal: " << signo <<endl;
    // exit(1);
}
int main(int argc, char *argv[])
{  
    int cnt = 0;
    while (true)
    {
        cout << "I am a process, pid: " << getpid() << endl;
        sleep(1);
        cnt++;
        if(cnt % 2 == 0) 
        {
            abort();
        }
    }
}

重新编译并运行,在这里插入图片描述
我们怎么确定abort()调用的是6号信号呢?我们可以捕捉6号信号,修改代码为:

//头文件等略
void myhandler(int signo)
{
    cout << "process get a signal: " << signo <<endl;
}
int main(int argc, char *argv[])
{  
    signal(SIGABRT, myhandler);
    int cnt = 0;
    while (true)
    {
        cout << "I am a process, pid: " << getpid() << endl;
        sleep(1);
        cnt++;
        if(cnt % 2 == 0) 
        {
            abort();
        }
    }
}

在这里插入图片描述

SIGABRT确实被捕获到了,可为什么最后还是调用了abort()呢?不是应该一直循环下去吗?
我们将abort()注释掉,换成“kill(getpid(), 6);”,在这里插入图片描述
重新编译运行,在这里插入图片描述
发现程序没有推掉,说明abort()虽然是对SIGABORT的封装,但后面还增加了自己的细节,致使所在进程退出,而SIGABORT不会终止进程,它表示程序出现异常。

3. 硬件异常产生信号

3.1 “除0代码”

我们编写一段“除0代码”

#include <iostream>
#include <unistd.h>

using namespace std;

int main()
{   
    cout << "div before" << endl;
    sleep(5);
    int a = 10;
    a /= 0;//异常
    cout << "div after" << endl;
    sleep(1);
    return 0;
}

编译运行,
在这里插入图片描述
输入指令“man 7 signal”,查阅信号对应的注释,在这里插入图片描述
找到注释对应的信号SIGFPE,在这里插入图片描述
是8号信号中断了该进程。我们尝试捕获*号信号,

#include <iostream>
#include <unistd.h>
#include <signal.h>

using namespace std;

void handler(int signo)
{
	sleep(1);
    cout << "catch signal" << signo << endl;
}
int main()
{   
    signal(SIGFPE,handler);
    cout << "div before" << endl;
    sleep(5);
    
    int a = 10;
    a /= 0;//异常
    cout << "div after" << endl;
    sleep(1);
    return 0;
}

重新编译运行,并监视
在这里插入图片描述
我们发现,当SIGFPE被捕获后,进程不会退出,并且一直执行“自定义行为”(也就是一直打印)。

3.2 “野指针代码”

我们编写一段“野指针代码”,

#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
int main()
{   
    cout << "point error before" << endl;
    sleep(3);
    int *p = nullptr;
    *p = 10;
    cout << "point error after" << endl;
    sleep(1);
    return 0;
}

在这里插入图片描述
段错误是11号信号,也就是内存错误,在这里插入图片描述
我们捕捉该信号,

#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
void handler(int signo)
{
    cout << "catch signal:" << signo << endl;
    sleep(1);
}
int main()
{   
    signal(SIGSEGV,handler);
    cout << "point error before" << endl;
    sleep(3);
    int *p = nullptr;
    *p = 10;
    cout << "point error after" << endl;
    sleep(1);
    return 0;
}

在这里插入图片描述
同样,11号信号被捕捉后,段错误异常就不会终止进程。
所以程序出现异常,进程不一定会被终止,当然,这是因为我们自定义了进程接收到信号后的处理行为。所以一般情况下,进程出现异常了,都会终止。

3.3 为什么“除0、野指针”会让进程终止呢?

这是因为操作系统遇到“除0、野指针”问题,会发送信号给进程,进程处理信号会终止自己。这也说明,不论产生信号的方式是什么,最终都是由操作系统发送信号给进程。
但这不是关键,关键是操作系统怎么知道代码中的“除0、野指针”问题,

  • 对于除0错误:当CPU从上到下执行程序的代码时,如果遇到了除0,CPU中的状态寄存器的溢出标志位就会由0变为1,操作系统就知道CPU当前调度的进程出现了异常(操作系统是硬件的管理者)。注意:寄存器信息是进程的上下文,进程之间是独立的,所以上个进程的溢出标识符为1,并不会影响到下一个进程,更不会让操作系统出错。
    总结:除0问题会被转换成硬件问题,表现在硬件上,从而被操纵系统识别到,操作系统就会处理该问题,该问题并不会影响到操作系统的稳定性,只会影响到当前进程(异常的进程)。
    在这里插入图片描述
    那么我们捕获信号后为什么程序会一直打印而不崩溃呢?
    这是因为问题一直没有被修复,当进程被调度进CPU,状态寄存器"出错",操作系统向当前进程发送信号,进程执行信号打印,打印完后上下文中的错误又没被修复,进程还一直在调度运行中,状态寄存器一直”出错“,操作系统一直发送信号,所以程序一直打印。
    那么捕捉信号不修正问题,为什么还要有“自定义信号处理”的方法呢?
    自定义信号捕捉是为了让用户知道程序为什么崩溃,便于打印日志,以及保存崩溃前的信息。而不是为了让用户直接解决当前的进程异常问题。

  • 对于“野指针”问题,是因为虚拟地址无法经过页表转换为物理内存地址(可能溢出或者没有访问权限),而页表是由MMU维护的,MMU会发送对应的信号被操作系统识别。

4.软件条件产生异常

处理硬件可能产生异常,软件也可能产生异常。比如我们在匿名管道一章讲解的管道四大特征之一:当管道的写端被关闭后,读端的进程会自动退出。这是13号信号SIGPIPE造成的。
软件运行中,可能会出现一些特殊事项,致使软件的一些条件没有被满足,就可能产生异常。
我们拿alarm()举例,

4.1 alarm

alarm() 函数是 Unix 和类 Unix 系统编程中的一个标准函数,它用于设置一个定时器,当定时器到达指定时间后,会向进程发送一个 SIGALRM 信号。这个函数通常用于实现定时任务或超时处理。

函数原型

#include <unistd.h>
unsigned int alarm(unsigned int seconds);

参数

  • seconds:定时器的秒数。如果设置为 0,则会关闭之前设置的定时器。

返回值

  • 返回值是之前定时器剩余的时间(秒),也就是前一个闹钟要响起的剩余时间,防止多个闹钟在同一时间响起。如果之前没有设置定时器,则返回 0。

使用示例

以下是一个简单的 C 程序示例,演示如何使用 alarm() 函数:

#include <iostream>
#include <unistd.h>
using namespace std;

int main()
{   
    int n = alarm(5);//设置一个5秒的闹钟
    while(1)
    {
        cout << "the proc is running" << endl;
        sleep(1);
    }
    return 0;
}

在这里插入图片描述
我们在查一下信号表,在这里插入图片描述
这样我们还不确信,可以捕获该信号测试一下,

#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
void handler(int signo)
{
    cout << "catch a signal,the number:" << signo << endl;
    sleep(1);
}
int main()
{   
    int n = alarm(5);//设置一个5秒的闹钟
    signal(SIGALRM,handler);
    while(1)
    {
        cout << "the proc is running" << endl;
        sleep(1);
    }
 }

在这里插入图片描述
这个闹钟为什么只响一次呢?我们之前的“野指针”和“除0”都不断的打印自定义行为,这个却打印一次,因为闹钟不是异常。
如果我们要让闹钟每隔5秒打印一次,可以在handler()修改为,

void handler(int signo)
{
    cout << "catch a signal,the number:" << signo << endl;
    alarm(5);
}

在这里插入图片描述
我们利用这个原理,可以让进程每隔一段时间执行特定的工作,比如打印日志。

void work()
{
    cout << "print log..." << endl;
}
void handler(int signo)
{
    work();
    cout << "catch a signal,the number:" << signo << endl;
    alarm(5);
}

注意事项

  • alarm() 只能设置以秒为单位的定时器,如果需要更精确的时间控制,可以考虑使用 setitimer()timer_create() 等函数。
  • alarm() 设置的定时器是单次的,如果需要重复触发,需要在信号处理函数中再次调用 alarm()
  • 在多线程程序中使用 alarm() 时要特别小心,因为它是针对整个进程的,可能会影响其他线程的行为。

5. Core dump

在这里插入图片描述
SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump,Core Dump是什么意思呢?
我们在进程等待中也提到过Core Dump,在这里插入图片描述
我们编写一段父进程回收子进程的代码,分别用8号信号和2号信号终止子进程,获取子进程的core dump标志,
在这里插入图片描述
2号信号和8号信号杀死进程的core dump标志确实不一样,那么这个表示到底是什么意思呢?
由于云服务器一般把core file文件的大小设为0(相当于关闭了core dump的功能),或者操作系统重新配置了core文件生成的目录,所以我们用ll查看当前目录,不会看到相关文件,我们可以用ulimit -a查看系统资源的限制信息,其中就包括core文件的大小,然后用“ulimit -c 10240",将core file 的大小设置为10240K,
在这里插入图片描述
然后重新运行程序,再用8号信号杀死,此时如果还看不到相关的core文件,可在命令行输入“sudo bash -c "echo core.%p > /proc/sys/kernel/core_pattern”,core文件不存在的原因
在这里插入图片描述
重新编译再杀死进程,就有对应的core文件了。
所以,一旦打开了系统的core dump功能,某个进程因异常而被Action为core的信号终止时,操作系统就会将进程在内存中的运行信息,dump(转储)到进程的工作目录下(磁盘中),形成core.pid文件。
那么core.pid文件有什么用呢?
该文件保存了程序中断的原因,可以帮助我们更好的识别、修改bug。
在这里插入图片描述

为什么core dump默认是关闭的呢?

在 Linux 系统中,core dump 默认是关闭的,主要原因有以下几点:

  1. 磁盘空间占用:core dump 文件会包含程序在崩溃时的内存映像,包括代码段、数据段、堆、栈等信息,其大小可能非常大,尤其是对于大型应用程序。如果系统中多个程序频繁崩溃并生成 core dump 文件,会占用大量的磁盘空间,影响系统的正常运行和存储资源的使用效率。
  2. 性能影响:生成 core dump 文件需要将大量内存数据写入磁盘,这个过程可能会消耗较多的 I/O 资源,导致系统性能下降。对于一些对性能要求较高的系统或应用程序,这种性能损失是不可接受的。
  3. 安全性考虑:core dump 文件可能包含程序运行时的敏感信息,如用户数据、加密密钥、系统配置等。如果这些文件被未授权的用户访问,可能会导致信息泄露,带来安全隐患。因此,默认关闭 core dump 功能可以在一定程度上保护系统的安全性。
  4. 管理复杂性:如果系统中所有程序都默认开启 core dump 功能,可能会导致生成大量的 core dump 文件,增加了系统管理员管理和分析这些文件的复杂性。管理员需要定期清理这些文件,以避免磁盘空间被占用,同时还需要对每个文件进行分析,以确定程序崩溃的原因,这会消耗大量的时间和精力。

当然,core dump 文件对于程序开发和故障排查是非常有用的,它可以帮助开发者快速定位程序崩溃的原因,提高程序的稳定性和可靠性。因此,在需要调试程序或分析程序崩溃原因时,可以手动启用 core dump 功能,并根据实际情况设置合适的文件大小限制和保存路径。

来源:https://kimi.moonshot.cn/chat/


http://www.niftyadmin.cn/n/5796739.html

相关文章

HarmonyOS NEXT 技术实践-基于意图框架服务实现智能分发

在智能设备的交互中&#xff0c;如何准确理解并及时响应用户需求&#xff0c;成为提升用户体验的关键。HarmonyOS Next 的意图框架服务&#xff08;Intents Kit&#xff09;为这一目标提供了强大的技术支持。本文将通过一个项目实现的示例&#xff0c;展示如何使用意图框架服务…

《开启微服务之旅:Spring Boot 从入门到实践》(三)

自动配置原理 配置文件到底能写什么&#xff1f;怎么写&#xff1f;自动配置原理&#xff1b; https://docs.spring.io/spring-boot/docs/1.5.9.RELEASE/reference/htmlsingle/#common-application-properties 自动配置原理 SpringBoot启动的时候加载主配置类&#xff0c;开启…

【Matlab】绘制混淆矩阵示意图+colormap调整方法

主代码 %https://blog.csdn.net/weixin_42943114/article/details/81811556 %https://blog.csdn.net/Mark711/article/details/141144280 clc clear close all warning off %% 原始数据 % 假设groundTruth和predictions是已经定义好的向量 TrueLabels [1 2 1 3 2 3 1 3 2 1 4…

【落羽的落羽 C语言篇】数据存储简介

文章目录 一、整型提升1. 概念2. 规则 二、大小端字节序1. 概念2. 练习练习1练习2 三、浮点数在内存中的存储1. 规则2. 练习 一、整型提升 1. 概念 C语言中&#xff0c;整型算术运算至少是以“缺省整型类型”&#xff08;int&#xff09;的精度来进行的。为了达到这个精度&am…

Android笔试面试题AI答之Android基础(3)

文章目录 1.谈一谈 Android 的安全机制一、系统架构层面的安全设计二、核心安全机制三、其他安全机制与措施 2.Android 的四大组件是哪四大&#xff1f;3.Android 的四大组件都需要在清单文件中注册吗&#xff1f;4.介绍几个常用的Linux命令一、文件和目录管理二、用户和权限管…

GESP202309 二级【小杨的 X 字矩阵】题解(AC)

》》》点我查看「视频」详解》》》 [GESP202309 二级] 小杨的 X 字矩阵 题目描述 小杨想要构造一个 的 X 字矩阵&#xff08; 为奇数&#xff09;&#xff0c;这个矩阵的两条对角线都是半角加号 &#xff0c;其余都是半角减号 - 。例如&#xff0c;一个 5 5 5 \times 5 5…

C++的封装(十四):《设计模式》这本书

很多C学习者学到对C语言有一定自信后&#xff0c;会去读一下《设计模式》这本书。希望能够提升自己的设计水平。 据我所知&#xff0c;围绕C语言出了很多书。因为正好赶上泡沫经济时代。大家一拥而上&#xff0c;自己半懂不懂就出书&#xff0c;抢着出书收割读者&#xff0c;出…

Java阶段四-SpringBoot02

第4章-第2节 一、知识点 Mybatis-Plus、Lambda 二、目标 理解什么是Mybatis-Plus 理解Mybatis和Mybatis-Plus的区别 学会使用Mybatis-Plus的CRUD 条件构造器的使用 分页查询的使用 三、内容分析 重点 学会使用Mybatis-Plus的CRUD 什么是查询过滤&#xff0c;有什么用…