SIGSTOP / SIGCONT POSIX行为
我在玩弄信号: SIGSTOP
和SIGCONT
。 这是我写的一个测试程序。 这个想法是创建一个N + 1过程链(包括主过程)。 每个人都必须等待孩子停下来,然后停下来。 当后者停止时,主要过程必须唤醒其孩子。
为此, f
函数递归地创建流程链。 除了最后一个直接停止自己的孩子以外,每个进程都使用SIGCHLD
信号的sigsuspend。 当其孩子停止时,一个进程将收到SIGCHLD
信号,然后它可以停止。 当主进程接收到SIGCHLD
信号时,意味着所有进程都处于停止状态,因此它将SIGCONT
信号发送给其子进程。 每个进程发送SIGCONT
给自己的孩子,然后退出,除了刚刚退出的最后一个孩子。
我试图说清楚:删除了返回代码测试并写了一些评论。
执行程序时,一切似乎SIGCONT
但是SIGCONT
链。 一些进程被唤醒,但不是全部。 看着正在运行的程序(以ps为例),一切都很好:没有被阻塞的进程。 我并没有真正明白这个计划可能会出现什么问题。 任何帮助或暗示都会受到欢迎。
这是一个示例跟踪。 正如您所看到的,“叉式链”运行良好,进程在SIGCHLD
上挂起。 然后最后一个孩子产卵并停止。 这为父母创建了一个“ SIGCHLD
链”,因为每个进程都会停止。 当主进程得到一个SIGCHLD
通知时,它发送SIGCONT
给它的子SIGCHLD
,该子进程被唤醒,并将SIGCONT
发送给它自己的子进程等等。你可以注意到这个链并不完整:
$ ./bin/trycont
n pid log
0 6257 "suspending on SIGCHLD"
1 6258 "suspending on SIGCHLD"
2 6259 "suspending on SIGCHLD"
3 6260 "suspending on SIGCHLD"
4 6261 "suspending on SIGCHLD"
5 6262 "last child - stopping"
4 6261 "got SIGCHLD"
4 6261 "stopping"
3 6260 "got SIGCHLD"
3 6260 "stopping"
2 6259 "got SIGCHLD"
2 6259 "stopping"
1 6258 "got SIGCHLD"
1 6258 "stopping"
0 6257 "got SIGCHLD"
0 6257 "sending SIGCONT to 6258"
1 6258 "awakened - sending SIGCONT to 6259"
2 6259 "awakened - sending SIGCONT to 6260"
# <- not the expected trace
这里是程序: src/trycont.c
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
/* number of created processes with fork
*/
#define N 5
#define printHeader() printf("ntpidtlogn");
#define printMsg(i, p, str, ...) printf("%dt%dt" #str "n", i, p, ##__VA_ARGS__)
void f(int n);
void handler(int sig);
sigset_t set;
struct sigaction action;
int main(int argc, char *argv[])
{
/* mask SIGCHLD
*/
sigemptyset(&set);
sigaddset(&set, SIGCHLD);
sigprocmask(SIG_SETMASK, &set, NULL);
/* handler will be called when SIGCHLD is sent to the process
* during the handler, SIGCHLD will be masked (sa_mask)
*/
action.sa_mask = set;
action.sa_handler = handler;
action.sa_flags = 0;
/* SIGCHLD will trigger action
*/
sigaction(SIGCHLD, &action, NULL);
/* start
*/
printHeader();
f(N);
exit(EXIT_SUCCESS);
}
void f(int n)
{
pid_t p, pc;
int myIndex;
myIndex = N - n;
p = getpid();
if (n == 0)
{
/* last child
*/
printMsg(myIndex, p, "last child - stopping");
kill(p, SIGSTOP);
printMsg(myIndex, p, "END REACHED");
exit(EXIT_SUCCESS);
}
pc = fork();
if (pc == 0)
{
/* recursion
*/
f(n - 1);
/* never reached
* because of exit
*/
}
/* father
*/
/* suspending on SIGCHLD
* need to unmask the signal
* and suspend
*/
printMsg(myIndex, p, "suspending on SIGCHLD");
sigfillset(&set);
sigdelset(&set, SIGCHLD);
sigsuspend(&set);
printMsg(myIndex, p, "got SIGCHLD");
if (n < N)
{
/* child process
* but not last
*/
printMsg(myIndex, p, "stopping");
kill(p, SIGSTOP);
printMsg(myIndex, p, "awakened - sending SIGCONT to %d", pc);
kill(pc, SIGCONT);
}
else
{
/* root process
*/
printMsg(myIndex, p, "sending SIGCONT to %d", pc);
kill(pc, SIGCONT);
}
exit(EXIT_SUCCESS);
}
void handler(int sig)
{
switch (sig)
{
case SIGCHLD:
/* when the process received SIGCHLD
* we can ignore upcoming SIGCHLD
*/
action.sa_handler = SIG_IGN;
sigaction(SIGCHLD, &action, NULL);
break;
default:
break;
}
}
如果你需要的话,这里是一个Makefile:
CC=gcc
DEFINES=-D_POSIX_C_SOURCE
STD=-std=c11 -Wall -Werror
OPTS=-O2
CFLAGS=$(STD) $(DEFINES) $(OPTS) -g
LDFLAGS=
SRC=src
OBJ=obj
BIN=bin
DIRS=$(BIN) $(OBJ)
.PHONY: mkdirs clean distclean
all: mkdirs $(BIN)/trycont
$(BIN)/%: $(OBJ)/%.o
$(CC) $(CFLAGS) $(LDFLAGS) -o $@ $<
$(OBJ)/%.o: $(SRC)/%.c
$(CC) $(CFLAGS) -c -o $@ $<
mkdirs:
- mkdir $(DIRS)
clean:
rm -vf -- $(OBJ)/*.o
distclean: clean
rm -vfr -- $(DIRS)
当第一个进程终止时,你的后代进程中的一些(全部)进程正在死于系统生成的SIGHUP。
这是在某些情况下预期的POSIX行为。
当你从你的shell启动根进程时,它是一个进程组的领导者,它的后代是该组的成员。 当领导者终止时,进程组是孤立的。 当系统检测到任何成员停止的新孤立进程组时,每个进程组成员都会发送一个SIGHUP,然后是一个SIGCONT。
因此,当领导终止时,你的一些后代进程仍然停止,因此每个人都会收到一个SIGHUP,然后是一个SIGCONT,实际上这意味着他们死于SIGHUP。
究竟哪些后代仍然停止(甚至只是快速向着exit()
)前进是一场定时竞赛。 在我的系统中,领导者终止得如此之快以至于没有一个后代能够打印任何东西。