Linux管道編程的“幽靈”：為何我的兄弟進程通信程序會神秘卡死？詳情 - 父進程,子進程,include,代碼人生 web安全工具庫動態日志

動態

詳情

返回

Linux管道編程的“幽靈”：為何我的兄弟進程通信程序會神秘卡死？

05:29 下午 · 11月 15 ,2025

我們已經學會了如何用父子進程模擬 ls | wc -l。現在，讓我們挑戰一個更真實的場景：讓父進程扮演“總指揮”的角色，創建兩個“兄弟”子進程，讓它們一個執行ls，一個執行wc -l，而父進程只負責統籌和善後。

這聽起來只是個小小的改動，但一個“幽靈”般的陷阱正潛伏其中。無數開發者曾在這裏折戟，他們的程序看似完美，卻在運行時神秘地卡住，一動不動。

今天，我們就來當一回偵探，親手編寫這個“問題程序”，重現“案發現場”，然後通過縝密的推理，揪出那個導致程序阻塞的“幽靈”。

一、案情重現：編寫“會卡住”的兄弟進程管道程序

我們的目標很明確：

父進程：創建管道，然後創建兩個子進程，最後等待回收它們。
兄進程：負責執行 ls，將結果寫入管道。
弟進程：負責執行 wc -l，從管道讀取數據。

我們將使用一個經典的 for 循環來創建兩個子進程。

“問題”代碼 (brother_pipe_buggy.c)

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
    int pipefd[2];
    int i;
    pid_t pid;

    if (pipe(pipefd) == -1) {
        perror("pipe error");
        exit(1);
    }

    // 使用循環創建兩個子進程
    for (i = 0; i < 2; i++) {
        pid = fork();
        if (pid == 0) { // 子進程跳出循環
            break;
        }
    }

    if (i == 0) { // 兄進程: ls
        close(pipefd[0]); // 關閉讀端
        dup2(pipefd[1], STDOUT_FILENO);
        close(pipefd[1]);
        execlp("ls", "ls", "-l", NULL); // 使用ls -l讓輸出更明顯
        perror("execlp ls failed");
        exit(1);
    } else if (i == 1) { // 弟進程: wc -l
        close(pipefd[1]); // 關閉寫端
        dup2(pipefd[0], STDIN_FILENO);
        close(pipefd[0]);
        execlp("wc", "wc", "-l", NULL);
        perror("execlp wc failed");
        exit(1);
    } else if (i == 2) { // 父進程
        // 父進程的邏輯在這裏... 看起來什麼都沒做？
        
        wait(NULL);
        wait(NULL);
        printf("Parent: Both children have been reaped.\n");
    }

    return 0;
}

編譯與運行

# 創建一些文件用於測試
touch a.txt b.txt c.txt
gcc brother_pipe_buggy.c -o pipe_buggy
./pipe_buggy

運行結果

(光標在此處閃爍，程序卡住，沒有任何輸出，也不會退出...)

程序卡住了！Ctrl+C強制結束後，我們發現wc -l的計算結果並沒有出現，父進程的回收信息也沒有打印。這就是“案發現場”。

二、案件分析：誰是導致阻塞的“幕後黑手”？

讓我們冷靜下來，分析一下數據流和進程狀態。

兄進程 (ls -l)：它成功地執行了，並將所有文件列表寫入了管道，然後退出了。
弟進程 (wc -l)：它從管道中讀取數據。在讀完了所有ls -l的輸出後，它期望讀到文件結束符（EOF），這樣它才知道數據流結束了，可以進行最終計算並打印結果。
阻塞點：弟進程的read()調用沒有返回0（EOF），而是一直在阻塞等待。

關鍵線索：read()在什麼情況下會從管道阻塞等待？答案是：當管道為空，但至少還有一個進程持有着該管道的寫端文件描述符時。內核認為，“既然還有人能寫，那我就得等，萬一他待會兒就寫數據了呢？”

現在，讓我們來排查“嫌疑人”——誰還拿着管道的寫端（pipefd[1]）不放手？

兄進程？ 它在execlp執行後就被ls覆蓋了，ls執行完就退出了。它的文件描述符已經隨着進程的消亡而關閉。嫌疑排除。
弟進程？ 它在代碼開頭就明智地close(pipefd[1])了。嫌疑排除。
......還有誰？

我們忽略了一個至關重要的角色——父進程！

fork()之後，子進程繼承了父進程的文件描述符表。這意味着：

兄進程有一套pipefd[0]和pipefd[1]。
弟進程有一套pipefd[0]和pipefd[1]。
父進程自己，也保留着最初的那一套pipefd[0]和pipefd[1]！

在我們的“問題代碼”中，父進程自始至終都沒有關閉過它手中的pipefd[0]和pipefd[1]。

真相大白：當ls進程結束後，管道的寫端還有一個持有者——父進程。因此，內核的寫端引用計數不為0。弟進程wc -l讀完所有數據後，read()發現管道空了，但寫端還存在，於是它就陷入了永恆的等待。而父進程呢，它在wait()等待子進程結束，子進程又在等父進程關閉寫端，形成了一個完美的死鎖。

三、撥亂反正：關閉父進程的管道描述符

“幽靈”找到了，解決辦法就非常簡單：父進程作為一個“總指揮”，不參與具體的讀寫，就應該在創建完子進程後，立刻關閉它自己手中所有的管道端口，表明自己“置身事外”。

修正後的代碼 (brother_pipe_fixed.c)

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
    int pipefd[2];
    int i;
    pid_t pid;

    if (pipe(pipefd) == -1) {
        perror("pipe error");
        exit(1);
    }

    for (i = 0; i < 2; i++) {
        pid = fork();
        if (pid == 0) {
            break;
        }
    }

    if (i == 0) { // 兄進程: ls -l
        close(pipefd[0]);
        dup2(pipefd[1], STDOUT_FILENO);
        close(pipefd[1]);
        execlp("ls", "ls", "-l", NULL);
        perror("execlp ls failed");
        exit(1);
    } else if (i == 1) { // 弟進程: wc -l
        close(pipefd[1]);
        dup2(pipefd[0], STDIN_FILENO);
        close(pipefd[0]);
        execlp("wc", "wc", "-l", NULL);
        perror("execlp wc failed");
        exit(1);
    } else if (i == 2) { // 父進程
        // === 關鍵修正 ===
        // 父進程關閉所有管道端口，表明自己不參與通信
        close(pipefd[0]);
        close(pipefd[1]);
        
        printf("Parent: Waiting for children...\n");
        wait(NULL);
        wait(NULL);
        printf("Parent: Both children have been reaped.\n");
    }

    return 0;
}

編譯與運行

gcc brother_pipe_fixed.c -o pipe_fixed
./pipe_fixed

運行結果

Parent: Waiting for children...
       4
Parent: Both children have been reaped.

(注：ls -l的輸出會包含一個總用量行，所以3個文件會輸出4行)

程序流暢運行，結果正確，父進程也成功回收了子進程。案件告破！

四、知識小結：管道編程的黃金法則

知識點	核心內容	考試重點/易混淆點
文件描述符繼承	`fork()`後，子進程獲得父進程文件描述符表的副本。	子進程`close()`不影響父進程，父進程`close()`也不影響子進程。它們是獨立的。
管道讀阻塞	管道為空，但寫端引用計數 > 0，則`read()`阻塞。	`read()`返回0 (EOF) 的唯一條件是所有寫端都已關閉。
父進程的責任	當父進程不參與管道I/O時，必須關閉其繼承的管道兩端。	致命疏忽：忘記關閉父進程的管道FD是導致死鎖的常見原因。
進程回收	父進程必須調用`wait()`或`waitpid()`回收子進程，避免殭屍進程。	有幾個子進程，就應該`wait()`幾次（或使用循環）。
代碼健壯性	始終檢查`pipe()`, `fork()`等系統調用的返回值，進行錯誤處理。	示例代碼為簡化省略了部分檢查，但生產代碼中必不可少。

這個“幽靈”般的bug，本質上源於對Linux文件描述符生命週期理解的偏差。請牢記：每個進程都必須對自己手中的文件描述符負責，用完的、不用的，請立即close()掉。這不僅是良好的編程習慣，更是編寫穩定可靠併發程序的基石。

Linux管道編程的“幽靈”：為何我的兄弟進程通信程序會神秘卡死？_子進程

父進程 , 子進程 , include , 代碼人生

0 用戶, 點贊了這篇動態!

web安全工具庫動態日志

@u_15288375

標簽

代碼人生 (23)

include (11)

父進程 (1)

子進程 (1)

動態

Linux管道編程的“幽靈”：為何我的兄弟進程通信程序會神秘卡死？

一、案情重現：編寫“會卡住”的兄弟進程管道程序

二、案件分析：誰是導致阻塞的“幕後黑手”？

三、撥亂反正：關閉父進程的管道描述符

四、知識小結：管道編程的黃金法則

發表評論

web安全工具庫 動態日志

@u_15288375

標簽

代碼人生 (23)

include (11)

父進程 (1)

子進程 (1)

動態

Linux管道編程的“幽靈”：為何我的兄弟進程通信程序會神秘卡死？

一、 案情重現：編寫“會卡住”的兄弟進程管道程序

二、 案件分析：誰是導致阻塞的“幕後黑手”？

三、 撥亂反正：關閉父進程的管道描述符

四、 知識小結：管道編程的黃金法則

發表 評論

web安全工具庫動態日志

一、案情重現：編寫“會卡住”的兄弟進程管道程序

二、案件分析：誰是導致阻塞的“幕後黑手”？

三、撥亂反正：關閉父進程的管道描述符

四、知識小結：管道編程的黃金法則

發表評論