操作系统额外内容 - 基本 TCP 套接字编程

参考书籍：UNIX网络编程卷1：套接字联网API（第3版）

参考文献

基本 TCP 套接字编程

基本 TCP 客户端/服务器常用函数

`sockaddr` 结构体

往下的 sockaddr 为一个通用的地址结构体，为多种通信域提供一个统一的接口。我们一般使用它的子类。它的内容为

struct sockaddr {
    sa_family_t sa_family;  // 地址族（如 AF_INET、AF_UNIX、AF_INET6）
    char        sa_data[14];// 存放具体的地址数据（IP+端口/本地路径等），长度14字节
};

IPv4 专用的“子类”为

struct sockaddr_in {
    sa_family_t    sin_family;   // 必须设为 AF_INET（IPv4 地址族）
    in_port_t      sin_port;     // 端口号（网络字节序，2字节）
    struct in_addr sin_addr;     // IPv4 地址（4字节）
    unsigned char  sin_zero[8];  // 填充字节，使整体大小和 sockaddr 一致（14+2=16字节）
};

// 嵌套的 in_addr 结构体（存放 IPv4 地址）
struct in_addr {
    in_addr_t s_addr;  // IPv4 地址（32位无符号整数，网络字节序）
};

sin_zero 一般直接 memset() 置0即可。

IPv6 则使用 sockaddr_in6，本地 Unix 域通信则为 sockaddr_un。

`socket`

为了执行网络 IO，一个进程必须要做的第一件事就是调用 socket 函数，指定期望的通信协议类型。它是所有 UNIX 客户端/服务端收发的起点。但它仅创建端点，需要配合其他函数才能完成完整的通信流程。

#include<sys/socket.h>
int socket (
    int family, // 协议簇，也叫协议域
    int type, // 套接字类型
    int protocol // 某个协议类型常值
);

`family`	说明
`AF_INET`	IPv4 协议
`AF_INET6`	IPv6 协议
`AF_LOCAL`	Unix 域协议
`AF_ROUTE`	路由套接字

`type`	说明
`SOCK_STREAM`	字节流套接字
`SOCK_DGRAM`	数据报套接字
`SOCK_RAW`	原始套接字

`AF_INET`/`AF_INET6` 的 `protocol` 常值	说明
`IPPROTO_CP`	TCP
`IPPROTO_UDP`	UDP
`IPPROTO_SCTP`	SCTP

若成功，则为非负描述符，和文件描述符类似，成为套接字描述符；若出错，则为-1。

AF_ 前缀表示地址族，PF_ 前缀表示协议族。书中仅使用 AF_ 常值。

`connect`

该函数用于建立与 TCP 服务器的链接。

#include<sys/socket.h>
int connect (
    int sockfd, // socket 函数返回的套接字描述符
    const struct sockaddr *sockaddr, // 套接字地址结构的指针
    socklen_t addrlen // 该结构的大小
);

函数若成功则返回0；出错则返回1。

客服端在调用 connect 函数前不一定需要调用 bind 函数，因为内核会确定源 IP 地址并选择一个临时端口作为源端口。如果是 TCP，该函数将激发 TCP 的三次握手过程，并且在建立成功或出错后才返回。

若 TCP 客户没有收到 SYN 分节的回应，则在一定时间后重发。重发一定次数后仍未回应，则返回 ETIMEDOUT 错误。
若对 SYN 的响应是 RST （复位），则表明服务器主机在我们指定的端口上没有进程，则立即返回 ECONNREFUSED 错误。
SYN 在某个路由器上引发了一个 destination unreachable 这种 ICMP 错误，客户主机内核保存该信息，并在和第一种情况相同的时间间隔下重发。若仍是这种情况则返回 EHOSTUNREEACH 或 ENETUNREACH 错误。

该函数会导致当前 socket 从 CLOSED 状态转为 SYN_SENT 状态，若成功则转为 ESTABLISHED 状态。若失败则该套接字不可用，必须先 close 当前的套接字描述符并重新调用 socket。

`bind`

该函数将一个本地协议地址赋予一个套接字。

#include<sys/socket.h>
int bind (
    int sockfd, // socket 函数返回的套接字描述符
    const struct sockaddr *myaddr, // 指向特定于协议的地址结构的指针
    socklen_t addrlen // 该地址结构的长度
)

使用该函数，可以指定一个端口号，可以指定一个 IP 地址，也可以什么都不指定。服务端不指定时，listen 函数会为其自动给一个接口。但一般不这么做，因为服务器一般是通过一个众所周知的接口来被访问的。

`listen`

该函数仅由 TCP 服务器调用，主要做两件事情：

socket 函数通常被假设为一个主动套接字，listen 函数将一个未连接的套接字转换成被动套接字，指示内核应接受指向该套接字的连接请求。调用该函数会使得套接字从 closed 状态转为 listen 状态。

主动套接字只能用于发起连接，无法接受链接；被动套接字创建时，会告诉内核，该套接字需要监听指定接口的请求。
规定内核应该为相应套接字排队的最大连接数。

#include<sys/socket.h>
int listen (
    int sockfd, // socket 函数返回的套接字描述符
    int backlog // 内核为该套接字维护的连接队列最大长度，现代系统中为“已完成队列”的上限
)

backlog 参数通常在老系统中通常设为5或10，但这在现代系统中肯定是不够的。不同系统的值也不一样。当一个客户的 SYN 到达时，若队列是满的，TCP 就忽略该分节，不发送 RST。这么做是因为，这种情况是暂时的，客户 TCP 会重发 SYN。要是服务器发 RST，客户就不知道这个 RST 是代表“该端口没有进程在监听”还是代表“有进程但队列满了”。

成功时返回0，失败时返回1。

未完成连接队列 指已由某个客户发出并到达服务器，而服务器还在等待完成响应的 TCP 三路握手过程的 SYN 分节，这些套接字处于 SYN_RCVD 状态。
已完成连接队列 指每个已完成 TCP 三路握手过程的客户，这些套接字处于 ESTABLISHED 状态。

当来自客户的 SYN 到达时，TCP 在未完成连接队列中创建一个新项，然后进行三路握手中的回应。当三路握手中的第三次到达后，该项就从未完成连接队列移到已完成连接队列的末尾。当进程调用 accept 时，已完成连接队列中的队头项将返回给进程。

`accept`

该函数由 TCP 服务器调用，用于从已完成连接队列队头返回下一个已完成链接。若此队列为空则进程被投入睡眠。

#include<sys/socket.h>
int accept (
    int sockfd,
    struct sockaddr *cliaddr,
    socklen_t *addrlen
)

第二个参数是输出型参数，函数返回时，内核会把发起连接的客户端的 IP 地址、端口等信息填充到这个结构体中。

第三个参数输入输出都要用，输入时，告诉内核 *cliaddr 这个结构体的大小；输出时，内核返回实际填充的地址结构体长度。

若该函数执行成功，其返回值就是有内核自动生成的一个全新描述符，代表与所返回客户的 TCP 链接。第一个叫做监听套接字描述符，返回值为已连接套接字描述符。当服务器完成对某个给定客户的服务时，相应的已连接套接字就被关闭。

该函数的第三个参数称为 值-结果参数。该概念指某个参数是“双向的”，既能给函数传值，又能从函数拿结果。内核设计这个机制，核心是解决缓冲区大小不固定的问题。网络编程中，地址结构体有很多种，内核又不知道你给这个函数的结构体是什么，所以需要先手动指定。内核写完后，需要告知“实际写了多少”，避免其他程序读取超出实际数据长度的内容。

`close`

关闭一个 socket。

1 2	`#include<unistd.h> int close (int sockfd);`

成功返回0，出错返回-1。

`getsockname` 和 `getpeername` 函数

这两个函数返回和某个套接字关联的本地协议地址，或者和某个套接字关联的外地协议地址

1
2
3

#include<sys/socket.h>
int getsockname(int sockfd, struct sockaddr *localaddr, socklen_t *addrlen);
int getpeername(int sockfd, struct sockaddr *peeraddr, socklen_t *addrlen);

成功则返回0，失败返回-1。这两个函数的最后一个参数都是值-结果参数。

程序示例

在该示例中，我们将实现一个简单的回射服务器，其数据流向如下：

简单的回射客户/服务器

服务器程序：`main`

#include    "unp.h"

int
main(int argc, char **argv)
{
    int     listenfd, connfd;
    pid_t   childpid;
    socklen_t clilen;
    struct sockaddr_in cliaddr, servaddr;

    listenfd = Socket(AF_INET, SOCK_STREAM, 0);

    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
    servaddr.sin_port = htons(SERV_PORT);

    Bind(listenfd, (SA *) &servaddr, sizeof(servaddr));

    Listen(listenfd, LISTENQ);

    for ( ; ; ) {
        clilen = sizeof(cliaddr);
        connfd = Accept(listenfd, (SA *) &cliaddr, &clilen);

        if ( (childpid = Fork()) == 0) {    /* 子进程 */
            Close(listenfd);    /* 关闭监听状态下的 socket */
            str_echo(connfd);   /* 处理请求 */
            exit(0);
        }
        Close(connfd);          /* 父进程关闭 socket */
    }
}

首先通过 socket、bind、listen 方法创建一个监听套接字，然后通过外层无限循环调用 accept，阻塞等待新的客户端链接。每当有客户端链接到达时，accept 返回一个新的链接 socket，用于与该客户端链接。

然后通过 fork 创建子进程，并发处理多个客户端。子进程关闭监听 socket（子进程不需要监听新连接），然后调用 str_echo(connfd)，从客户端读取数据。完成后调用 exit(0) 结束进程。父进程关闭该 socket，然后继续回到循环，等待下一个客户链接。

close 关闭的是文件描述符的引用，而非销毁底层的 socket 资源。只有引用计数为0时，操作系统才会销毁 socket。子进程需要的是 connfd，父进程需要的是 listenfd，现在子进程关闭的是父进程中 listenfd 的引用，父进程关闭的是 connfd 的引用。这样一番操作后，只有父进程有 listenfd 的引用，子进程由于已经退出，也就不引用 connfd 了，因此子进程退出后，connfd 自然销毁。

服务器程序：`str_echo`

#include    "unp.h"

void
str_echo(int sockfd)
{
    ssize_t n;
    char    buf[MAXLINE];

again:
    while ((n = read(sockfd, buf, MAXLINE)) > 0)
        Writen(sockfd, buf, n);

    if (n < 0 && errno == EINTR)
        goto again;
    else if (n < 0)
        err_sys("str_echo: read error");
}

其中，read 函数表示从传入的链接套接字 sockfd 中读取最多 MAXSIZE 字节的数据发缓冲区中，返回实际读取的字节数 n。然后再 write 写回去。

客户端程序

main 函数：

#include    "unp.h"

int
main(int argc, char **argv)
{
    int                 sockfd;
    struct sockaddr_in  servaddr;

    if (argc != 2)
        err_quit("usage: tcpcli <IPaddress>");

    sockfd = Socket(AF_INET, SOCK_STREAM, 0);

    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(SERV_PORT);
    Inet_pton(AF_INET, argv[1], &servaddr.sin_addr);

    Connect(sockfd, (SA *) &servaddr, sizeof(servaddr));

    str_cli(stdin, sockfd);    /* 全干了 */

    exit(0);
}

由于此处客户端只需要链接并发一条信息，等待回应即可，因此也就不需要循环了。

str_cli 函数

#include    "unp.h"

void
str_cli(FILE *fp, int sockfd)
{
    char    sendline[MAXLINE], recvline[MAXLINE];

    while (Fgets(sendline, MAXLINE, fp) != NULL) {

        Writen(sockfd, sendline, strlen(sendline));

        if (Readline(sockfd, recvline, MAXLINE) == 0)
            err_quit("str_cli: server terminated prematurely");

        Fputs(recvline, stdout);
    }
}

处理 `SIGCHLD` 信号

然而这个简单的实现存在一个问题：在服务器子进程终止时，会给父进程发送一个 SIGCHLD 信号。然而，父进程没有捕获这一信号，子进程进入僵死(zombie) 状态。该状态下的子进程会占用内核空间。

要解决这个问题，核心是让父进程捕获该信号，并再信号处理函数中调用 waitpid() 回收所有终止的子进程。

`wait` 和 `waitpid`

1 2	`pid_t wait (int statloc); pid_t waitpid (pid_t pid, int statloc, int options);`

这两个函数均用于在等待某个子进程停止后回收资源并返回其 pid。这两个函数均返回两个值：出参返回的是已终止子进程的 pid 号，以及通过 statloc 指针返回的子进程终止状态，为一个整数。这个整数辨别子进程是正常终止、由某个进程杀死还是由作业控制停止。

waitpid 的 pid 参数的取值范围如下

`pid`	说明
`pid > 0`	等待的 pid 等于该值的子进程
`pid = 0`	等待与当前进程同组的子进程
`pid = -1`	等待任意子进程
`pid < -1`	等待组 id 等于 pid 绝对值的任意子进程

option 参数有以下几种：

`option`	说明
`WHOHANG`	非阻塞模式，若子进程未终止，直接返回0，不阻塞
`WUNTRACED`	除了终止的子进程，还会返回被暂停的子进程的状态
`WCONTINUED`	返回被恢复运行的子进程状态，需结合信号使用

二者的差别如下

特性	`wait`	`waitpid`
等待范围	任意子进程	可指定特定 pid/进程组的子进程
阻塞行为	始终阻塞，直到有进程组终止	可实现非阻塞
返回值	终止子进程的 pid，若无则返回-1	终止子进程的 pid，非阻塞无终止进程返回0，出错返回-1
灵活性	仅能等任意子进程	可筛选、非阻塞、监控暂停/恢复状态

wait 只能等待简单场景，但 waitpid 适用于需要等待特定子进程，非阻塞，需要监控状态等场景。

信号处理函数

void sig_chld(int signo)
{
    pid_t pid;
    int stat;
    // WNOHANG：非阻塞模式，回收所有已终止的子进程，不阻塞等待
    while ((pid = waitpid(-1, &stat, WNOHANG)) > 0) {
        printf("child %d terminated\n", pid);
    }
    return;
}

同时在主函数的适当地方（循环外，初始化过程中），使用 signal 函数注册 SIGCHLD 信号处理函数。

1	`Signal(SIGCHLD, sig_chld);`

`accept` 返回前链接终止

三次握手完成，链接建立后，客户端却发了一个 RST。在服务端视角来看，就是在该链接已由 TCP 排队，等着服务器调用 accept 时 RST 到达。此时客户端主动终止连接，内核中已建立的“半开链接”会被清理。当服务器后续调用 accept 时，内核会返回 ECONNABORTED 错误。

解决方案也很简单，在 accept 处增加错误判断，若捕获到这个报错就直接跳过循环，重新 accept 即可。

服务器进程直接终止

客户端一直阻塞在 while(Fgets(...)) 循环中，等待用户信息。然而此时服务器被直接 kill -9 了，没有主动调用 close(sockfd)，此时客户端就一直被卡在了等待信息这一栏。

原因是“服务器挂了”是网络层的事，但 fgets 是本地输入层的事，二者默认互不干扰。

其全过程如下

阶段	服务器端	客户端端	关键说明
初始状态	服务器正常运行，和客户端已建立 TCP 连接	客户端执行到 `str_cli` 的 `Fgets` 行，阻塞等待用户从键盘输入	此时客户端的阻塞是正常的———它本来就该等用户输入，和服务器无关
服务器被终止	管理员执行 `kill -9` 服务器 PID，服务器进程直接被内核终止；内核清理服务器的套接字资源，给客户端发送 RST 包	客户端内核收到 RST 包，标记客户端的 sockfd 为 “连接重置” 状态；但客户端进程还卡在 `Fgets` 处，完全没感知到这个变化	客户端进程的执行流还没走到 “网络操作”（读 / 写 sockfd），所以不知道连接已断
客户端持续阻塞	服务器已彻底退出，TCP 连接已失效	客户端依然阻塞在 `Fgets`，直到用户主动输入内容 / 按 `Ctrl+D`；	`Fgets` 只关心键盘，不管网络 —— 哪怕连接断了，只要用户不输入，就一直堵着
（补充）用户输入后才会发现异常	-	用户终于输入一行内容并回车，`Fgets` 返回，客户端执行 Writen 向 sockfd 写数据；此时客户端内核发现 sockfd 已被重置，Writen 会返回 `EPIPE` 错误（Broken pipe）	只有当客户端尝试写网络时，才会发现 “连接已断”—— 但在这之前，`Fgets` 早就堵死了

这里的问题在于，客户实际上正在同时应对两个描述符——套接字和用户输入，它不能单纯阻塞在这两个源中某个特定源的输入上。而是应该阻塞在任意一个源的输入上。事实上这正是 select 和 poll 这两个函数的目的之一。

若客户不理会这里产生的错误，反而继续写入，那又会发生什么呢？当一个进程向某个已收到 RST 的套接字执行写操作时，内核会向进程发送一个 SIGPIPE 信号。该信号的默认行为是终止进程。无论进程是否处理该信号，写操作都将返回 EPIPE 错误，只不过处理信号后就接收不到这个错误了。

服务器主机崩溃或关机

服务器主机崩溃时，已有的网络链接上不发出任何东西。此时的客户端发出一行文本，等待回答。但此时客户会一直尝试重传，直到超时。

若为崩溃后重启，服务器的 TCP 丢失了崩溃前的所有链接信息，因此服务器 TCP 对所有的客户数据分节均回复 RST，从而使客户端收到 ECONNRESET 错误。若需要实现即使客户不主动发送数据也要能检测出来，就需要采用其他技术，如心跳机制等。

若为客户端主动关机，则 Unix 系统的 init 进程会先给所有进程发送 SIGTERM 信号，等待一段固定的时间，然后给所有仍在运行的进程发送 SIGKILL 信号，该信号不能被捕获。如果部门不捕获 SIGTERM 信号并终止，我们的服务器将由 SIGKILL 信号终止。需要注意客户端在服务端终止后的情况

#碎片知识 #日常

操作系统额外内容 - 基本 TCP 套接字编程

https://ivanclf.github.io/2026/03/16/os-ex2/

作者

Ivan Chan

发布于

2026年3月16日

许可协议

操作系统额外内容 - IO 复用常用函数上一篇

操作系统额外内容 - IPC 下一篇

操作系统额外内容 - 基本 TCP 套接字编程

基本 TCP 套接字编程

sockaddr 结构体

socket

connect

bind

listen

accept

close

getsockname 和 getpeername 函数

程序示例

服务器程序：main

服务器程序：str_echo

客户端程序

处理 SIGCHLD 信号

wait 和 waitpid

信号处理函数

accept 返回前链接终止

服务器进程直接终止

服务器主机崩溃或关机

`sockaddr` 结构体

`socket`

`connect`

`bind`

`listen`

`accept`

`close`

`getsockname` 和 `getpeername` 函数

服务器程序：`main`

服务器程序：`str_echo`

处理 `SIGCHLD` 信号

`wait` 和 `waitpid`

`accept` 返回前链接终止