万字详解网络编程之socket-EW帮帮网

一，socket简介

1.什么是socket

socket通常也称作"套接字"，⽤于描述IP地址和端⼝，是⼀个通信链的句柄，应用程序通常通过"套接字"向⽹络发出请求或者应答⽹络请求。⽹络通信就是两个进程间的通信，这两个进程之间是如何识别彼此的呢？那就是套接字（Socket），每个套接字由⼀个 IP 地址和⼀个端⼝号组成。

Socket起源于Unix，⽽Unix/Linux基本哲学之⼀就是“⼀切皆⽂件”，对于⽂件⽤【打开】【读写】【关闭】模式来操作

socket是⼀种特殊的⽂件，⼀些socket函数就是对其进⾏的操作（打开、读/写IO、关闭）。

套接字的类型：

1.流式套接字(SOCK_STREAM)

提供了⼀个面向连接、可靠的数据传输服务，数据⽆差错、⽆重复的发送且按发送顺序接收。内设置流量控制，避免数据流淹没慢的接收⽅。数据被看作是字节流，无长度限制。

2. 数据报套接字(SOCK_DGRAM)

提供⽆连接服务。数据包以独⽴数据包的形式被发送，不提供⽆差错保证，数据可能丢失或重复，顺序发送，可能乱序接收。

3.原始套接字(SOCK_RAW)

可以对较低层次协议，如IP、ICMP直接访问。功能强⼤但使⽤较为不便, 主要⽤于⼀些协议的开发。

socket在所有的⽹络操作系统中是必不可少，它是网络通信中应⽤程序对应的进程

和网络协议之间的接⼝。

2.网络字节序

计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以⾼位字节优先顺序在网络上传输，所以对于在内部是以低位字节优先⽅式存储数据的机器，在Internet上传输数据时就需要进⾏转换，否则就会出现数据不⼀致。

内存中存储的多字节数据相对于内存地址有大端和小端之分，网络数据流同样有大端小端之分。

主机字节序：就是自己的主机内部，内存中数据的存放⽅式，可以分为两种：

大端字节序（big-endian）：按照内存的增长方向，高位数据存储于低位内存中

小端字节序（little-endian）：按照内存的增长方向，高位数据存储于⾼位内存中。

⼤多数Intel兼容机都采⽤⼩端模式。

编写一个简单程序判断当前机器是大端机还是小端机

test.c

#include <stdio.h>

int main()
{
    unsigned int num = 0x12345678;
    unsigned char *p = (unsigned char *)&num;

    if (*p == 0x78)
    {
        printf("当前是小端机\n");
    }
    else if (*p == 0x12)
    {
        printf("当前是大端机\n");
    }
    else
    {
        printf("无法判断\n");
    }

    return 0;
}

⽹络字节顺序： 是TCP/IP中规定好的⼀种数据表示格式，它与具体的CPU类型、操作系统等⽆关，⽹络数据流同样有⼤端⼩端之分，也就是说,当接收端收到第⼀个字节的时候,它将这个字节作为⾼位字节还是低位字节处理.从⽽可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采⽤big endian排序⽅式（⾼位字节优先）。

⼀般考虑到计算机中的字符与⽹络中的字符存储顺序是不同的，当计算机中的整数与⽹络中的整数进⾏交换时，需要相关的函数进⾏转换。

传输字节时可分两种情况：

1.传输⼀个⾮单字节数据,这时要转换成⽹络字节顺序，

2.传输⼀个单字节数据,这时就不需要转换了,因为单字节数据⽆所谓G高或低字节优先

涉及相关函数如下：

#include <arpa/inet.h>

/*主机字节顺序 --> ⽹络字节顺序*/

uint32_t htonl(uint32_t hostlong); /* IP*/

uint16_t htons(uint16_t hostshort); /* 端⼝*/

in_addr_t inet_addr(const char *cp); //将⼀个点分字符串IP地址转换为⼀个32位的⽹络序列IP地址。所属头⽂件：Winsock2.h (windows) arpa/inet.h (Linux)

/*⽹络字节顺序 --> 主机字节顺序*/

uint32_t ntohl(uint32_t netlong); /* IP*/

char *inet_ntoa(struct in_addr in);//将⼀个32位的⽹络字节序转换为⼀个点分⼗进制字符串

struct in_addr //结构体in_addr ⽤来表示⼀个32位的IPv4地址。

{

in_addr_t s_addr; //in_addr_t ⼀般为 32位的unsigned int，其字节顺序为⽹络顺序

};

二，基于TCP/IP协议的socket通信

socket抽象层与体系结构关系示意图

当我们使⽤不同的协议进⾏通信时就得使⽤不同的接⼝，还得处理不同协议的各种细节，这就增加了开发的难度，软件也不易于扩展。于是就出现了socket,socket屏蔽了各个协议的通信细节，使得程序员无需关注协议本身，直接使⽤socket提供的接⼝来进⾏互联的不同主机间的进程的通信。

⼈们把socket设计成⽂件，通过描述符我们可以定位到具体的file结构体，file结构体中有个f_type属性，标识了⽂件的类型（⽐如套接⼦类型，so_pcb结构内包含了当前主机的地址和端⼝信息，这给结构的编号就是套接字的⽂件描述符，和进程的pcb块类似）

1. 基于TCP/ip的相关通信api简介

当进程创建⼀个socket套接字时，操作系统会相应的创建出⼀个由⽂件系统管理的socket对象，这个socket对象中包含：发送缓冲区、接收缓冲区、等待队列、等成员。每⼀个tcp的套接字(socket)都有两个缓冲区,发送缓冲区和接收缓冲区都是先进先出的队列。

其中，等待队列是⾮常重要的成员。操作系统会将调动recv阻塞的进程挂在对应socket的等待队列

中（只是进程的引⽤，不是进程本身），此时进程进⼊阻塞态，不会占⽤CPU资源。

当socket上收到数据后，操作系统会将该socket从等待队列中重新放回到⼯作队列，继续执⾏。

1）创建套接字

#include <sys/types.h> /* See NOTES */
 #include <sys/socket.h>
 
 //建⽴⼀个新的socket(即为建⽴⼀个通信端⼝)
 int socket(int domain, int type, int protocol);
 成功返回⾮负的套接字描述符，失败返回 -1
 
 参数说明：
 domain：即协议域，⼜称为协议族（family）
 Name Purpose Man page
 AF_UNIX, AF_LOCAL Local communication unix(7)
 AF_INET IPv4 Internet protocols ip(7)
 AF_INET6 IPv6 Internet protocols ipv6(7)
 AF_IPX IPX - Novell protocols
 AF_NETLINK Kernel user interface device netlink(7)
 AF_X25 ITU-T X.25 / ISO-8208 protocol x25(7)
 AF_AX25 Amateur radio AX.25 protocol
 AF_ATMPVC Access to raw ATM PVCs
 AF_APPLETALK AppleTalk ddp(7)
 AF_PACKET Low level packet interface packet(7)
 AF_ALG Interface to kernel crypto API
 type：
 SOCK_STREAM TCP
 SOCK_DGRAM UDP
 SOCK_SEQPACKET 为最⼤⻓度固定的数据报提供有序、可靠、基于双向连接的数据
传输路径
 SOCK_RAW 原始套接字
 SOCK_RDM 提供不保证排序的可靠数据报层。
 
 protocol:
 ⽤于指定socket所使⽤的传输协议编号，通常默认设置为0即可
 0选择type类型对应的默认协议；
 IPPROTO_TCP：TCP传输协议；
 IPPROTO_UDP：UDP传输协议；

2）绑定套接字和服务器地址

注意：⼀般来说，⼀个端⼝释放后会等待两分钟之后才能再被使⽤，SO_REUSEADDR是让端⼝释放后⽴即就可以被再次使⽤。SO_REUSEADDR⽤于对TCP套接字处于TIME_WAIT状态下的socket，才可以重复绑定使⽤。server程序总是应该在调⽤bind()之前设置SO_REUSEADDR套接字选项。先调⽤close()的⼀⽅会进⼊TIME_WAIT状态。

#include <sys/types.h> /* See NOTES */
 #include <sys/socket.h>
 //⽤来给参数sockfd的socket设置⼀个名称，该名称由addr参数指向的sockadr结构
 int bind(int sockfd, const struct sockaddr *addr, socklen_t addrle
n);
 返回说明：成功返回 0 失败返回 -1
 ⽤途：主要⽤与在TCP中的连接
 
 形参说明：
 sockfd 套接字⽂件描述符
 addr 服务器地址信息
 struct sockaddr {
 sa_family_t sa_family;
 char sa_data[14];
 }
 
 但在编程中⼀般使⽤下边这种等价结构sockaddr,对于IPV4我们常⽤这个结构
 注意：使⽤该结构需要包含：#include <netinet/in.h>头⽂件 ****
 struct sockaddr_in {
 sa_family_t sin_family; IPV4对应AF_INET
 //htons()
 u_int16_t sin_port; 端⼝号//sin_port存储端⼝
号（使⽤⽹络字节顺序）
 struct in_addr sin_addr; IP地址 //inet_addr()将
字符串形象ip转⽹络字节序
 };
 
 /* Internet address. */
 struct in_addr {
 u_int32_t s_addr; IP地址
 };
 addrlen addr的⻓度 sizeof(struct sockaddr)
 
 //如果使⽤IPV6地址，需要⽤这个结构来定义变量存放ipv6相关信息 
 struct sockaddr_in6 {
 sa_family_t sin6_family; /* AF_INET6 */
 in_port_t sin6_port; /* port number */
 uint32_t sin6_flowinfo; /* IPv6 flow information */
 struct in6_addr sin6_addr; /* IPv6 address */
 uint32_t sin6_scope_id; /* Scope ID (new in 2.4) */
 };
  struct in6_addr {
    unsigned char s6_addr[16]; /* IPv6 address */
 };

3）监听模式

#include <sys/socket.h>
 
 //⽤于等待参数sockfd的scoket连线
 int listen(int sockfd, int backlog);
 返回值说明：成功返回0，失败返回-1
 sockfd 套接字⽂件描述符
 backlog 监听队列⻓度（等待连接的客户端的个数）缺省值20，最⼤值为128
 即为规定了内核应该为相应套接⼝排队的最⼤连接个数

4）等待客户端连接的到来

#include <sys/types.h> 
 #include <sys/socket.h> 
 //接收socket的连线
 int accept(int sockfd, struct sockaddr *addr, socklen_t *addrle
n); 
 返回值说明：成功返回连接的客户端的套接字⽂件描述符 失败返回 -1
 参数说明：
 sockfd 服务器套接字⽂件描述符
 addr 客户端信息地址，做返回值⽤的，不获取可以直接输⼊NULL
 addrlen addr的⻓度，注意是⼀个指针类型 ，传⼊指定地址的⻓度，不指定
则NULL

5）客户端建立socket连线

#include <sys/types.h> /* See NOTES */
 #include <sys/socket.h>
 /*⽤于将参数sockfd的socket连接到参数addr指定的⽹络地址*/
 int connect(int sockfd, const struct sockaddr *addr, socklen_t addrl
en);
 addr:服务端的地址
 addrlen:为scokarr的结构⻓度
 返回值：返回0时，表明该连接已经成功建⽴，返回-1时，表明该连接发⽣了错误，即没有成
功建⽴连接。
 注意：connect() 函数不阻塞，所以在使⽤之前要确保服务器已经进⼊等待连接状态。

6）读写函数

读(read/recvfrom/msgrcv):

读的本质来说其实不能是读,在实际中, 具体的接收数据不是由这些调⽤来进⾏,是由于系统底层⾃动完成的。read 也好,recv 也好只负责把数据从底层缓冲copy 到我们指定的位置。

写(send/write)：

写的本质也不是进⾏发送操作,⽽是把⽤户态的数据copy 到系统底层去,然后再由系统进⾏发送操作,send，write返回成功，只表示数据已经copy 到底层缓冲,⽽不表示数据已经发出,更不能表示对⽅端⼝已经接收到数据。

#include<unistd.h>
//将数据写⼊已打开的⽂件内，写⼊count个字节到参数fd所指的⽂件内。
ssize_t write(int fd,const void*buf,size_t count);
//从已打开的⽂件中读取数据
ssize_t read(int fd,void*buf,size_t count);
返回值：读取到的实际数据数，如果返回0表示已经到达⽂件末尾或⽆可读取的数据，当read()函数
返回值为0时，
表示对端已经关闭了 socket，这时候也要关闭这个socket，否则会导致socket泄露。
当read()或者write()函数返回值⼤于0时，表示实际从缓冲区读取或者写⼊的字节数⽬
当read()或者write()返回-1时，⼀般要判断errno
⼀般是读写操作超时了，还未返回。这个超时是指socket的SO_RCVTIMEO与SO_SNDTIMEO两个属
性。
所以在使⽤阻塞socket时，不要将超时时间设置的过⼩。不然返回了-1，
你也不知道是socket连接是真的断开了，还是正常的⽹络抖动。⼀般情况下，阻塞的socket返回
了-1，
都需要关闭重新连接。
Close()和shutdown()——结束数据传输
当所有的数据操作结束以后，你可以调⽤close()函数来释放该socket，从⽽
停⽌在该socket上的任何数据操作：close(sockfd);

2.并发服务器

TCP服务器⼀次只能接收⼀个客户端的连接的请求，只有在该客户端的所有请求都满⾜后，服务器才可以继续响应后边的请求，如果⼀个客户端占⽤服务器不释放，其他客户端都不能⼯作了，因此上述的TCP服务器⼜称为循环服务器，鉴于TCP循环服务器的缺陷，很少TCP服务器采⽤。

为了解决循环TCP服务器的缺陷，⼈们⼜想出了并发服务器模型。并发服务器的思想为：每⼀个客户端的请求并不由服务器直接处理，⽽是由服务器创建⼀个子进程或⼦线程来解决。

示例程序：

server.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
#include <arpa/inet.h>
#include <netinet/in.h>

#define PORT 8888
#define BUF_SIZE 1024

// 线程函数：处理一个客户端
void *handle_client(void *arg)
{
    int client_sock = *(int *)arg;
    free(arg);

    char buffer[BUF_SIZE];
    int n;

    while ((n = read(client_sock, buffer, BUF_SIZE - 1)) > 0)
    {
        buffer[n] = '\0';
        printf("[客户端消息] %s\n", buffer); // 在服务器端显示客户端消息
    }

    printf("客户端断开连接。\n");
    close(client_sock);
    return NULL;
}

int main()
{
    int server_sock, *client_sock;
    struct sockaddr_in server_addr, client_addr;
    socklen_t client_len = sizeof(client_addr);

    // 创建socket
    server_sock = socket(AF_INET, SOCK_STREAM, 0);
    if (server_sock < 0)
    {
        perror("socket");
        exit(EXIT_FAILURE);
    }

    int opt = 1;
    setsockopt(server_sock, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));

    server_addr.sin_family = AF_INET;
    server_addr.sin_addr.s_addr = INADDR_ANY;
    server_addr.sin_port = htons(PORT);

    if (bind(server_sock, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0)
    {
        perror("bind");
        close(server_sock);
        exit(EXIT_FAILURE);
    }

    if (listen(server_sock, 5) < 0)
    {
        perror("listen");
        close(server_sock);
        exit(EXIT_FAILURE);
    }

    printf("服务器已启动，监听端口 %d...\n", PORT);

    while (1)
    {
        client_sock = malloc(sizeof(int));
        *client_sock = accept(server_sock, (struct sockaddr *)&client_addr, &client_len);
        if (*client_sock < 0)
        {
            perror("accept");
            free(client_sock);
            continue;
        }

        printf("新客户端连接：%s:%d\n",
               inet_ntoa(client_addr.sin_addr),
               ntohs(client_addr.sin_port));

        pthread_t tid;
        pthread_create(&tid, NULL, handle_client, client_sock);
        pthread_detach(tid);
    }

    close(server_sock);
    return 0;
}

client.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>

#define PORT 8888
#define BUF_SIZE 1024

int main()
{
    int sock;
    struct sockaddr_in server_addr;
    char buffer[BUF_SIZE];

    // 创建socket
    sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock < 0)
    {
        perror("socket");
        exit(EXIT_FAILURE);
    }

    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(PORT);
    server_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); // 服务器IP

    if (connect(sock, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0)
    {
        perror("connect");
        close(sock);
        exit(EXIT_FAILURE);
    }

    printf("已连接到服务器，现在可以输入消息...\n");

    while (1)
    {
        // 从标准输入读取消息
        printf("输入: ");
        if (fgets(buffer, BUF_SIZE, stdin) == NULL)
            break;

        // 发送到服务器
        write(sock, buffer, strlen(buffer));
    }

    close(sock);
    return 0;
}

运行结果：

三，基于UDP/IP协议的socket通信

基于UDP/IP通信的相关api简介

1）发送UDP报格式数据

#include <sys/types.h>
#include <sys/socket.h>
//把UDP数据报发给指定地址
int sendto (int sockfd, const void *buf, int len, unsigned int flags, 
 const struct sockaddr *to, int tolen);
参数说明：
 sockfd 套接字⽂件描述符
 buf 存放发送的数据
 len 期望发送的数据⻓度
 flags 0
 to struct sockaddr_in类型，指明UDP数据发往哪⾥报
 tolen： 对⽅地址⻓度，⼀般为：sizeof(struct sockaddr_in)。

2）接收UDP报格式数据

#include <sys/types.h>
#include <sys/socket.h>
//接收UDP的数据
int recvfrom(int sockfd, void *buf, int len, unsigned int flags, 
 struct sockaddr *from, int *fromlen);
参数意义和sentdo类似，其中romlen传递是接收到地址的⻓度
例如 int p=sizeof(struct adrr_in),最后⼀个参数就传为&p

注意：如果数据流量突然增⼤，也可以通过如下函数设置发送或接收缓冲区的大小。

调整UDP缓冲区⼤⼩:使用函数setsockopt()函数修改接收缓冲区大小

int setsockopt(int sockfd，int level，int optname，const void *optval，socklen_t optlen);

level:选项定义的层次:⽀持soL_SOCKET，IPPROTO_TCP，IPPROTO_IP和

IPPROTO_IPV6optname。

需设置得选项so_RCVBUF(接收缓冲区)，So_SNDBUF(发送缓冲区)

3) 创建套接字 (Socket)

在进行任何网络通信之前，应用程序必须先向操作系统请求一个网络通信的“端点”，这个端点就是套接字。

#include <sys/types.h>
#include <sys/socket.h>

// 创建一个套接字
int socket(int domain, int type, int protocol);```

**参数说明：**

*   `domain`: 指定通信协议族。对于IPv4网络通信，这个值通常是 `AF_INET`。
*   `type`: 指定套接字的类型。
    *   对于UDP通信，这个值必须是 `SOCK_DGRAM` (Datagram)，表示这是一个提供数据报服务的套接字，不建立连接，每个数据包都是独立的。
    *   （作为对比，TCP使用 `SOCK_STREAM`）
*   `protocol`: 协议类型。通常设置为 `0`，让系统根据 `domain` 和 `type` 自动选择最合适的协议（对于 `AF_INET` 和 `SOCK_DGRAM`，系统会选择IPPROTO_UDP）。

**返回值：**

*   **成功**：返回一个新的文件描述符 (一个非负整数)，代表创建的套接字。后续的所有操作都将通过这个文件描述符进行。
*   **失败**：返回 `-1`，并设置全局变量 `errno` 来表示错误原因。

**示例：**
```c
int sockfd;
sockfd = socket(AF_INET, SOCK_DGRAM, 0);
if (sockfd < 0) {
    perror("socket creation failed");
    exit(EXIT_FAILURE);
}

4) 绑定地址和端口 (Bind)

对于需要接收数据的UDP程序（通常是服务器端），必须将其创建的套接字与一个具体的IP地址和端口号关联起来。这样，当网络中有数据包发送到这个IP和端口时，操作系统才知道应该将数据交给哪个程序处理。

#include <sys/types.h>
#include <sys/socket.h>

// 将套接字与一个地址绑定
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

参数说明：

sockfd: socket() 函数返回的套接字文件描述符。
addr: 一个指向 struct sockaddr 结构体的指针，但实际使用中通常传入一个 struct sockaddr_in 结构体（需要进行类型强制转换）。该结构体包含了要绑定的IP地址和端口号。
addrlen: addr 结构体的长度，通常为 sizeof(struct sockaddr_in)。

struct sockaddr_in 结构体详解：

struct sockaddr_in {
    sa_family_t    sin_family; // 地址族, 必须是 AF_INET
    in_port_t      sin_port;   // 端口号 (需要使用 htons() 转换)
    struct in_addr sin_addr;   // IPv4 地址
};

struct in_addr {
    uint32_t       s_addr;     // 32位的IPv4地址 (需要使用 inet_addr() 或 INADDR_ANY)
};

注意： 端口号和IP地址必须从“主机字节序”转换为“网络字节序”。通常使用 htons() (Host to Network Short) 来转换端口，使用 inet_addr("127.0.0.1") 或 INADDR_ANY (表示绑定到本机所有IP地址) 来设置地址。

返回值：

成功：返回 0。
失败：返回 -1，并设置 errno。

示例：

struct sockaddr_in servaddr;
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = INADDR_ANY; // 监听任意网卡的请求
servaddr.sin_port = htons(8888);       // 绑定到8888端口

if (bind(sockfd, (const struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) {
    perror("bind failed");
    exit(EXIT_FAILURE);
}

对于UDP客户端，通常不需要显式调用 bind()。因为在第一次调用 sendto() 时，操作系统会自动为其分配一个临时的端口号。

5) 关闭套接字 (Close)

当通信结束时，应该释放套接字占用的系统资源。这个操作就像关闭一个文件一样。

#include <unistd.h>

// 关闭一个文件描述符
int close(int fd);