2017-07-31 47 views
1

我已閱讀TCP option SO_LINGER (zero) - when it's required和其他幾個相關的問題和答案,但我無法複製這些帖子中解釋的任何SO_LINGER行爲。我將在這裏分享我的許多實驗之一。爲什麼不是SO_LINGER選項有0超時或10秒超時而不是立即或10秒後移除套接字?

我在以下環境中執行此實驗。

$ lsb_release -d 
Description: Debian GNU/Linux 9.0 (stretch) 
$ gcc -dumpversion 
6.3.0 

這裏是一個錯誤操作的客戶端連接到服務器, 但沒有接收到任何數據進行90秒的實例。

/* client.c */ 
#include <stdio.h> 
#include <string.h> 
#include <unistd.h> 

#include <sys/socket.h> 
#include <arpa/inet.h> 
#include <netdb.h> 

int main() 
{ 
    int sockfd; 
    int ret; 
    struct addrinfo hints, *ai; 
    char buffer[256]; 
    ssize_t bytes; 

    memset(&hints, 0, sizeof hints); 
    hints.ai_family = AF_INET; 
    hints.ai_socktype = SOCK_STREAM; 

    if ((ret = getaddrinfo(NULL, "8000", &hints, &ai)) == -1) { 
     fprintf(stderr, "client: getaddrinfo: %s\n", gai_strerror(ret)); 
     return 1; 
    } 

    sockfd = socket(ai->ai_family, ai->ai_socktype, ai->ai_protocol); 
    if (sockfd == -1) { 
     perror("client: socket"); 
     return 1; 
    } 

    if (connect(sockfd, ai->ai_addr, ai->ai_addrlen) == -1) { 
     perror("client: connect"); 
     close(sockfd); 
     return -1; 
    } 

    printf("client: connected\n"); 

    /* 
    bytes = recv(sockfd, buffer, sizeof buffer, 0); 
    if (recv(sockfd, buffer, sizeof buffer, 0) == -1) { 
     perror("client: recv"); 
     close(sockfd); 
     return -1; 
    } 

    printf("client: received: %.*s\n", (int) bytes, buffer); 
    */ 

    sleep(90); 
    freeaddrinfo(ai); 

    printf("client: closing socket ...\n"); 
    close(sockfd); 
    printf("client: closed socket!\n"); 

    return 0; 
} 

這裏是發送hello到連接 到服務器的客戶端,然後立即關閉連接我的服務器代碼。此服務器是 爲簡單起見不是多線程。在一個多線程服務器中,它將接受來自客戶端的100多個連接的連接,其中很多可能會行爲不端,我們的目標是儘快放棄 無用的套接字,以釋放爲這些套接字所使用的端口。

爲了達到這個目的,我們啓用了SO_LINGER套接字選項,其延遲時間爲10秒,延遲時間爲 。

/* server.c */ 
#include <stdio.h> 
#include <string.h> 
#include <unistd.h> 

#include <sys/socket.h> 
#include <arpa/inet.h> 
#include <netdb.h> 

int main() 
{ 
    int sockfd; 
    int ret; 
    int yes = 1; 

    struct addrinfo hints, *ai; 

    memset(&hints, 0, sizeof hints); 
    hints.ai_family = AF_INET; 
    hints.ai_socktype = SOCK_STREAM; 
    hints.ai_flags = AI_PASSIVE; 

    if ((ret = getaddrinfo(NULL, "8000", &hints, &ai)) == -1) { 
     fprintf(stderr, "getaddrinfo: %s\n", gai_strerror(ret)); 
     return 1; 
    } 

    sockfd = socket(ai->ai_family, ai->ai_socktype, ai->ai_protocol); 
    if (sockfd == -1) { 
     perror("server: socket"); 
     return 1; 
    } 

    if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &yes, sizeof yes) == -1) { 
     perror("server: setsockopt"); 
     close(sockfd); 
     return 1; 
    } 

    if (bind(sockfd, ai->ai_addr, ai->ai_addrlen) == -1) { 
     perror("server: bind"); 
     close(sockfd); 
     return 1; 
    } 

    freeaddrinfo(ai); 

    if (listen(sockfd, 10) == -1) { 
     perror("server: listen"); 
     close(sockfd); 
     return 1; 
    } 

    printf("server: listening ...\n"); 

    while (1) { 
     int client_sockfd; 
     struct sockaddr_storage client_addr; 
     socklen_t client_addrlen = sizeof client_addr; 
     struct linger l_opt; 

     printf("server: accepting ...\n"); 
     client_sockfd = accept(sockfd, (struct sockaddr *) &client_addr, 
           &client_addrlen); 

     /* Set SO_LINGER opt for the new client socket. */ 
     l_opt.l_onoff = 1; 
     l_opt.l_linger = 10; 
     setsockopt(sockfd, SOL_SOCKET, SO_LINGER, &l_opt, sizeof l_opt); 

     if (client_sockfd == -1) { 
      perror("server: accept"); 
      continue; 
     } 

     if (send(client_sockfd, "hello\n", 6, 0) == -1) { 
      perror("server: send"); 
      continue; 
     } 

     printf("server: sent: hello\n"); 
     printf("server: closing client socket ...\n"); 
     close(client_sockfd); 
     printf("server: closed client socket!\n"); 
    } 

    return 0; 
} 

這是我的實驗跑步者。

# run.sh 
gcc -std=c99 -Wall -Wextra -Wpedantic -D_DEFAULT_SOURCE server.c -o server 
gcc -std=c99 -Wall -Wextra -Wpedantic -D_DEFAULT_SOURCE client.c -o client 
./server & 
sleep 1 
./client 
pkill ^server$ 

在另一窗口/終端,我運行這個小bash腳本來監控每10秒的套接字的 狀態。

$ for i in {1..10}; do netstat -nopa 2> /dev/null | grep :8000; echo =====; sleep 10; done 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (59.84/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (49.83/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (39.82/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (29.81/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (19.80/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (9.78/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
tcp  0  0 127.0.0.1:8000   127.0.0.1:35536   FIN_WAIT2 -     timewait (0.00/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
===== 
tcp  0  0 0.0.0.0:8000   0.0.0.0:*    LISTEN  16293/./server  off (0.00/0/0) 
tcp  7  0 127.0.0.1:35536   127.0.0.1:8000   CLOSE_WAIT 16295/./client  off (0.00/0/0) 
===== 
===== 

上述輸出顯示服務器套接字(第三行中的輸出的每次迭代),保持在FIN_WAIT2狀態60秒(即,默認TIMEWAIT)。

爲什麼SO_LINGER選項與10秒超時不保證服務器關閉了客戶端套接字(即本地地址= 127.0.0.1:8000;外部地址= 127.0.0.1:35536)成功地在10秒後?

注意:即使有0超時,即使用以下代碼,本地地址= 127.0.0.1:8000和外部地址= 127.0.0.1:35536的套接字仍保持在FIN_WAIT2狀態60秒。

 /* Set SO_LINGER opt for the new client socket. */ 
     l_opt.l_onoff = 1; 
     l_opt.l_linger = 0; 
     setsockopt(sockfd, SOL_SOCKET, SO_LINGER, &l_opt, sizeof l_opt); 

如果SO_LINGER對去除插座或FIN_WAIT2超時沒有效果,那麼真正是SO_LINGER的目的是什麼?

+0

請參閱描述POSIX [套接字](http://pubs.opengroup)部分中的POSIX [使用選項](http://pubs.opengroup.org/onlinepubs/9699919799/functions/V2_chap02.html#tag_15_10_16)組織/ onlinepubs/9699919799 /功能/ V2_chap02.html#tag_15_10)。 –

+0

@JonathanLeffler POSIX文檔沒有提及'TIME_WAIT',但幾乎關於'SO_LINGER'的所有關於StackOverflow的討論,包括我已經鏈接的問題和答案都似乎談論'TIME_WAIT'。如果'SO_LINGER'對'TIME_WAIT'沒有影響,這些現有答案是否被誤導? –

+0

是的; POSIX文檔在任何地方都不包含「TIME_WAIT」字樣。如果您想了解相關信息,則必須在其他地方搜索信息。也許你可以得到W. Richard Stevens,Bill Fenner,Andrew M. Rudoff [UNIX®網絡編程,第1卷:套接字網絡API,第3版](http://www.amazon.com/Unix-Network -Programming-Volume-Networking/dp/0131411551) - 又名 [UNIX®網絡編程,第1卷:套接字網絡API](http://unpbook.com/)。 –

回答

3

你有一個基本的誤解。

將SO_LINGER設置爲正超時只是一件事。它允許close()阻止達到該超時,同時有任何出站掛起數據仍在運行。如果您不修改它,默認情況是close()是異步的,這意味着應用程序無法分辨是否有任何數據仍在發送。

因此,這樣做的目的是使應用程序能夠檢測到完全發送最終未決數據的失敗。

它沒有任何關於清理死或無用的插座。具體而言,關閉後它不會縮短TIME_WAIT或TCP超時時間。

這可以通過另一種方式通過使用不同的設置來實現,但其效果是重置連接並丟失任何正在運行的數據,並可能導致另一端產生恐慌,因此不建議。至少由我。

您的實際代碼的行爲完全如預期。服務器已關閉,因此客戶端處於CLOSE_WAIT狀態90秒,服務器處於FIN_WAIT_2狀態,正在等待客戶端關閉。這裏沒有什麼,只是一個行爲不端的客戶。超時過期後,服務器將繼續存在。

+0

我覺得我的誤解源於我對這個答案的解釋:https://stackoverflow.com/a/3760186/1175080。你能告訴我們這個鏈接的答案是否準確嗎?爲什麼這個回答談論'TIME_WAIT'和SO_LINGER'如何影響它? –

+0

關於SO_LINGER的關聯答案(您沒有問過關於零超時的問題)就可以了,但是對於TIME_WAIT的正確解決方案(您也沒有問過)是完全不同的,根據我在該答案下的評論。 – EJP

+0

如果我設置'l_opt.l_linger = 0;我看到沒有任何區別;'服務器在套接字消失前仍然進入'FIN_WAIT_2' 60秒。我如何看到零超時行爲的差異?我應該爲它創建一個新問題嗎? –

相關問題