写了一个 ftp client,但用 socket 接收 LIST 命令的数据不完整

接收数据在子进程中:

char data_buffer[BUFFER_SIZE];
char *ptr = "";
int data_len = 0;
int pre_len = 0;
for (;;)
{
    bzero(data_buffer, BUFFER_SIZE);
    int length = recv(client_data_socket, data_buffer, BUFFER_SIZE, 0);
    if (length == 0)
    {
        close(client_data_socket);
        break;
    }
    else if (length < 0)
    {
        if (errno == EAGAIN || errno == EWOULDBLOCK || errno == EINTR)
        {
            continue;
        }
        close(client_data_socket);
        printf("get data failed\n");
        exit(1);
    }
    pre_len = data_len;
    data_len += length;
    char *tmp_ptr = (char *)calloc(data_len, sizeof(char));
    memcpy(tmp_ptr, ptr, pre_len);
    memcpy(tmp_ptr + pre_len, data_buffer, length);
    if (pre_len > 0) free(ptr);
    ptr = tmp_ptr;
}
char *tmp_ptr = (char *)calloc(data_len + 1, sizeof(char));
g2u(ptr, data_len, tmp_ptr, data_len + 1);
printf("%s\n", tmp_ptr);
free(ptr);
free(tmp_ptr);
exit(0);

g2u 方法是编码转换,把 gbk to utf-8 然后发现读出来的数据少了一部分,我是在 recv 返回 0 的时候,判断数据全部接收,可是发现结果有问题

显然,迅雷下载这几个字,没接收完(不知道哪里出了问题) 真正的文件列表

阅读 2.4k
1 个回答

测试

打印了一下接收到的字节

..... 32 32 -47 -72 -64 -41 -49 -62 -44 -40 13 10 

32 是空格,13 是\r 10 是\n
-47 -72 -64 -41 -49 -62 -44 -40 这一段我用 vc 打印了一下,正好是迅雷下载

结论

看来是 g2u 函数的问题


然后我再看了看,把把outbuf放大(改成了2倍,outlen的值也要改),就可以正确输出了

看来是多字节对应汉字的问题

GBK编码,一个汉字占两个字节 UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进