diffrent of Python readline() and C getc()

之前先在Stackoverflow上提问的, 现在改成中文

最近需要处理一部分乱码数据

实际上只需要其中的字母和数字就够了

起初我写了像这样的C, 按照ASCII码表来进行过滤

int c;

while ((c = getc(stdin)) != EOF)
    if ((65 <= c && c <= 90) || (97 <= c && c <= 122) || // alphabet
        c == 10 || c == 13 ||                   // LF, CR
        (32 <= c && c <= 47) ||                // other
        (32 <= c && c <= 64) || (c <= 91 && c == 96))
        if (putc(c, stdout) == EOF)
            err_sys("output error");

if (ferror(stdin))
    err_sys("input error");

写完当然是没问题的
不过平时用python, 突然试着用下面的代码做对比

f = open('data.txt', 'r')
f.readline()

然后奇怪的事情就发生了!
比如原始数据里的一行
用getc()过滤是这样的

> twiiiiiii@2

但是用readline()却是这样的

> @2>&&>zC\rtwiiiiiii@2\n

注意, 这里的'@'和'2', 都没有被过滤(比如末尾的就还在)

就是Python 的readline()比C 的getc() 然后过滤的结果要多一些

个人觉得是两者对每个字节的最高位解释不同

但... 好困惑啊

附原始数据
图片描述

阅读 3.8k

diffrent of Python readline() and C getc()

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

这段代码为什么不能获取到数据？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？