pandas读取txt文件的问题

新手上路，请多包涵

一份既有空格又有tab作为分隔符的txt文件，

df = pd.read_table('file.txt',sep=' ',encoding='utf-8')

如上读取的时候中途发现错误，
ParserError: Error tokenizing data. C error: Expected 1 fields in line 2709, saw 2

查询源文件发现该行存在同一字段有逗号分开的情况：
图片描述

请问如何可以正确读取该文件？
另外sep=' '这样在后面碰到tab做分隔的时候不知道会不会报错。

阅读 19.3k

1 个回答

得票最新

试试这样：

df = pd.read_table('file.txt', sep='[ |\t]', encoding='utf-8', engine='python')

sep='[ |t]'表示用空格或tab做分隔符。

撰写回答

推荐问题

相似问题

找不到问题？创建新问题