一份既有空格又有tab作为分隔符的txt文件,
df = pd.read_table('file.txt',sep=' ',encoding='utf-8')
如上读取的时候中途发现错误,
ParserError: Error tokenizing data. C error: Expected 1 fields in line 2709, saw 2
查询源文件发现该行存在同一字段有逗号分开的情况:
请问如何可以正确读取该文件?
另外sep=' '这样在后面碰到tab做分隔的时候不知道会不会报错。
试试这样:
sep='[ |t]'表示用空格或tab做分隔符。