pandas读取txt文件的问题

新手上路,请多包涵

一份既有空格又有tab作为分隔符的txt文件,

df = pd.read_table('file.txt',sep=' ',encoding='utf-8')

如上读取的时候中途发现错误,
ParserError: Error tokenizing data. C error: Expected 1 fields in line 2709, saw 2

查询源文件发现该行存在同一字段有逗号分开的情况:
图片描述

请问如何可以正确读取该文件?
另外sep=' '这样在后面碰到tab做分隔的时候不知道会不会报错。

阅读 19.2k
1 个回答

试试这样:

df = pd.read_table('file.txt', sep='[ |\t]', encoding='utf-8', engine='python')

sep='[ |t]'表示用空格或tab做分隔符。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题