python读入csv后不能控制对应列的问题

新手上路,请多包涵

import pandas as pd
reader=pd.read_csv('D:/scut_lastproject_dataset/august_week1_csv/uniq/augustweek1.csv',chunksize=1000,iterator=True)
file1 = reader.get_chunk(1000)
file1.columns=['souceip','sourceport','destport','protocol','flags','fwd','stos','pkt','byt','attack_type']
print(file1)

这里重新修改列名为10个

图片描述

截图中选取了结果,实际上是有13列的,但读入之后size变成十列的了,但是数据还在却无法进行列名的修改
图片描述

这是csv打开的截图,第二行的数据是无用的,不知道是不是有影响。因为数据集是30G的,所以删了再保存的话数据会丢失。所以该怎么办好,急急急!

阅读 2.6k
1 个回答

你用read_csv的时候,加上skiprows 参数,要求忽略第二行就好了啊。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题