使用 Python 处理 csv 文件时如何跳过标题?

新手上路,请多包涵

我正在使用下面提到的代码来使用 Python 编辑 csv。代码中调用的函数构成了代码的上半部分。

问题:我希望下面提到的代码从第二行开始编辑 csv,我希望它排除包含标题的第一行。现在它只在第一行应用函数,我的标题行正在改变。

 in_file = open("tmob_notcleaned.csv", "rb")
reader = csv.reader(in_file)
out_file = open("tmob_cleaned.csv", "wb")
writer = csv.writer(out_file)
row = 1
for row in reader:
    row[13] = handle_color(row[10])[1].replace(" - ","").strip()
    row[10] = handle_color(row[10])[0].replace("-","").replace("(","").replace(")","").strip()
    row[14] = handle_gb(row[10])[1].replace("-","").replace(" ","").replace("GB","").strip()
    row[10] = handle_gb(row[10])[0].strip()
    row[9] = handle_oem(row[10])[1].replace("Blackberry","RIM").replace("TMobile","T-Mobile").strip()
    row[15] = handle_addon(row[10])[1].strip()
    row[10] = handle_addon(row[10])[0].replace(" by","").replace("FREE","").strip()
    writer.writerow(row)
in_file.close()
out_file.close()

我试图通过将 row 变量初始化为 1 来解决这个问题,但它没有用。

请帮我解决这个问题。

原文由 user1915050 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 673
2 个回答

您的 reader 变量是可迭代的,通过循环它可以检索行。

要让它在循环之前跳过一项,只需调用 next(reader, None) 并忽略返回值。

您还可以稍微简化代码;使用打开的文件作为上下文管理器让它们自动关闭:

 with open("tmob_notcleaned.csv", "rb") as infile, open("tmob_cleaned.csv", "wb") as outfile:
   reader = csv.reader(infile)
   next(reader, None)  # skip the headers
   writer = csv.writer(outfile)
   for row in reader:
       # process each row
       writer.writerow(row)

# no need to close, the files are closed automatically when you get to this point.

如果您想将标头写入未处理的输出文件,这也很容易,将 next() 的输出传递给 writer.writerow()

 headers = next(reader, None)  # returns the headers or `None` if the input is empty
if headers:
    writer.writerow(headers)

原文由 Martijn Pieters 发布,翻译遵循 CC BY-SA 4.0 许可协议

解决这个问题的另一种方法是使用 DictReader 类,它“跳过”标题行并使用它来允许命名索引。

给出“foo.csv”如下:

 FirstColumn,SecondColumn
asdf,1234
qwer,5678

像这样使用 DictReader:

 import csv
with open('foo.csv') as f:
    reader = csv.DictReader(f, delimiter=',')
    for row in reader:
        print(row['FirstColumn'])  # Access by column header instead of column number
        print(row['SecondColumn'])

原文由 Chad Zawistowski 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题