将标题添加到 csv 文件

新手上路,请多包涵

我有一个尺寸为 100*512 的 csv 文件,我想在 spark 中进一步处理它。该文件的问题是它不包含标头,即 column names 。我需要这些列名称以便在 machine learning 中进一步进行 ETL。我在另一个文件(文本文件)中有列名。我必须将这些列名称作为标题放在上面提到的 csv 文件中。例如

CSV 文件:-

ab 1 23 sf 23 hjh

HS 6 89 IU 98 ADF

gh 7 78 pi 54 ngj

jh 5 22 kj 78 jdk

列标题文件:-

一二三四五六

我想要这样的输出:-

一二三四五六

ab 1 23 sf 23 hjh

HS 6 89 IU 98 ADF

gh 7 78 pi 54 ngj

jh 5 22 kj 78 jdk

请建议一些将列标题添加到 CSV 文件的方法。(不替换 csv 文件的行。我通过将它转换为 pandas 数据帧来尝试它,但无法获得预期的输出。

原文由 Radhika Jaju 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 723
2 个回答

首先阅读您的 csv 文件:

 from pandas import read_csv
df = read_csv('test.csv')

如果您的数据集中有两列(a 列和 b 列),请使用:

 df.columns = ['a', 'b']

将这个新数据框写入 csv

 df.to_csv('test_2.csv')

原文由 Sayali Sonawane 发布,翻译遵循 CC BY-SA 3.0 许可协议

你可以使用它:

     import csv

    with open('names.csv', 'w') as csvfile:
        fieldnames = ['first_name', 'last_name']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

        writer.writeheader()
        writer.writerow({'first_name': 'Baked', 'last_name': 'Beans'})
        writer.writerow({'first_name': 'Lovely', 'last_name': 'Spam'})
        writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})

原文由 Mikail Land 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题