如何使用 Pandas 在现有的 Excel 文件中保存新工作表?

新手上路,请多包涵

我想使用 excel 文件来存储用 python 详细说明的数据。我的问题是我无法将工作表添加到现有的 Excel 文件中。在这里,我建议使用一个示例代码来解决这个问题

import pandas as pd
import numpy as np

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"

x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)

x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)

writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()

此代码将两个 DataFrame 保存到两个工作表中,分别命名为“x1”和“x2”。如果我创建两个新的 DataFrame 并尝试使用相同的代码添加两个新工作表“x3”和“x4”,则原始数据将丢失。

 import pandas as pd
import numpy as np

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"

x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)

x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)

writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()

我想要一个包含四张纸的 excel 文件:“x1”、“x2”、“x3”、“x4”。我知道“xlsxwriter”不是唯一的“引擎”,还有“openpyxl”。我也看到已经有其他人写过关于这个问题的文章,但我仍然不明白该怎么做。

这是从此 链接 获取的代码

import pandas
from openpyxl import load_workbook

book = load_workbook('Masterfile.xlsx')
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl')
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)

data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2'])

writer.save()

他们说它有效,但很难弄清楚它是如何工作的。我不明白在这种情况下“ws.title”、“ws”和“dict”是什么。

保存“x1”和“x2”,然后关闭文件,再次打开并添加“x3”和“x4”的最佳方法是什么?

原文由 Stefano Fedele 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 829
2 个回答

谢谢你。我相信一个完整的例子可能对其他有同样问题的人有好处:

 import pandas as pd
import numpy as np

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"

x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)

x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)

writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.close()

在这里我生成了一个 excel 文件,根据我的理解,它是通过“xslxwriter”还是“openpyxl”引擎生成的并不重要。

当我想在不丢失原始数据的情况下写入时

import pandas as pd
import numpy as np
from openpyxl import load_workbook

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"

book = load_workbook(path)
writer = pd.ExcelWriter(path, engine = 'openpyxl')
writer.book = book

x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)

x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)

df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.close()

这段代码可以完成工作!

原文由 Stefano Fedele 发布,翻译遵循 CC BY-SA 4.0 许可协议

用于创建新文件

x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)
with pd.ExcelWriter('sample.xlsx') as writer:
    df1.to_excel(writer, sheet_name='x1')

要附加到文件,请在 --- 中使用参数 mode='a' pd.ExcelWriter

 x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)
with pd.ExcelWriter('sample.xlsx', engine='openpyxl', mode='a') as writer:
    df2.to_excel(writer, sheet_name='x2')

默认为 mode ='w' 。请参阅 文档

原文由 Pulkit Khandelwal 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题