将 Python Pandas DataFrame 写入 Word 文档

新手上路,请多包涵

我正在创建一个使用 Pandas DataFrames 的 Python 生成的报告。目前我正在使用 DataFrame.to_string() 方法。但是,这将作为字符串写入文件。有没有办法让我在将其保留为表格的同时实现这一目标,以便我可以使用表格格式。

代码:

 SEMorgkeys = client.domain_organic(url, database = "us", display_limit = 10, export_columns=["Ph,Pp,Pd,Nq,Cp,Ur,Tr"])
org_df = pd.DataFrame(SEMorgkeys)

f = open(name, 'w')
f.write("\nOrganic:\n")
f.write(org_df.to_string(index=False,justify="left"))
f.close()

当前打印输出(作为字符串):

 CPC    Keyword                        Position Difference Previous Position Search Volume Traffic (%) Url
75.92       small business factoring   0                   1                 210          11.69       https://www..com/small-business-f...
80.19              factoring company   0                   8                1600           5.72       https://www..com/factoring-vs-ban...

原文由 spriore 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 909
2 个回答

您可以使用 python-docx 库将表格直接写入 .docx 文件。

如果您正在使用 Conda 或使用 Anaconda 安装 Python,则可以从命令行运行命令:

 conda install python-docx --channel conda-forge

或者从命令行进行 pip 安装:

 pip install python-docx

安装后,我们可以用它打开文件,添加表格,然后用数据框数据填充表格的单元格文本。

 import docx
import pandas as pd

# i am not sure how you are getting your data, but you said it is a
# pandas data frame
df = pd.DataFrame(data)

# open an existing document
doc = docx.Document('./test.docx')

# add a table to the end and create a reference variable
# extra row is so we can add the header row
t = doc.add_table(df.shape[0]+1, df.shape[1])

# add the header rows.
for j in range(df.shape[-1]):
    t.cell(0,j).text = df.columns[j]

# add the rest of the data frame
for i in range(df.shape[0]):
    for j in range(df.shape[-1]):
        t.cell(i+1,j).text = str(df.values[i,j])

# save the doc
doc.save('./test.docx')

原文由 James 发布,翻译遵循 CC BY-SA 3.0 许可协议

def doctable(data, tabletitle, pathfile):
    from docx import Document
    from docx.shared import Pt, Mm
    import pandas as pd
    document = Document()
    section = document.sections[0]
    section.page_height = Mm(297)
    section.page_width = Mm(210)
    section.left_margin = Mm(20)
    section.right_margin = Mm(20)
    section.top_margin = Mm(20)
    section.bottom_margin = Mm(20)
    section.header_distance = Mm(12.7)
    section.footer_distance = Mm(12.7)
    data = pd.DataFrame(data) # My input data is in the 2D list form
    document.add_heading(tabletitle)
    table = document.add_table(rows=(data.shape[0]), cols=data.shape[1]) # First row are table headers!
    table.allow_autofit = True
    table.autofit = True
    for i, column in enumerate(data) :
        for row in range(data.shape[0]) :
            table.cell(row, i).text = str(data[column][row])
    document.save(pathfile)
    return 0

原文由 Tedo Vrbanec 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题