使用 Python 比较 2 个 excel 文件

新手上路,请多包涵

我有两个 xlsx 文件如下:

 value1   value2   value3
0.456   3.456    0.4325436
6.24654 0.235435 6.376546
4.26545 4.264543 7.2564523

value1   value2  value3
0.456   3.456    0.4325436
6.24654 0.23546  6.376546
4.26545 4.264543 7.2564523

我需要比较所有单元格,如果一个单元格来自 file1 != 一个单元格来自 file2 print 那个。

 import xlrd
rb = xlrd.open_workbook('file1.xlsx')
rb1 = xlrd.open_workbook('file2.xlsx')
sheet = rb.sheet_by_index(0)
for rownum in range(sheet.nrows):
    row = sheet.row_values(rownum)
    for c_el in row:
        print c_el

如何添加 file1file2 的比较单元格?

原文由 user6241246 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 469
2 个回答

以下方法应该可以帮助您入门:

 from itertools import izip_longest
import xlrd

rb1 = xlrd.open_workbook('file1.xlsx')
rb2 = xlrd.open_workbook('file2.xlsx')

sheet1 = rb1.sheet_by_index(0)
sheet2 = rb2.sheet_by_index(0)

for rownum in range(max(sheet1.nrows, sheet2.nrows)):
    if rownum < sheet1.nrows:
        row_rb1 = sheet1.row_values(rownum)
        row_rb2 = sheet2.row_values(rownum)

        for colnum, (c1, c2) in enumerate(izip_longest(row_rb1, row_rb2)):
            if c1 != c2:
                print "Row {} Col {} - {} != {}".format(rownum+1, colnum+1, c1, c2)
    else:
        print "Row {} missing".format(rownum+1)

这将显示两个文件之间不同的任何单元格。对于给定的两个文件,这将显示:

 Row 3 Col 2 - 0.235435 != 0.23546

如果您更喜欢单元格名称,请使用 xlrd.formular.colname()

 print "Cell {}{}  {} != {}".format(rownum+1, xlrd.formula.colname(colnum), c1, c2)

给你:

 Cell 3B  0.235435 != 0.23546

原文由 Martin Evans 发布,翻译遵循 CC BY-SA 4.0 许可协议

使用 pandas 你可以像这样简单地做到这一点:

 import pandas as pd

df1 = pd.read_excel('excel1.xlsx')
df2 = pd.read_excel('excel2.xlsx')

difference = df1[df1!=df2]
print difference

结果将如下所示:

在此处输入图像描述

原文由 Abbas 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题