新手上路，请多包涵

状态的 XML 数据 (file.xml) 如下所示

<?xml version="1.0" encoding="UTF-8" standalone="true"?>
<Activity_Logs xsi:schemaLocation="http://www.cisco.com/PowerKEYDVB/Auditing
DailyActivityLog.xsd" To="2018-04-01" From="2018-04-01" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="http://www.cisco.com/PowerKEYDVB/Auditing">
    <ActivityRecord>
       <time>2015-09-16T04:13:20Z</time>
       <oper>Create_Product</oper>
       <pkgEid>10</pkgEid>
       <pkgName>BBCWRL</pkgName>
       </ActivityRecord>
    <ActivityRecord>
       <time>2015-09-16T04:13:20Z</time>
       <oper>Create_Product</oper>
       <pkgEid>18</pkgEid>
       <pkgName>CNNINT</pkgName>
    </ActivityRecord>

上述 XML 文件的解析和转换为 CSV 将由以下 python 代码完成。

 import csv
import xml.etree.cElementTree as ET

tree =  ET.parse('file.xml')
root = tree.getroot()

data_to_csv= open('output.csv','w')

list_head=[]

Csv_writer=csv.writer(data_to_csv)

count=0
for elements in root.findall('ActivityRecord'):
    List_node = []
    if count == 0 :

        time = elements.find('time').tag
        list_head.append(time)

        oper = elements.find('oper').tag
        list_head.append(oper)

        pkgEid = elements.find('pkgEid').tag
        list_head.append(pkgEid)

        pkgName = elements.find('pkgName').tag
        list_head.append(pkgName)

        Csv_writer.writerow(list_head)
        count = +1

    time = elements.find('time').text
    List_node.append(time)

    oper = elements.find('oper').text
    List_node.append(oper)

    pkgEid = elements.find('pkgEid').text
    List_node.append(pkgEid)

    pkgName = elements.find('pkgName').text
    List_node.append(pkgName)

    Csv_writer.writerow(List_node)

data_to_csv.close()

我使用的代码没有给我任何 CSV 格式的数据。有人可以告诉我我哪里出错了吗？

原文由 Nipun khanna 发布，翻译遵循 CC BY-SA 4.0 许可协议

python-3.x pandas csv beautifulsoup xml.etree

阅读 683

2 个回答

得票最新

社区维基

发布于
2022-11-17

✓ 已被采纳

找到最合适的方法：

 import os
import pandas as pd
from bs4 import BeautifulSoup as b

with open("file.xml", "r") as f: # opening xml file
    content = f.read()

soup = b(content, "lxml")
df1 = pd.DataFrame()

for each_file in files_xlm:
    with open( each_file, "r") as f: # opening xml file
        content = f.read()
    soup = b(content, "lxml")

    list1 = []
    for values in soup.findAll("activityrecord"):
        if values.find("time") is None:
            time = ""
        else:
            time = values.find("time").text
        if values.find("oper") is None:
            oper = ""
        else:
            oper = values.find("oper").text
        if values.find("pkgeid") is None:
            pkgeid = ""
        else:
            pkgeid = values.find("pkgeid").text
        if values.find("pkgname") is None:
            pkgname = ""
        else:
            pkgname = values.find("pkgname").text
        if values.find("dhct") is None:
            dhct = ""
        else:
            dhct = values.find("dhct").text
        if values.find("sourceid") is None:
            sourceid = ""
        else:
            sourceid = values.find("sourceid").text

        list1.append(time+','+ oper+','+pkgeid+','+ pkgname+','+dhct+','+sourceid)
        df = pd.DataFrame(list1)

df=df[0].str.split(',', expand=True)
df.columns = ['Time','Oper','PkgEid','PkgName','dhct','sourceid']
df.to_csv("new.csv",index=False)

原文由 Nipun khanna 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2022-11-17

使用 Pandas，解析所有 xml 字段。

 import xml.etree.ElementTree as ET
import pandas as pd

tree = ET.parse("file.xml")
root = tree.getroot()

get_range = lambda col: range(len(col))
l = [{r[i].tag:r[i].text for i in get_range(r)} for r in root]

df = pd.DataFrame.from_dict(l)
df.to_csv('file.csv')

原文由 Willian Vieira 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

XML 到 CSV Python

你尚未登录，登录后可以

请问有没有免费的，类似 Excel 的轻量级表格数据编辑组件？

如何解决使用 bs4 模块中 find_all 提取列表元素中包含回车符的现象？

Stack Overflow 翻译