我面临一个基本问题,即转换通过解析带有 json 格式文本的列而获得的字典列表。以下是数据的简要快照:
[{u'PAGE TYPE': u'used-serp.model.brand.city'},
{u'BODY TYPE': u'MPV Cars',
u'ENGINE CAPACITY': u'1461',
u'FUEL TYPE': u' Diesel',
u'MODEL NAME': u'Renault Lodgy',
u'OEM NAME': u'Renault',
u'PAGE TYPE': u'New-ModelPage.OverviewTab'},
{u'PAGE TYPE': u'used-serp.brand.city'},
{u'BODY TYPE': u'SUV Cars',
u'ENGINE CAPACITY': u'2477',
u'FUEL TYPE': u' Diesel',
u'MODEL NAME': u'Mitsubishi Pajero',
u'OEM NAME': u'Mitsubishi',
u'PAGE TYPE': u'New-ModelPage.OverviewTab'},
{u'BODY TYPE': u'Hatchback Cars',
u'ENGINE CAPACITY': u'1198',
u'FUEL TYPE': u' Petrol , Diesel',
u'MODEL NAME': u'Volkswagen Polo',
u'OEM NAME': u'Volkswagen',
u'PAGE TYPE': u'New-ModelPage.GalleryTab'},
此外,我用来解析的代码详述如下:
stdf_noncookie = []
stdf_noncookiejson = []
for index, row in df_noncookie.iterrows():
try:
loop_data = json.loads(row['attributes'])
stdf_noncookie.append(loop_data)
except ValueError:
loop_nondata = row['attributes']
stdf_noncookiejson.append(loop_nondata)
stdf_noncookie 是我试图转换成熊猫数据框的字典列表。 ‘attributes’ 是带有 json 格式文本的列。我试图从这个 链接 中获得一些经验,但这并不能解决我的问题。将字典列表转换为熊猫数据框的任何建议/技巧都会有所帮助。
原文由 Arshad Islam 发布,翻译遵循 CC BY-SA 4.0 许可协议
要将您的字典列表转换为熊猫数据框,请使用以下命令:
熊猫.DataFrame.from_records
您可以在阅读时设置索引、命名列等
如果您使用的是 json,您还可以使用
read_json
方法熊猫.read_json