将字典列表转换为数据框

新手上路,请多包涵

我面临一个基本问题,即转换通过解析带有 json 格式文本的列而获得的字典列表。以下是数据的简要快照:

 [{u'PAGE TYPE': u'used-serp.model.brand.city'},
 {u'BODY TYPE': u'MPV Cars',
  u'ENGINE CAPACITY': u'1461',
  u'FUEL TYPE': u' Diesel',
  u'MODEL NAME': u'Renault Lodgy',
  u'OEM NAME': u'Renault',
  u'PAGE TYPE': u'New-ModelPage.OverviewTab'},
 {u'PAGE TYPE': u'used-serp.brand.city'},
 {u'BODY TYPE': u'SUV Cars',
  u'ENGINE CAPACITY': u'2477',
  u'FUEL TYPE': u' Diesel',
  u'MODEL NAME': u'Mitsubishi Pajero',
  u'OEM NAME': u'Mitsubishi',
  u'PAGE TYPE': u'New-ModelPage.OverviewTab'},
 {u'BODY TYPE': u'Hatchback Cars',
  u'ENGINE CAPACITY': u'1198',
  u'FUEL TYPE': u' Petrol , Diesel',
  u'MODEL NAME': u'Volkswagen Polo',
  u'OEM NAME': u'Volkswagen',
  u'PAGE TYPE': u'New-ModelPage.GalleryTab'},

此外,我用来解析的代码详述如下:

 stdf_noncookie = []
stdf_noncookiejson = []

for index, row in df_noncookie.iterrows():
    try:
        loop_data = json.loads(row['attributes'])
        stdf_noncookie.append(loop_data)
    except ValueError:
        loop_nondata = row['attributes']
        stdf_noncookiejson.append(loop_nondata)

stdf_noncookie 是我试图转换成熊猫数据框的字典列表。 ‘attributes’ 是带有 json 格式文本的列。我试图从这个 链接 中获得一些经验,但这并不能解决我的问题。将字典列表转换为熊猫数据框的任何建议/技巧都会有所帮助。

原文由 Arshad Islam 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 465
1 个回答

要将您的字典列表转换为熊猫数据框,请使用以下命令:

 stdf_noncookiejson = pd.DataFrame.from_records(data)

熊猫.DataFrame.from_records

DataFrame.from_records _(data, index=None, exclude=None, columns=None, coercefloat=False, nrows=None)

您可以在阅读时设置索引、命名列等

如果您使用的是 json,您还可以使用 read_json 方法

stdf_noncookiejson = pd.read_json(data)

熊猫.read_json

pandas.read_json _(path_or_buf=None, orient=None, typ=‘frame’, dtype=True, convert_axes=True, convert_dates=True, keep_default_dates=True, numpy=False, precise_float=False, dateunit=None, encoding=None,线=假)

原文由 Craicerjack 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题