如何在使用 JSON 模块进行漂亮打印时实现自定义缩进?

新手上路,请多包涵

所以我使用 Python 2.7,使用 json 模块来编码以下数据结构:

 'layer1': {
    'layer2': {
        'layer3_1': [ long_list_of_stuff ],
        'layer3_2': 'string'
    }
}

我的问题是我正在使用漂亮的打印打印出所有内容,如下所示:

 json.dumps(data_structure, indent=2)

这很好,除了我想全部缩进,除了 "layer3_1" 中的内容——这是一个巨大的字典列表坐标,因此,在每个坐标上设置一个值使得漂亮的打印创建一个文件有数千行,示例如下:

 {
  "layer1": {
    "layer2": {
      "layer3_1": [
        {
          "x": 1,
          "y": 7
        },
        {
          "x": 0,
          "y": 4
        },
        {
          "x": 5,
          "y": 3
        },
        {
          "x": 6,
          "y": 9
        }
      ],
      "layer3_2": "string"
    }
  }
}

我真正想要的是类似于以下内容的内容:

 {
  "layer1": {
    "layer2": {
      "layer3_1": [{"x":1,"y":7},{"x":0,"y":4},{"x":5,"y":3},{"x":6,"y":9}],
      "layer3_2": "string"
    }
  }
}

我听说可以扩展 json 模块:是否可以将其设置为仅在 "layer3_1" 对象内部时关闭缩进?如果是这样,有人会告诉我怎么做吗?

原文由 Rohaq 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 980
2 个回答

注意: 此答案中的代码仅适用于 json.dumps() 返回 JSON 格式的字符串,但 不适 用于 json.dump() 直接写入类似文件的对象。它有一个修改版本在我对 Write two-dimensional list to JSON file 这个问题的回答中,两者都适用。)

更新

以下是我的原始答案的一个版本,该版本已经过多次修改。与原始版本不同,我发布它只是为了展示如何让 JFSebastian 的 回答 中的第一个想法起作用,并且与他的一样,它返回了对象的非缩进 字符串 表示形式。最新更新版本返回隔离格式化的 Python 对象 JSON。

每个坐标的键 dict 将按照 OP 的评论之一按排序顺序出现,但前提是 sort_keys=True 关键字参数在初始 json.dumps() 调用驱动过程,它不再沿途将对象的类型更改为字符串。换句话说,现在保留了“包装”对象的实际类型。

我认为不理解我帖子的初衷会导致很多人对其投反对票——因此,主要是出于这个原因,我多次“修复”并改进了我的答案。当前版本是我的原始答案的混合体,加上@Erik Allik 在他的 答案 中使用的一些想法,以及该答案下方评论中显示的其他用户的有用反馈。

以下代码似乎在 Python 2.7.16 和 3.7.4 中都可以正常工作。

 from _ctypes import PyObj_FromPtr
import json
import re

class NoIndent(object):
    """ Value wrapper. """
    def __init__(self, value):
        self.value = value

class MyEncoder(json.JSONEncoder):
    FORMAT_SPEC = '@@{}@@'
    regex = re.compile(FORMAT_SPEC.format(r'(\d+)'))

    def __init__(self, **kwargs):
        # Save copy of any keyword argument values needed for use here.
        self.__sort_keys = kwargs.get('sort_keys', None)
        super(MyEncoder, self).__init__(**kwargs)

    def default(self, obj):
        return (self.FORMAT_SPEC.format(id(obj)) if isinstance(obj, NoIndent)
                else super(MyEncoder, self).default(obj))

    def encode(self, obj):
        format_spec = self.FORMAT_SPEC  # Local var to expedite access.
        json_repr = super(MyEncoder, self).encode(obj)  # Default JSON.

        # Replace any marked-up object ids in the JSON repr with the
        # value returned from the json.dumps() of the corresponding
        # wrapped Python object.
        for match in self.regex.finditer(json_repr):
            # see https://stackoverflow.com/a/15012814/355230
            id = int(match.group(1))
            no_indent = PyObj_FromPtr(id)
            json_obj_repr = json.dumps(no_indent.value, sort_keys=self.__sort_keys)

            # Replace the matched id string with json formatted representation
            # of the corresponding Python object.
            json_repr = json_repr.replace(
                            '"{}"'.format(format_spec.format(id)), json_obj_repr)

        return json_repr

if __name__ == '__main__':
    from string import ascii_lowercase as letters

    data_structure = {
        'layer1': {
            'layer2': {
                'layer3_1': NoIndent([{"x":1,"y":7}, {"x":0,"y":4}, {"x":5,"y":3},
                                      {"x":6,"y":9},
                                      {k: v for v, k in enumerate(letters)}]),
                'layer3_2': 'string',
                'layer3_3': NoIndent([{"x":2,"y":8,"z":3}, {"x":1,"y":5,"z":4},
                                      {"x":6,"y":9,"z":8}]),
                'layer3_4': NoIndent(list(range(20))),
            }
        }
    }

    print(json.dumps(data_structure, cls=MyEncoder, sort_keys=True, indent=2))

输出:

 {
  "layer1": {
    "layer2": {
      "layer3_1": [{"x": 1, "y": 7}, {"x": 0, "y": 4}, {"x": 5, "y": 3}, {"x": 6, "y": 9}, {"a": 0, "b": 1, "c": 2, "d": 3, "e": 4, "f": 5, "g": 6, "h": 7, "i": 8, "j": 9, "k": 10, "l": 11, "m": 12, "n": 13, "o": 14, "p": 15, "q": 16, "r": 17, "s": 18, "t": 19, "u": 20, "v": 21, "w": 22, "x": 23, "y": 24, "z": 25}],
      "layer3_2": "string",
      "layer3_3": [{"x": 2, "y": 8, "z": 3}, {"x": 1, "y": 5, "z": 4}, {"x": 6, "y": 9, "z": 8}],
      "layer3_4": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
    }
  }
}

原文由 martineau 发布,翻译遵循 CC BY-SA 4.0 许可协议

一个 bodge,但是一旦您从 dumps() 获得字符串,如果您确定其内容的格式,就可以对其执行正则表达式替换。类似的东西:

 s = json.dumps(data_structure, indent=2)
s = re.sub('\s*{\s*"(.)": (\d+),\s*"(.)": (\d+)\s*}(,?)\s*', r'{"\1":\2,"\3":\4}\5', s)

原文由 M Somerville 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题