前言

这里声明: elasticsearch -> es

漫谈

我们都知道Python 下 有es的sdk包的,我们也知道java 下有封装更好的es包。为什么说python 下的就封装不好呢? 其实这个也两说,有人就喜欢这样呢

Python下的es包首先什么都能做,实现功能完全没问题。但是对于 DSL 的话,Python下的es就没有封装了,完全按照es的语法写查询语句。当然这种也是优点,但是如果用了Java下的es 的sdk的话,你会会发现对于DSL 都封装的很好。

至于封不封装DSL,其实也看业务复不复杂,简单的业务,几行的DSL 直接写也没什么,但是如果很长的呢,比如我这样业务的DSL:

{
    "size": 1000,
    "query": {
        "bool": {
            "must": [
                {
                    "term": {
                        "prod_code": {
                            "value": "JDB"
                        }
                    }
                },
                {
                    "bool": {
                        "must": [],
                        "must_not": [],
                        "should": [
                            {
                                "bool": {
                                    "must": [],
                                    "must_not": [],
                                    "should": [
                                        {
                                            "query_string": {
                                                "default_field": "rp_content",
                                                "query": "*下了*"
                                            }
                                        },
                                        {
                                            "query_string": {
                                                "default_field": "rp_content",
                                                "query": "*下款*"
                                            }
                                        }
                                    ],
                                    "filter": []
                                }
                            },
                            {
                                "nested": {
                                    "path": "rp_data",
                                    "query": {
                                        "bool": {
                                            "must": [],
                                            "must_not": [],
                                            "should": [
                                                {
                                                    "query_string": {
                                                        "default_field": "rp_data.rp_content",
                                                        "query": "*下了*"
                                                    }
                                                },
                                                {
                                                    "query_string": {
                                                        "default_field": "rp_data.rp_content",
                                                        "query": "*下款*"
                                                    }
                                                }
                                            ],
                                            "filter": []
                                        }
                                    }
                                }
                            }
                        ],
                        "filter": []
                    }
                }
            ]
        }
    }
}

如果是这样的DSL 直接写在代码中,这个也太长了吧,而且这还不是全部,只是一部分,对于这种动态而且复杂的DSL,直接写,会显得太长。

故此,我对Python 下的es包进行了增强 —— 对DSL进行封装。项目请点击:# elasticsearch-python

对于上面DSL 的封装调用结果是这样的:


    prod_code = 'JDB'
    key = "下了"
    value = '下了 | 下款'
    bq = bool_query()
    bq.must(term_query('prod_code', prod_code)) \
        .must(bool_query()
              .should(multi_query_string('rp_content', value))
              .should(nested_query('rp_data', multi_query_string('rp_data.rp_content', value)))
              )

    print(bq)
    print(QueryBuilders(bq).size(1000))

这下清爽了很多是吧!

当然这个没写完,对于聚合还没写,而且query也没全部支持,只是把自己用到的给简单封装了下,其实不知道到底有没有人用,没人用自己写再多也就自己玩玩了。这里我的实现也很简单,其实希望有人能有更好的实现。


mugbya
1.2k 声望41 粉丝

时间永远分岔,通往无数未来