深入理解 Query String Query

本贴最后更新于 2538 天前,其中的信息可能已经东海扬尘

Query String Query

国内对于 Elasticsearch 深入的人并不多,或者大多数大牛不屑于分享关于 Elasticsearch 的知识,这里讲讲 Elasticsearch 中的 Constant Score Query

关于

概念

Query String Query提供了无需指定某字段而对文档全文进行匹配查询的一个高级查询,同时可以指定在哪些字段上进行匹配.

Query String Query 是真正意义上的全文检索

  • 可以在多个索引下进行无指定字段检索
  • 可以在指定的索引/类型下进行无指定字段检索

这两个特性导致 Query String Query 是真正意义上的全文检索,可以让你在浩瀚的 ES 集群中检索出你想要的数据.

语法

GET /_search
{
    "query": {
        "query_string" : {
            "default_field" : "content",
            "query" : "this AND that OR thus"
        }
    }
}

query_string 作为一个高级的全文查询,有很多参数来控制其检索行为

  • query 查询匹配的内容
  • default_field 如果未指定前缀字段,则为查询字词的默认字段。 默认为 index.query.default_field 索引设置,默认为_all。
  • default_operator 如果未指定显式运算符,则使用默认运算符。 例如,使用 OR 的默认运算符,匈牙利的查询资本将转换为 OR 匈牙利的资本 OR,如果使用默认运算符 AND,则相同的查询将转换为 AND 匈牙利的资本 AND。 默认值为 OR。
  • analyzer 用于分析查询字符串的分析器
  • allow_leading_wildcard 设置为 *或? 被允许作为第一个字符。 默认为 true。
  • lowercase_expanded_terms 通配符,前缀,模糊和范围查询的条件是否自动降低或不降低(因为它们没有被分析)。 默认为 true。
  • enable_position_increments 设置为 true 可在结果查询中启用位置增量。 默认为 true。
  • fuzzy_max_expansions 控制模糊查询将扩展到的术语数。 默认值为 50
  • fuzziness 设置模糊查询的模糊性。 默认为 AUTO。 有关允许的设置,请参阅“Fuzzinessedit”一节
  • fuzzy_prefix_length 设置模糊查询的前缀长度。 默认值为 0。
  • phrase_slop 设置短语的默认斜率。 如果为零,则需要精确的短语匹配。 默认值为 0。
  • boost 设置查询的提升值。 默认为 1.0。
  • analyze_wildcard 默认情况下,不分析查询字符串中的通配符术语。 将此值设置为 true,将尽力分析这些值。
  • auto_generate_phrase_queries 是否自动生成短语查询,默认 False
  • max_determinized_states 限制允许创建多少个自动机状态 regexp 查询。 这防止了太难的(例如指数级的)正则表达式。 默认为 10000。
  • minimum_should_match 一个值,用于控制在生成的布尔查询中应该匹配多少个“应该”子句。 它可以是绝对值(2),百分比(30%)或两者的组合。
  • lenient 如果设置为 true 将导致基于格式的失败(例如向数字字段提供文本)被忽略。
  • locale 应用于字符串转换的区域设置。 默认为 ROOT。
  • time_zone 要应用于与日期相关的任何范围查询的时区。 另请参阅 JODA 时区

常用参数

default_field

用于指定默认查询的字段

Multi Field

Java API

  @Test
      public void testForClient() throws Exception {
          MultiMatchQueryBuilder multiMatchQueryBuilder = QueryBuilders.multiMatchQuery("elasticsearch match query","title", "descrption");

          multiMatchQueryBuilder.analyzer("standard");
          multiMatchQueryBuilder.cutoffFrequency(0.001f);
          multiMatchQueryBuilder.field("title",20);
          multiMatchQueryBuilder.fuzziness(Fuzziness.TWO);
          multiMatchQueryBuilder.maxExpansions(100);
          multiMatchQueryBuilder.prefixLength(10);
          multiMatchQueryBuilder.tieBreaker(20);
          multiMatchQueryBuilder.type(MultiMatchQueryBuilder.Type.BEST_FIELDS);
          multiMatchQueryBuilder.boost(20);



         SearchResponse searchResponse =  client.prepareSearch()
                  .setIndices("blogs")
                  .setTypes("blog")
                  .setQuery(multiMatchQueryBuilder)
                  .execute()
                  .actionGet();

         System.out.println(ResponseUtil.parse(searchResponse));
      }

更多关于 Java API,请参考:MultiMatchQueryDemo

参考

  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 212 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...