Nested内のオブジェクト数でソートする方法について

お世話になっております。
現在、以下のようなnestedフィールドのインデックスを作成し、

PUT my_index
{
  "mappings": {
    "properties": {
      "user": {
        "type": "nested" 
      }
    }
  }
}

nested内のオブジェクト数が1,2,3となるようにドキュメントを入れた際に、

PUT my_index/_doc/1
{
  "user" : [
    {
      "first" : "John",
      "last" :  "Smith"
    }
  ]
}
PUT my_index/_doc/2
{
  "user" : [
    {
      "first" : "John",
      "last" :  "Smith"
    },
    {
      "first" : "Alice",
      "last" :  "White"
    }
  ]
}
PUT my_index/_doc/3
{
  "user" : [
    {
      "first" : "John",
      "last" :  "Smith"
    },
    {
      "first" : "Alice",
      "last" :  "White"
    },
    {
      "first" : "hoge",
      "last" :  "fuga"
    }
  ]
}

これらをuserフィールド内のオブジェクト数でソートをして取得することは可能でしょうか?
※Elasticsearchのバージョンは6.5になります

お手数をおかけしますが、もし方法がありましたらご教示頂ければ幸いです。
以上、よろしくお願い致します。

https://www.elastic.co/guide/en/elasticsearch/reference/6.5/search-request-sort.html#_script_based_sorting

script_based_sortingはどうでしょうか?提示されたテストデータだと期待したような結果になるかと思います。

POST my_index/_search
{
  "sort": {
    "_script": {
      "type": "number",
      "order": "desc",
      "script": "params._source['user'].size()"
    }
  }
}

ありがとうございます!上手く動きました!

あまり理解せずに docs['user']ctx._source.user などで取得を試みていたのですが、params._source['user']という取り方があるんですね…

https://www.elastic.co/guide/en/elasticsearch/reference/current//search-request-body.html#request-body-search-script-fields
こちらに記載されている It’s important to understand the difference ... というところに、
docsとparamsの違いについて記述されているのを確認しました。

ctxについては以下を確認する限り、update, update_by_query, reindex APIでのみ使用出来るようですね。
https://www.elastic.co/guide/en/elasticsearch/reference/master/modules-scripting-fields.html#_update_scripts

大変勉強になりました、ご回答ありがとうございました。

https://www.elastic.co/guide/en/elasticsearch/reference/current//search-request-body.html#request-body-search-script-fields

によりますと、

Using _source is very slow.

と、書かれています。

要素の数でソートしたい、という要件を満たすのであれば、
データ投入時に、その値を別フィールドに保持しておき、そのフィールドでソートする方が、よりシンプルかと思います。

例)

PUT my_index/_doc/2
{
  "user_count": 2,
  "user" : [
    {
      "first" : "John",
      "last" :  "Smith"
    },
    {
      "first" : "Alice",
      "last" :  "White"
    }
  ]
}
1 Like