Elasticsearchの自動マッピングについて

elastisearch7.8.1でシステムを構築しています。Index作成時、手動でKeyword型のマッピングをしています。

PUT   /hoge_index/_mapping
{
   "properties":{
     "text_data" : {
        "type" : "keyword"
        }
    }
}

このIndexに、データを投入します。

POST  /hoge_index/_doc/
{
  "text_data" : " これはテキストデータ"
}

データの投入後、 elastcsearch のマッピングを確認すると、フィールドがTextになっており、multifieldとしてKeyword型が定義されていました。

    ... 略 ...
"text_data" :  {
    "type" : "text",
    "fields" : {
        "type" : "keyword".
         "ignore_above" : 256
      }
 }

■質問
おそらく ”text_data" フィールドは自動マッピングによって定義されたのではないかと思っています。Keyword型としてデータを投入したい場合は、何か特別な指定が必要でしょうか?

また、 自動マッピングを "dynamic" : "false" または "strict" にしないといけないのでしょうか?

当該フィールドをKibanaでSort等しているのですが、TEXT型になってしまっており大量に警告が出てしまい、困っています。(Keyword型にせよとの警告)

すみませんがどなたか教えてください。

自己RESですみません。

未公開のシステムのため、いったんIndexを破棄してKeyword型で再作成し、再度データ投入をしたところ問題がありませんでした。

おそらく、問題発生時はIndex作成より前になんらかの形でデータ投入のAPIが発行され、自動マッピングされたのではと思います(ログを確認しておきます)。

システムにもよりますが、基本は自動マッピングは strict にしたほうがよさそうです。お騒がせしました。

7.8.1で提示されているインデックス作成、マッピング作成、データ投入、マッピング確認を行ったところ、状況を再現できませんでしたが解決されたようで何よりです。

可能性としての話ですが、ご覧になっていたtext_dataの箇所が、マッピングのものと違っていたということはないでしょうか???
いずれにしても解決済みなので良かったです。

POST /hoge_index/_doc/
{
  "text_data" : " これはテキストデータ",   //ここはMappingによりKeywordになる
  "test": {
    "text_data": "入れ子のテキストデータ" //Mapping定義がないので、textになった
  }
}

返信ありがとうございます。

ご指摘の可能性も含め、POSTしたデータ不良も疑ってみましたが、階層は問題ございませんでした。(なんせ、今回のデータはフラットの階層なしデータだったので)

正直、今のところの原因はわかっておらず、dynamic mappingで "text field with a keyword sub-field" が作られるとのことなので、この機能で作られると推測していました。大量の登録APIがキューに残っている状態でIndexをいったん削除したり、といったオペミスだったのではないかと。

いずれにせよ、いったんは解決です。ありがとうございました。

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.