値の型によって登録対象のフィールドを分けたい

t-nakata · June 2, 2022, 8:57am

JSON形式のログを、logstashのjsonフィルターを使用して取り込んでおります。
現状の問題として、ドキュメントにより同じフィールド名(以下、fieldA)でも数値型の場合と文字列型の場合があります。その場合、初回にドキュメントを取り込んだ際に、fieldAが数字の場合、数値型で動的にマッピングされますが、その後に数値以外の文字列がfieldAに設定されていた場合はマッピングエラーとなってしまいます。
例えば、fieldAの値を事前に解析し、数字の場合はfieldA_numberフィールド、その他の文字列の場合はfieldA_textフィールドに格納するといったことは可能でしょうか？

なお、当該ドキュメントはキー名が多岐に渡るため、インデックステンプレートにて予め型を決めておくことが困難です

Koji_Kawamura · June 15, 2022, 9:41am

@t-nakata さん、

なかなか厄介な状況ですね。

他に解決方法があるような気もしますが、興味本位で Logstash の ruby filter を使ってカスタムスクリプトを書いてみました。こちらからダウンロードできます。 rename_by_data_type.rb

使用例:

filter {
  ruby {
    path => '/{path_of_the_ruby_script}/rename_by_data_type.rb'
    script_params => { 'field' => 'the_name_of_target_field' }
  }
}

実行時のイメージ:
二件のメッセージが渡ってきて、同じフィールド名なのに型が違う場合のイメージです。型の名前を元々のフィールド名の末尾に追記するようにしています。

Input:

[
{"values": {"fieldA": "a", "fieldB": "b", "fieldC": "c"}},
{"values": {"fieldA": 1, "fieldB": 2, "fieldC": 3}}
]

Output:

[
{"values": {"fieldA_String": "a", "fieldB_String": "b", "fieldC_String": "c"}},
{"values": {"fieldA_Integer": 1, "fieldB_Integer": 2, "fieldC_Integer": 3}}
]

Topic		Replies	Views
1Fieldに複数datatypeが存在する場合の対処日本語による質問・議論はこちら	2	2612	September 24, 2019
How to change the data type values Logstash	18	1020	May 3, 2018
Can logstash get the type of field? Logstash	6	8200	September 26, 2016
Make logstash filter map field differantly based on the value Logstash	1	368	February 27, 2018
Logstash - based on filed type create a new field Logstash docker	5	667	September 9, 2021

値の型によって登録対象のフィールドを分けたい

Related topics