データ登録時にIPアドレスの範囲をチェックする方法

t-nakata · August 31, 2021, 1:57am

logstash→Elasticsearchというルートで、IPアドレスフィールドを保持するドキュメントを登録しています。登録時にIPアドレスをチェックし、指定の範囲内であればフラグを付与したいのですが可能でしょうか？LogstashもしくはIngestノードにて可能ではないかと思うのですが、情報が見当たらず投稿させて頂きました。ご教示いただけますでしょうか。

bruce_shimizu · August 31, 2021, 9:44am

IngestするDocからIPアドレスフィールドを取り出して、条件比較して、別のフィールドにフラグを付与する、というのは、LogstashでもIngest Pipelineでも可能です。

問題は、条件比較の条件が動的なものか静的なものか、ということになります。

Logstashであれば、条件となるような範囲をIn memoryに保持して、それと比較して処理をするというのは、意外と簡単にできます。フラグ付は、add_field or add_tag でやればいいと思います。

もちろん、静的な条件であれば、ruby filterを使って、条件をparamで渡して、条件をScriptで書くことが可能です。

Ingest Pipelineでも、PainlessでScriptは書けるのですが、条件を外部から動的に読み込むのは無理なので、静的な条件をパラメータで渡して、Scriptで制御する形になりますね。

条件はパラメータで渡さなくても、ずっと変更がないなら、Script内で定数として定義してもOKですが。。。

t-nakata · September 1, 2021, 12:23am

ご回答ありがとうございます。参考にさせて頂きます。

条件は別インデックスに保持し、そちらを参照する方式としたいのですが、そのケースは「条件を外部から動的に読み込むのは無理」に該当しますでしょうか？
また、enrichプロセッサーを使用することでも実現可能かと思ったのですが、いかがでしょうか？

bruce_shimizu · September 1, 2021, 1:50am

Enrich processorは、基本的に条件が一意に決まらないと使えないです。

例えば、こちらの例のように、IndexAのあるDocの"email"というフィールドが、IndexBのあるDocの"email"というフィールドに一致する時に、IndexBのそのDocの"first_name" "last_name"をIndexAのDocに追加する(Enrichする)と言った具合にです。

IPアドレスのレンジだと、こうしたIndexBに相当するものを作るのは難しいのではないかと思いました。

なので、残念ながら、IPアドレスレンジ的なものを別のIndexで保持して、それを参照して条件判定は、Ingest Pipelineではできないですね。

似たようなことは、Logstashではできますが、これだと1つのDocument毎にElasticsearchに毎回Query投げるので、効率的には良いとは言えません。なので、最初のLogstashのjdbc_staticでメモリ上に条件テーブルを展開して、それを使う方がいいかな、と思います。

Topic		Replies	Views
Grok, If condition in elasticsearch section Logstash	2	400	July 23, 2018
Creating ingest node pipeline with if condition Elasticsearch	3	509	April 14, 2021
Store an IP range in ES Elasticsearch	5	1287	August 10, 2016
Finding ip address ranges that contain a given ip address Elasticsearch	2	1328	November 15, 2012
I want to Index IPs in elasticsearch from my text document Logstash	0	309	December 10, 2019

データ登録時にIPアドレスの範囲をチェックする方法

Related topics