[Logstash] multiline codecで処理したファイルを削除した際のエラーについて


#1

■環境

  • Windows10 Pro 64bit
  • メモリ : 64GB
  • logstash-6.4.2

特定のフォルダにxmlファイルがコピーされたことをトリガーに内容をフィルタリングし
elasticsearchへ送信するパイプラインの実装を進めています。

input, filter, outputの実装が完了しテストを繰り返しているのですが
logstashのagent起動中に終端(eof)まで読み終わったxmlファイルを削除すると
下記のようなエラーが繰り返し出力されます。(パスなど一部修正しています)

[2018-10-31T19:17:06,800][ERROR][filewatch.tailmode.processor] Ignored - other error <xmlファイルパス>: (No such process - <xmlファイルパス>, ["org/jruby/RubyFile.java:938:in stat'", "<logstashインストールパス>/vendor/bundle/jruby/2.3.0/gems/logstash-input-file-4.1.6/lib/filewatch/stat/windows_path.rb:19:inrestat'", "<logstashインストールパス>/vendor/bundle/jruby/2.3.0/gems/logstash-input-file-4.1.6/lib/filewatch/watched_file.rb:110:in restat'", "<logstashインストールパス>/vendor/bundle/jruby/2.3.0/gems/logstash-input-file-4.1.6/lib/filewatch/tail_mode/processor.rb:271:incommon_restat'", "<logstashインストールパス>/vendor/bundle/jruby/2.3.0/gems/logstash-input-file-4.1.6/lib/filewatch/tail_mode/processor.rb:261:in common_restat_with_delay'", "<logstashインストールパス>/vendor/bundle/jruby/2.3.0/gems/logstash-input-file-4.1.6/lib/filewatch/tail_mode/processor.rb:117:inblock in process_ignored'", "org/jruby/RubyArray.java:1734:in each'", "<logstashインストールパス>/vendor/bundle/jruby/2.3.0/gems/logstash-input-file-4.1.6/lib/filewatch/tail_mode/processor.rb:116:inprocess_ignored'"])

このエラーは multiline codec を使用しない通常のinput-fileでの処理では発生しないので
おそらくmultiline codecによる監視が外れないことが原因と考えています。

フォルダに蓄積されたxmlファイルから古い順に定期削除することを想定しており
このエラーを回避できないかと調査しましたが解決に至りませんでした。

一度終端(eof)まで読み込んだxmlファイルを削除してもエラーが発生しないために
必要な confの記述方法があれば情報をお願いします。

以下一部抜粋となりますが実装したconfファイルの内容です。

input {
	file {
		path => "<任意のパス>/**/*.xml"
		start_position => "beginning"
		close_older => 1
		codec => multiline {
			pattern => "^<\?Sample .*\>"
			negate => true
			what => "previous"
		}
	}
}
filter {
	xml {
		...
	}
}
output {
    elasticsearch {
    hosts => [<ホストURL>]
		index => "sample_index"
	}
}

よろしくお願いします。


#2

こちらの実現したい要点を追記させていただきます。

  • 特定のフォルダに配置されたxmlファイルを対象とする
  • xmlファイルは完成されたものが複数のPCから不定期にコピーされる(後に追記などは行われない)
  • logstashはxmlをパースした内容をelasticsearchへ送信
  • 蓄積されたxmlファイルは週単位/月単位で古いものからメンテナンスワークフローにて削除される
  • xmlファイルは別用途でも利用されるため file_completed_action => delete は使用不可能

mode => read を利用することでこの問題が発生しないことも確認できています。
その場合 file_completed_action が動作することになりますがログファイルを残す必要もなく(ログの肥大化メンテのコストを掛けたくない)
前述したとおり delete も指定することができません。
今後 file_completed_action が何もしなくなるような設定が可能になれば採用したいとは考えています。

以上です。


(Jun Ohtani) #3

https://www.elastic.co/guide/en/logstash/current/plugins-codecs-multiline.html#plugins-codecs-multiline-auto_flush_interval

これを設定してみるとどうでしょうか?

もしくは、whatnextにしてSampleという終了タグがこない間という条件にするのはどうでしょう?


#4

auto_flush_intervalの存在を失念していました。
変更して検証を進めてみます。

ありがとうございました。


(system) #5

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.