Как распарсить лог нжинкса в случае хождения по апстримам

vitich · November 6, 2018, 9:10am

Помогите с идеями как лучше распарсить лог нжинкса в случае хождения по апстримам

Прилетать может в подобных вариациях:
В зависимости от количества апстримов и с разделителями ", " или " : "
Формат аля csv в данном случае не принципиален, принципиально понять суть как лучше.
Моя идея в том чтобы ловить последний апстрим как upstream (айпи, статус и время коннект респонс), а всё что до последнего апстрима запихивать в badupstream просто текстом.
Может у кого-то был опыт?
В идеале, конечно, если бы nginx отправлял в таких случаях отдельными полями, тогда бы не было вопросов - включил json и всё, а так приходится выкручиваться ибо не люблю _grokparsefailure

Вот примерные вариации логов ("upstream_addr"; "upstream_status"; "upstream_connect_time"; "upstream_response_time")

"-"; "-"; "- sec"; "- sec";
"-, -"; "-, -"; "-, - sec"; "-, - sec";
"- : -"; "- : -"; "- : - sec"; "- : - sec";
"-, - : -"; "-, - : -"; "-, - : - sec"; "- : - sec";
"10.10.10.23:80"; "200"; "2.953 sec"; "2.953 sec";
"10.10.10.23:80, 10.10.10.24:80"; "502, -"; "2.953, - sec"; "2.953, - sec";
"10.10.10.23:80 : 10.10.10.24:80"; "502 : -"; "2.953 : - sec"; "2.953 : - sec";
"10.10.10.23:80, 10.10.10.24:80 : 10.10.10.25:80"; "502, 502 : -"; "2.953, 1.000 : - sec"; "2.953, 2.000 : - sec";
"10.10.10.23:80, 10.10.10.24:80 : 10.10.10.25:80"; "502, 502 : 200"; "2.953, 1.000 : 0.001 sec"; "2.953, 2.000 : 0.002 sec";
"10.10.10.23:80, 10.10.10.24:80, 10.10.10.25:80"; "502, 502, -"; "2.953, 1.000, - sec"; "2.953, 2.000, - sec";
"10.10.10.23:80, 10.10.10.24:80, 10.10.10.25:80"; "502, 502, 200"; "2.953, 1.000, 0.001 sec"; "2.953, 2.000, 0.002 sec";

Vladimir.Dolzhenko · November 6, 2018, 9:16am

может лучше воспользоваться CSV фильтром ?

vitich · November 6, 2018, 10:22am

А как это решит проблему с апстримами?
Формат не принципиален, к сожалению - в данном случае он похож на csv но проблема не с полями, как таковыми, а с множественными значениями внутри некоторых полей - вот их и хочу ловить правильно.
Сейчас у меня работает вариант который выкусывает последнее как upstream* и всё что до как badupstream - а чем csv фильтр мне поможет?

vitich · November 7, 2018, 10:09am

Я нашел решение (gsub + split + ruby)
Если есть поля с множественными значениями, то из них создаются доп. поля.
Потестирую и выложу сюда, если всё устроит.

system · December 5, 2018, 10:09am

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
Dealing with repeated upstream fields in a Nginx log Logstash	2	3207	August 22, 2017
Grok pattern for custome logs Logstash	1	920	September 28, 2018
Ignore groups that are not in the log Logstash	8	393	September 11, 2020
Logstash не может распачрсить сообщение, а в grokdebugger парсит Вопросы на русском языке	19	1385	December 12, 2019
\n символы заменить на пробел или табуляцию Вопросы на русском языке	7	2404	December 5, 2017

Как распарсить лог нжинкса в случае хождения по апстримам

Related topics