harue  
                (harue)
               
                 
              
                  
                    December 18, 2019,  7:13am
                   
                   
              1 
               
             
            
              お世話になっております。
Ingest nodeについてご質問です。
サンプルログ 
value1|value2|key3=value3 key4=value4
上記ログは、1つのログに形式の異なるデータが存在します。
このログを 
"value1|value2|箇所は、Dissect Proccesor にて下記の方法で定義
dissect {
   mapping => {
     "message" => "%{key1}|%{key2}"
    }
  }
 
key3=value3 key4=value4箇所は、KV Proccesor にて下記の方法で定義
{
  "kv": {
    "field": "message",
    "field_split": " ",
    "value_split": "="
  }
}
 
したいと考えております。
インデックスデータは1つのインデックスに以下のように登録したいです。
field名 value
key1     value1
key2     value2
key3     value3
key4     value4
 
ご質問 
上記2つのprocessorを1つのpipeline上に定義する方法について教えて下さい。 
1つのpipeline上では実現不可の場合、pipelineをそれぞれに分けて実現する方法があれば教えてください。
お手数ですが、回答頂けますと幸いです。
             
            
               
               
               
            
            
           
          
            
              
                tsgkdt  
                (tsgkdt)
               
              
                  
                    December 18, 2019,  1:25pm
                   
                   
              2 
               
             
            
              1度で定義する、のイメージがよく分からなかったのですが、こういうことです?
Ingest Nodeと書いてあったので、Pipeline processorのsimulateを貼っておきます。
POST _ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "dissect": {
          "field": "message",
          "pattern": "%{key1}|%{key2}|%{other}",
          "ignore_missing": true
        }
      },
      {
        "kv": {
          "field": "other",
          "field_split": " ",
          "value_split": "="
        }
      },
      {
        "remove": {
          "field": "other"
        }
      }
    ]
  },
  "docs": [
    {
      "_index": "aaa",
      "_id": "1",
      "_source": {
        "message": "value1|value2|key3=value3 key4=value4"
      }
    }
  ]
}
 
得られる結果がこちら 
key1, 2, 3, 4と揃っているように見えますがどうでしょうか?
{
  "docs" : [
    {
      "doc" : {
        "_index" : "aaa",
        "_type" : "_doc",
        "_id" : "1",
        "_source" : {
          "key1" : "value1",
          "key2" : "value2",
          "key3" : "value3",
          "key4" : "value4",
          "message" : "value1|value2|key3=value3 key4=value4"
        },
        "_ingest" : {
          "timestamp" : "2019-12-16T14:26:14.335988Z"
        }
      }
    }
  ]
}
 
             
            
               
               
               
            
            
           
          
            
              
                harue  
                (harue)
               
              
                  
                    December 19, 2019,  1:46am
                   
                   
              3 
               
             
            
              早急に回答頂きありがとうございます。 
上記パイプラインで想定の値を取得することが出来ました。
追加のご質問で恐縮ですが
サンプルログ(valueにスペースが存在するデータ) 
key3=value3 key4=val ue4  key5=value5  key6=val ue6
kv processorで以下を実行すると
POST _ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "kv": {
          "field": "message",
          "field_split": " ",
          "value_split": "="
        }
      },
      {
        "remove": {
          "field": "message"
        }
      }
    ]
  },
  "docs": [
    {
      "_index": "aaa",
      "_id": "1",
      "_source": {
        "message": "key3=value3 key4=val ue4  key5=value5  key6=val ue6"
      }
    }
  ]
}
 
以下のエラーが返ってきます。
  {
    "type" : "exception",
    "reason" : "java.lang.IllegalArgumentException: java.lang.IllegalArgumentException: field [message] does not contain value_split [=]",
    "header" : {
      "processor_type" : "kv"
    }
 
インデックスデータは下記の通りに登録したいです。
field名 value
key3     value3
key4     val ue4
key5     value5
key6     val ue6
 
上記データをingest nodeで処理する方法はありますでしょうか。 
elastic discussの投稿を検索しましたが、回答が見つからずご教示頂けますと幸いです。
  
  
    Hi everyone : 
I am new to learn ELK, then I'm challenges in using kv filter now. 
Let me make it brief, the following is one part of my dataset: 
s1Label=Rule cs2Label=URL Category cs3Label=Virtual System 
then my configure is 
filter {
kv{ 
       field_split=>" "
       value_split=>"="   }
the result I got was 
"s1Label":"Rule" 
"cs2Label":"URL" 
"cs3Label":"Virtual" 
How can I get the values including space and  set field_split=>" " at same time ? 
Or is there any other filter to do that …
   
 
             
            
               
               
               
            
            
           
          
            
              
                tsgkdt  
                (tsgkdt)
               
                 
              
                  
                    December 19, 2019,  4:11am
                   
                   
              4 
               
             
            
              
こちらを参考にfield_splitを指定してみたところ、期待する結果になりそうですがどうでしょうか?
POST _ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "dissect": {
          "field": "message",
          "pattern": "%{key1}|%{key2}|%{other}",
          "ignore_missing": true
        }
      },
      {
        "kv": {
          "field": "other",
          "field_split" : """\s(?![-_,:()\w\" ]+?(\s+|$))""",
          "value_split": "="
        }
      },
      {
        "remove": {
          "field": "other"
        }
      }
    ]
  },
  "docs": [
    {
      "_index": "aaa",
      "_id": "1",
      "_source": {
        "message": "value1|value2|key3=value3 key4=val ue4 key5=value5 key6=val ue6"
      }
    }
  ]
}
 
結果がこちら
{
  "docs" : [
    {
      "doc" : {
        "_index" : "aaa",
        "_type" : "_doc",
        "_id" : "1",
        "_source" : {
          "key1" : "value1",
          "key2" : "value2",
          "key5" : "value5",
          "key6" : "val ue6",
          "key3" : "value3",
          "key4" : "val ue4",
          "message" : "value1|value2|key3=value3 key4=val ue4 key5=value5 key6=val ue6"
        },
        "_ingest" : {
          "timestamp" : "2019-12-16T16:09:53.719382Z"
        }
      }
    }
  ]
}
 
ご確認いただけますか?
             
            
               
               
               
            
            
           
          
            
              
                harue  
                (harue)
               
              
                  
                    December 19, 2019,  5:05am
                   
                   
              5 
               
             
            
              早急に回答頂きありがとうございます。
上記の記載方法で実現できました。 
大変助かりました。
             
            
               
               
               
            
            
           
          
            
              
                system  
                (system)
                  Closed 
               
              
                  
                    January 16, 2020,  5:05am
                   
                   
              6 
               
             
            
              This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.