Pattern_replace char filter regex

Mike.Barretta · May 31, 2017, 9:54pm

I think the issue is the use of the standard tokenizer, which removes the hyphen before the char_filter gets the chance.

Instead, you could use something like the whitespace tokenizer:

PUT test
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_analyzer": {
          "tokenizer": "whitespace",
          "char_filter": [
            "my_char_filter"
          ]
        }
      } ,
      "char_filter": {
        "my_char_filter": {
          "type": "pattern_replace",
          "pattern":"(\\w+)-(\\w+)",
          "replacement": "$1$2"
        }
      }
    }
  }
}

Topic		Replies	Views
Pattern_replace Token Filter Elasticsearch	1	328	July 6, 2017
Pattern Replace Token Filter not working with "c++" Elasticsearch	1	634	July 5, 2017
Regex pattern_replace Elasticsearch	5	555	February 5, 2020
Char_Filter pattern replace is not behaving correctly Elasticsearch	1	235	May 3, 2023
ElasticSearch 5.3 filterer char_filter. pattern_replace not working Elasticsearch	5	1266	August 29, 2017

Pattern_replace char filter regex

Related topics