全角数字を半角数字にし、一文字ずつ区切られないように設定するプラグインをご教示いただけますでしょうか。
□事象
GET kensyo_index/_analyze
{
"text" : "6000",
"analyzer": "my_custom_analyzer"
}
{
"tokens" : [
{
"token" : "6",
"start_offset" : 0,
"end_offset" : 1,
"type" : "word",
"position" : 0
},
{
"token" : "0",
"start_offset" : 1,
"end_offset" : 2,
"type" : "word",
"position" : 1
},
{
"token" : "0",
"start_offset" : 2,
"end_offset" : 3,
"type" : "word",
"position" : 2
},
{
"token" : "0",
"start_offset" : 3,
"end_offset" : 4,
"type" : "word",
"position" : 3
}
]
}
□試したこと
-
kuromojiのCJK width token filter
CJK width token filter | Elasticsearch Guide [7.17] | Elastic -
ICU normalization character filterをデフォルト設定で使用
ICU normalization character filter | Elasticsearch Plugins and Integrations [8.14] | Elastic
⇒どちらも全角を半角に変換することはできますが、一文字ずつ区切られる事象は改善されません。
どなたかご回答いただけますと幸いです。
よろしくお願いいたします。