お世話になっております。
今、1時間ごとにElasicserachに突っ込まれている日本語を含んだデータをクエリで引っ掛けた結果をサイトに情報として流しているのですが、
そのクエリ結果の一部日本語の文字化けが1日に数回発生しております。
ドキュメントの中身は更新されておりませんし、毎度同じクエリでデータを取得しております。
また、文字化けして返却されるデータは、ある1文字が必ず"���"の特殊文字3文字に変換されて返却されます。
以下起きた事例ですが、
「ユーピー」と登録されているデータが、「ユーピ���」という結果で返却されたり、
「(キス)」と登録されているデータが、「(���ス)」という結果で返却されることがあります。
使用しているElasticsearchは5.4.3で、
取得に使用しているプログラムはNode.jsの6.10.3になります。
_searchを使用しており条件は以下のような形となっております。
{
"from" : 0,
"size" : 3000,
"query": {
"bool": {
"must" : [
{
"term" :{ "id": "XXXX" }
},
{
"nested" : {
"path" : "info",
"query" : {
"bool": {
"must" : [
{ "term" :{ "info.st": "X" } },
{ "term" :{ "info.id": "Y" } }
]
}
}
}
},
{
"bool" : {
"must_not" : {
"term" :{"deleted" : true}
}
}
}
]
}
}
}'
なぜこのような現象がたびたび発生するのか知っておらましたらご教授いただければ幸いでございます。