Cannot aggregate long string


#1

I have an implementation where I need to aggregate strings of potentially long length. It appears not working in Elasticsearch. I ran the following example in Elasticsearch 5.5.1

Create the following two indexes:

{
"name": "test001",
"long_string": "111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111"
}

{
"name": "test002",
"long_string": "222222222222222"
}

Run an aggregation query:

{
"aggs": {
"test_long_string": {
"terms": {
"field": "long_string.keyword"
}
}
}
}

The results shows only the short string:

{
"aggregations":
{
"test_long_string":
{
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets":
[
{
"key": "222222222222222",
"doc_count": 1
}
]
}
}
}

Is there a way to configure Elasticsearch to increase the size limit of string in aggregation? Or is there a workaround?

Any suggestion will be greatly appreciated.


#2

I figured it was caused by the default value of "ignore_above" for keyword. I recreated the index mapping to increase the value and it's now working.


(system) #3

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.