Попробуйте запустить запрос с search_type=dfs_query_then_fetch. Возможно, что у Вас каждая запись на своей шарде находится, а по умолчанию частота рассчитывается на каждой шарде отдельно. Когда записей много - это работает. А вот во время экспериментов с 2-мя записями, как у Вас, получается что у всех слов одна и та же частота.
Похоже, что проблема в том, как cutoff_frequency используется тут. При округлении (int) Math.ceil(maxTermFrequency * (float) maxDoc) равнятся 2 для всех токенов. Все работает нормально с "cutoff_frequency": 0.4, например.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.