No Observable Difference Between BBQ and Default Configurations in Elasticsearch – Help with Index Size Comparison

yli · June 27, 2025, 8:22am

thanks for sharing your insights and sorry for injecting questions/comments here.

Keeping raw floating point values around _source seems to be inefficient approach, like discussed in Knn_vectors field understanding - Elastic Stack / Elasticsearch - Discuss the Elastic Stack, right?
If we don't keep raw floating point values around _source, the values are still persist by underlaying Lucene, right? Would it be fine if we fetch values from Lucene for rescoring purpose?
For re-quantizing and segment merging, may I ask whether we indeed need to keep the raw floating point values for any type of quantization? And how the re-quantization works? would be appreciated if you could share any resources.

Thanks a lot and looking forward for your reply.

Best,
Yakun

Topic		Replies	Views
When Does BBQ Quantization Outperform Scalar Quantization Elasticsearch vector-search	1	91	April 23, 2025
Vector search large dense vectors performance issues Elasticsearch vector-search	3	169	July 16, 2025
Question about Optimized Scalar Quantization Elasticsearch	22	262	July 25, 2025
Dense Vector Field Extremely Large Elasticsearch vector-search	12	207	October 6, 2025
Knn_vectors field understanding Elasticsearch vector-search	23	547	March 6, 2025