@t-nakata さん、
少し古いですが、同様の質問があったので共有します。
数メガバイトのテキストでも動作するようです。 keyword
型の場合は ignore_above
の設定を超えると転置インデックスが作成されないので検索には利用できません。効率的かどうかは置いといて text
型の場合は長い文字列もいけそうです。
StackOverflow では、 Elasticsearch の1ドキュメントでのサイズ上限に関する質問がありました。 Lucene の内部で利用しているバッファのサイズと、 Elasticsearch の REST API 上の上限が 2GB になっているようです。
このため、 1フィールドしかないドキュメントであっても 2GB あたりが上限になってくると思われます。