Производительность logstash input

Привет.
Есть вопрос производиельности logstash на этапе input.
Столкнулся с тем, что если получаю данные по сети, например input syslog или tcp, то для балансировки нагрузки по ядрам CPU, нужно чтобы клиент мог создавать много tcp сессий и передавал данные параллельно.
Если tcp сессия будет одна, то logstash будет обрабатывать данные на одном ядре. Когда ядро будет загружено, то будет достигнут предел EPS, а остальные ядря в это время простаивают.
Если добавить ещё один поток (tcp сессию), то EPS увеличится в двое и будет загружено ещё одно ядро. И так пока все ядра не будут загружены.
Настройки воркеров и батчинга в порядке. Настройки сети в linux вроде тоже.

Сталкивался ли кто-то?
Хотелось бы распределить нагрузку по ядрам при использовнии одной TCP сессии на input.
Можно ли решить настройками logstash/java без применения дополнительных брокеров сообщений?