ElasticSearch -Unable to lock JVM Memory

Neni · November 12, 2018, 6:56pm

We have 3 aws instances of type m4.2xlarge being used for elasticsearch with 1 master node and 2 shards; total of 3 indices , one of the index is holding 13 millions of data.

we never had this issue before. these instances have been running since July and never restarted the ES services since then.

all of a sudden one of the instances is terminated due to EC2 health check failed and then ES cluster was not in green. with in few mins , new instance was created re-launched and added to ES cluster and turned to green.

question is why instances was terminated , was this due to memory issue ? I could see 'Unable to lock JVM Memory' on all 3 instances but only one of them got terminated. please help us understand the rootcause and resolution.

Logs

ES3 instance logs - instance got terminated

[2018-11-12 15:02:58,603][INFO ][discovery.ec2 [2018-11-12 15:02:58,606][WARN ][discovery.ec2 [2018-11-12 15:02:58,606][INFO ][cluster.service [2018-11-12 15:02:58,607][DEBUG][action.admin. [2018-11-12 15:02:58,607][INFO ][rest.suppressed MasterNotDiscoveredException
ansportMasterNodeAction$6.handleException(TransportMasterNodeAction.java:195)
e$Adapter$3.run(TransportService.java:588)
Worker(ThreadPoolExecutor.java:1142)
ker.run(ThreadPoolExecutor.java:617)
indices.exists.indices] [es3-prod] no known master node, scheduling a retry
] [es3-prod] detected_master {es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300}, added {{es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300},}, reason: zen-disco-receive(from master [{es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300}])
] [es3-prod] removed {{es1-prod}{pvkYfa9zR8Klivf7Y4x0Bg}{XXXX}{XXXX:9300},}, reason: zen-disco-receive(from master [{es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300}])
] [es3-prod] added {{es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300},}, reason: zen-disco-receive(from master [{es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300}])
] [es3-prod] master_left [{es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300}], reason [shut_down]
] [es3-prod] master left (reason = shut_down), current nodes: {{es3-prod}{a71vFKSHRaiZUO22Q9yJ6g}{XXXX}{XXXX:9300},{es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300},}
] [es3-prod] removed {{es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300},}, reason: zen-disco-master_failed ({es2-prod}{3bHdXNIWS-qVFY75qtefNQ}{XXXX}{XXXX:9300})
] [es3-prod] detected_master {es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300}, reason: zen-disco-receive(from master [{es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300}])
] [es3-prod] added {{es2-prod}{AynTsvb1TDmrXqF_6MBzUg}{XXXX}{XXXX:9300},}, reason: zen-disco-receive(from master [{es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300}])
] Unable to lock JVM Memory: error=12,reason=Cannot allocate memory
] This can result in part of the JVM being swapped out.
] Increase RLIMIT_MEMLOCK, soft limit: 65536, hard limit: 65536
] These can be adjusted by modifying /etc/security/limits.conf, for example:
] If you are logged in interactively, you will have to re-login for the new limits to take effect.
] [es3-prod] version[2.1.1], pid[3603], build[40e2c53/2015-12-15T13:05:55Z]
] [es3-prod] initializing ...
] [es3-prod] loaded [cloud-aws, delete-by-query], sites [head]
] [es3-prod] using [1] data paths, mounts [[/ebs (/dev/xvdb)]], net usable_space [72.4gb], net total_space [98.3gb], spins? [no], types [ext4]
] [es3-prod] initialized
] [es3-prod] starting ...
] [es3-prod] publish address: {0.0.0.0} is a wildcard address, falling back to first non-loopback: {XXXX}
] [es3-prod] publish_address {XXXX:9300}, bound_addresses {[::]:9300}
] [es3-prod] elastic1/hXW8lE1iS02Kd-o-p7Rdvw
] [es3-prod] detected_master {es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300}, added {{es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300},{es2-prod}{AynTsvb1TDmrXqF_6MBzUg}{XXXX}{XXXX:9300},{es3-prod}{a71vFKSHRaiZUO22Q9yJ6g}{XXXX}{XXXX:9300},}, reason: zen-disco-receive(from master [{es1-prod}{2T2eQar7RZGwd1u1zbzs9w}{XXXX}{XXXX:9300}])
] [es3-prod] exception caught on transport layer [[id: 0xfb743cf6]], closing connection

Neni · November 14, 2018, 8:34pm

Any updates on the above issue please ?

warkolm · November 15, 2018, 1:31am

What do the logs of es3-prod show?

Please be patient, these forums are not covered by any SLA.

system · December 13, 2018, 1:31am

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
ElasticSearch version 2.1.1 -Unable to lock JVM Memory Elasticsearch	3	628	February 8, 2019
EC2 instance hanging after a few hours Elasticsearch	6	1332	July 6, 2017
Lack of memory? Elasticsearch	11	800	July 6, 2017
ElasticSearch hangs/freezes EC2 box Elasticsearch	2	355	July 6, 2017
Instant crash on startup Elasticsearch	15	5099	July 6, 2017

ElasticSearch -Unable to lock JVM Memory

Related topics