Иногда "не удалось ответить" от AWS, размещенной Elasticsearch
У нас есть кластер Elasticsearch, размещенный в Amazon Elasticsearch Service (AWS).
Мы используем Jest Java HTTP Rest клиент для ElasticSearch.
Время от времени (возможно, 1 из 10000 запросов), кажется, закрывает соединение без ответа.
Трассировка стека в нашем приложении выглядит следующим образом:
ERROR [2016-04-11 09:18:43,497] io.dropwizard.jersey.errors.LoggingExceptionMapper: Error handling a request: b9b9ee1e4eefadd2
! org.apache.http.NoHttpResponseException: search-xxx.eu-west-1.es.amazonaws.com:443 failed to respond
! at org.apache.http.impl.conn.DefaultHttpResponseParser.parseHead(DefaultHttpResponseParser.java:143) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.conn.DefaultHttpResponseParser.parseHead(DefaultHttpResponseParser.java:57) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.io.AbstractMessageParser.parse(AbstractMessageParser.java:261) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.DefaultBHttpClientConnection.receiveResponseHeader(DefaultBHttpClientConnection.java:165) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.conn.CPoolProxy.receiveResponseHeader(CPoolProxy.java:167) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.protocol.HttpRequestExecutor.doReceiveResponse(HttpRequestExecutor.java:272) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.protocol.HttpRequestExecutor.execute(HttpRequestExecutor.java:124) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.execchain.MainClientExec.execute(MainClientExec.java:271) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.execchain.ProtocolExec.execute(ProtocolExec.java:184) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.execchain.RetryExec.execute(RetryExec.java:88) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.execchain.RedirectExec.execute(RedirectExec.java:110) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.client.InternalHttpClient.doExecute(InternalHttpClient.java:184) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.client.CloseableHttpClient.execute(CloseableHttpClient.java:82) ~[my-app-0.0.1.jar:0.0.1]
! at org.apache.http.impl.client.CloseableHttpClient.execute(CloseableHttpClient.java:107) ~[my-app-0.0.1.jar:0.0.1]
! at io.searchbox.client.http.JestHttpClient.execute(JestHttpClient.java:48) ~[my-app-0.0.1.jar:0.0.1]
Соответствующий код от "org.apache.http.impl.conn.DefaultHttpResponseParser.parseHead
" похоже:
final int i = sessionBuffer.readLine(this.lineBuf);
if (i == -1 && count == 0) {
// The server just dropped connection on us
throw new NoHttpResponseException("The target server failed to respond");
}
Насколько я могу судить, Amazon не предоставляет мне доступ к журналам сервера Elasticsearch.
Так:
- Как я могу диагностировать и устранить причину этой ошибки?
- Если лучшим решением для моего приложения является повторение этих сбоев, есть ли простой способ повторить попытку с помощью Jest? Я не вижу никаких параметров конфигурации, чтобы сделать это автоматически.
ТИА
1 ответ
1: (пока не знаю)
2. Вы можете настроить Jest для повторения операций Elasticsearch, которые завершаются с ошибками сети, такими как:
new JestClientFactory() {
@Override
protected HttpClientBuilder configureHttpClient(HttpClientBuilder builder) {
builder = super.configureHttpClient(builder);
// See DefaultHttpRequestRetryHandler.requestSentRetryEnabled
//
// true if it's OK to retry non-idempotent requests that have been sent
// and then fail with network issues (not HTTP failures).
//
// "true" here will retry POST requests which have been sent but where
// the response was not received. This arguably is a bit risky.
//
// Retries are logged at INFO level to org.apache.http.impl.execchain.RetryExec
boolean requestSentRetryEnabled = true;
builder.setRetryHandler(new DefaultHttpRequestRetryHandler(
3,
requestSentRetryEnabled));
return builder;
}
}