Serveur ElasticSearch Arrête accidentellement de travailler
j'ai 2 Serveur ES, qui se nourrit 1 Serveur logstash et parcourez les magazines dans Kibana. il POC Résoudre tout problème avant de lancer en production. Le système fonctionne près 1 mois et tous les quelques jours Kibana Il cesse de montrer des grumes au moment aléatoire au milieu de la nuit. La nuit dernière, la dernière entrée du magazine que j'ai eu dans le Kiban était à propos de 18:30. Quand j'ai vérifié les serveurs ES, Il a montré que le démarrage principal et le secondaire n'est pas lancé (de / sbin / service elasticsearch status), Mais j'ai pu faire la boucle sur l'hôte local et il a renvoyé les informations. Donc, je ne suis pas sûr de quoi faire à ce sujet. Dans tous les cas, lorsque je prends le statut sur le nœud principal, je reçois ce qui suit:
Quand j'en affiche des index via "ls ... nodes / 0 / indeces /", Il montre que tous les index ont été modifiés aujourd'hui pour une raison quelconque et il y a un nouveau fichier à ce jour. Je pense donc que je commence à me rattraper après avoir redémarré les deux serveurs, mais je ne comprends pas pourquoi cela n'a pas réussi. Quand je regarde des magazines sur le serveur principal, je ne vois que 4 Avertissements de bugs B. 18:57, Puis le 2e, quittant le cluster. Je ne vois aucun magazines sur le secondaire (Pistolet) Pourquoi il a cessé de travailler ou de ce qui s'est passé effectivement.
[2014-03-06 19: 56: 08,467] [INFO] [cluster.service] [ElasticSearch Server1] Suppression {[Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.1.1.10:9301]] {client = true, data = false},}, cause: zen-disco-node_failed ([Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.13.3.46:9301]] {client = true, data = false}), La raison ne pouvait pas être vérifiée, essayée [3] Une fois, chacun avec un délai maximum [30 de] [2014-03-06 19: 56: 12,304] [INFO] [cluster.service] [ElasticSearch Server1] Ajoutée {[Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.1.1.10:9301 ]] {client = true, data = false},}, cause: zen-disco-receive (Rejoindre le nœud [[Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.13.3.46:9301]]] {client = true, data = faux}])
Il y a des idées sur les journaux supplémentaires ou le dépannage, que je peux inclure que cela ne se produit pas à l'avenir? Étant donné que les fragments ne sont pas traités, je vois tout simplement beaucoup de messages de débogage que l'analyse de la syntaxe a échoué. Je suppose que cela sera corrigé dès que nous rattraperons.
[2014-03-07 10: 06: 52,235] [DEBUG] [action.search.type] [ElasticSearch Server1] Tous les segments n'ont pas passé la scène: [Demande] [2014-03-07 10: 06: 52,223] [DEBUG] [action.search.type] [ElasticSearch Server1] [windows-2014.03.07] [3], nouer [W6aEFbimR5G712ddG_G5yQ], [P], s [STARTED]: Échec de l'exécution [org.elasticsearch.action.search.SearchRequest @ 74ecbbc6] lastShard [true] org.elasticsearch.search.SearchParseException: [windows-2014.03.07] [3]: de [-1], la taille [-1]: Erreur d'analyse syntaxique [Impossible d'effectuer une analyse syntaxique de la source [{"Aspects": {"0": {"date_histogram": {"field": "@ timestamp", "interval": "10m"}, "global": true, "facet_filter": {"fquery": {"query": { "filter": {"query": {"query_string": {"query": "(ASA AND Deny)"}}, "filter": {"bool": {"must": [{"range": { "@timestamp": {"from": 1394118412373, "to": "now"}}}]}}}}}}}}, "size": 0}]]
curl -XGET 'http://localhost:9200/_cluster/health?pretty=true'
{
"cluster_name" : "gis-elasticsearch",
"status" : "red",
"timed_out" : false,
"number_of_nodes" : 6,
"number_of_data_nodes" : 2,
"active_primary_shards" : 186,
"active_shards" : 194,
"relocating_shards" : 0,
"initializing_shards" : 7,
"unassigned_shards" : 249
}
Quand j'en affiche des index via "ls ... nodes / 0 / indeces /", Il montre que tous les index ont été modifiés aujourd'hui pour une raison quelconque et il y a un nouveau fichier à ce jour. Je pense donc que je commence à me rattraper après avoir redémarré les deux serveurs, mais je ne comprends pas pourquoi cela n'a pas réussi. Quand je regarde des magazines sur le serveur principal, je ne vois que 4 Avertissements de bugs B. 18:57, Puis le 2e, quittant le cluster. Je ne vois aucun magazines sur le secondaire (Pistolet) Pourquoi il a cessé de travailler ou de ce qui s'est passé effectivement.
[2014-03-06 18:57:04,121][WARN ][transport ] [ElasticSearch Server1] Transport response handler not found of id [64147630]
[2014-03-06 18:57:04,124][WARN ][transport ] [ElasticSearch Server1] Transport response handler not found of id [64147717]
[2014-03-06 18:57:04,124][WARN ][transport ] [ElasticSearch Server1] Transport response handler not found of id [64147718]
[2014-03-06 18:57:04,124][WARN ][transport ] [ElasticSearch Server1] Transport response handler not found of id [64147721]
[2014-03-06 19: 56: 08,467] [INFO] [cluster.service] [ElasticSearch Server1] Suppression {[Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.1.1.10:9301]] {client = true, data = false},}, cause: zen-disco-node_failed ([Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.13.3.46:9301]] {client = true, data = false}), La raison ne pouvait pas être vérifiée, essayée [3] Une fois, chacun avec un délai maximum [30 de] [2014-03-06 19: 56: 12,304] [INFO] [cluster.service] [ElasticSearch Server1] Ajoutée {[Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.1.1.10:9301 ]] {client = true, data = false},}, cause: zen-disco-receive (Rejoindre le nœud [[Pistol] [sIAMHNj6TMCmrMJGW7u97A] [inet [/10.13.3.46:9301]]] {client = true, data = faux}])
Il y a des idées sur les journaux supplémentaires ou le dépannage, que je peux inclure que cela ne se produit pas à l'avenir? Étant donné que les fragments ne sont pas traités, je vois tout simplement beaucoup de messages de débogage que l'analyse de la syntaxe a échoué. Je suppose que cela sera corrigé dès que nous rattraperons.
[2014-03-07 10: 06: 52,235] [DEBUG] [action.search.type] [ElasticSearch Server1] Tous les segments n'ont pas passé la scène: [Demande] [2014-03-07 10: 06: 52,223] [DEBUG] [action.search.type] [ElasticSearch Server1] [windows-2014.03.07] [3], nouer [W6aEFbimR5G712ddG_G5yQ], [P], s [STARTED]: Échec de l'exécution [org.elasticsearch.action.search.SearchRequest @ 74ecbbc6] lastShard [true] org.elasticsearch.search.SearchParseException: [windows-2014.03.07] [3]: de [-1], la taille [-1]: Erreur d'analyse syntaxique [Impossible d'effectuer une analyse syntaxique de la source [{"Aspects": {"0": {"date_histogram": {"field": "@ timestamp", "interval": "10m"}, "global": true, "facet_filter": {"fquery": {"query": { "filter": {"query": {"query_string": {"query": "(ASA AND Deny)"}}, "filter": {"bool": {"must": [{"range": { "@timestamp": {"from": 1394118412373, "to": "now"}}}]}}}}}}}}, "size": 0}]]
Aucun résultat connexe trouvé
Invité:
Pour répondre aux questions, connectez-vous ou registre
1 réponses
Christine
Confirmation de:
* Mémoire trop basse disponible pour ES ** (que vous pouvez explorer avec tout système de test, tel que Marvel, ou quelque chose qui vous enverra des données JVM Hors de la machine de surveillance virtuelle)
Grande durée GC
(Inclure la journalisation GC et voir si cela se produit quand ES cesse de répondre)
Également "Normal" Installation pour ES
3 Serveur
Assurer une meilleure redondance lorsqu'un serveur ne fonctionne pas. Mais OMMV.
Tu peux essayer
Nouveau collecteur de déchets G1
aussi, qui (dans mon cas) se comporte beaucoup mieux que CMS dans mon Kibana ES.
Le problème de la durée de l'assemblage des ordures se produit généralement lorsque vous regardez un autre endroit et conduit généralement à la perte de données, car ES cesse de répondre.
Bonne chance avec ça :)