Wir haben drei EC2-Instanzen - eine in jeder Verfügbarkeitszone (AZ) in der Region eu-west-1. Sie sind mit ELB belastet. Wir möchten mit CloudWatch überwachen, wie viele Instanzen am Loadbalancer registriert sind. Das Problem ist: Ich verstehe die HealthyHostCount
Metrik nicht wirklich.Wie verwende ich ELB HealthyHostCount für die Überwachung in CloudWatch?
Für eine Bereitstellung möchten wir in der Lage sein, eine einzelne Instanz (aus der LB) zu entfernen, ohne benachrichtigt zu werden. Der Alarm wäre also: Benachrichtigen, wenn nur eine gesunde Instanz für 5 Minuten hinter dem Loadbalancer verbleibt.
Soweit ich verstehe, HealthyHostCount
(HHC) ist die Anzahl der gesunden Instanzen, die mit einem bestimmten ELB registriert sind, gemittelt über alle AZs. Wenn alles in Ordnung ist, sollte der HHC 1 sein (egal in welchem Zeitraum), da es in jedem AZ 1 Instanz gibt.
Vor ein paar Tagen wurde jemand ohne erneute Registrierung der Instanzen bereitgestellt, sodass nur eine Instanz ausgeglichen wurde. Als wir das bemerkten, erzeugten wir einen Alarm, der uns benachrichtigen sollte, wenn der durchschnittliche HHC nach 5 Minuten unter 0,6 sank. (Wenn nur 1 Instanz in ELB registriert ist, sollte der HHC für einen beliebigen Zeitraum im Durchschnitt 0,33 betragen.) Der Alarm wurde jedoch nie in den Zustand "ALARM" geändert.
Als ich den HHC in CloudWatch überprüfte, waren die HHC Zahlen, die keinen Sinn ergaben (Summe von 10.0 für ein 5-Minuten-Intervall ist alles, woran ich mich jetzt erinnere).
Es ist alles eine große Sauerei für mich. Jedes Mal, wenn ich denke, dass ich die Metrik verstanden habe, sind die CloudWatch-Diagramme für mich alles Kauderwelsch.
Könnte jemand bitte erklären, wie man HHC benutzt, um einen Alarm zu bekommen, wenn nur eine Instanz registriert ist? Ist der durchschnittliche HHC der Weg zu gehen oder sollte ich eine andere Metrik verwenden?
Vielen Dank für diese ausführliche und erstaunliche Erklärung! –