Ich habe heute ein seltsames Problem. Zunächst funktionierte alles noch immer gut, als ich das Büro verließ, aber heute, als ich wieder zur Arbeit ging, zeigte mir mein DC/OS-Dashboard, dass keine Dienste ausgeführt wurden oder Knoten verbunden waren.DC/OS Mesos-Master ist wieder verbunden und verursacht Unterbrechungen auf den Master-Agenten
Ich habe dieses Problem schon ein- oder zweimal gesehen und war damit verbunden, dass der Marathon nicht in der Lage war, einen Master zu wählen. Einer der 3 Masterknoten zeigt dann auch viele Fehler im Journal. Dies kann behoben werden, indem der dcos-marathon-Dienst auf diesem Host gestoppt/gestartet wird, was ihn zurück in die Marathon-Gruppe bringt.
Ich sah die Knoten und Dienste wieder. Aber jetzt sagt es mir manchmal, es ist nur ein Knoten verbunden und dann wieder 3, und nur noch einmal, etc ..
Wenn ich den dcos-mesos-Master-Prozess auf dem in Konflikt stehenden Host stoppst, stoppt dies und ich habe eine stabiler Master-Cluster (aber wahrscheinlich nicht wirklich belastbar).
Es sieht aus wie der fehlerhafte Knoten den Meister zu werden versucht, die dies bewirkt, dass .. Ich habe versucht, über einen gescheiterten Wiedereintritt Mesos-Master zu suchen .. aber kam
Ich bin mit DC/Betriebssystem in einer CoreOS-Umgebung.
Hilfe sehr geschätzt wird ..