Failover-Cluster failed...
-
Habe einen pfsense HA-Cluster, bei dem die Primary Node irgendein Wehweh hat und ausgefallen ist. Antwortet weder auf ping, noch ist ein Login per SSH oder Web möglich. Die Backup Node lässt sich aber ums Verrecken nicht überzeugen, jetzt den Scheff zu spielen. Diese beharrt auf dem Status "Backup" und die konfigurierten virt. IPs greifen natürlich ins Leere. Zu einer Fehleranalyse oder Behebung habe ich auf die Schnelle jetzt leider nichts gefunden. Die Nodes haben CE 2.7.2 installiert.
-
@Exordium
Was passiert, wenn ein Kabel eines CARP-Interfaces von der Primary abziehst?Andersrum kannst du auch auf der Secondary auf einem CARP Interface den Traffic sniffen. Protokoll = CARP.
Wenn da die Advertisement Pakete im gewohnten Rhythmus ankommen, hat sie keinen Grund, an ihrem Zustand etwas zu ändern. -
@viragomann Die tauschen tatsächlich noch irgendwelche kleinen Pakete (max. 240 Byte) über die Schnittstellen aus. Allerdings steht da ein "unknown". Es kann nicht erkannt werden, ob das jetzt CARP ist, was da drüber geht. Kollege wird die primary nacher mal abkoppeln, dann sehen wir weiter. Dummerweise habe ich zu Hause jetzt den Zugang zum IPMI der Maschine nicht... :)
-
Kommst du an den Switch?
Dann würde es reichen die LAN und DMZ Ports der Primary zu shuten. -
So, kurze Auflösung: Die Primary hing netzwerktechnisch tatsächlich irgendwo zwischen Himmel und Hölle fest und konnte der Backup trotzdem irgendwie signalisieren: "Ich zucke noch...". Nachdem man ihr den Gnadenschuss gegeben hatte (Power off) sprang die Backup auch gleich auf Master um. Die Masternode wieder hochgefahren, hat diese ihre ursprüngliche Rolle als Primary auch gleich wieder wahrgenommen!
Alles wieder gut! Danke!