Unschön, wenn man am Samstag gerade auf dem Weg zu einem Usertreffen ist und im Auto eine SMS vom Monitoring-System bekommt, das sich ein Server gerade aus dem weltweiten Netz verabschiedet hat. Vor Ort bestand nach der Begrüßung - und dem Aushändigen von WLAN-Credentials - dann die Möglichkeit zu einem kurzen Blick: das System ist wirklich (ganz) weg, die Remote-Konsole mag offenbar auch nicht, ein Reboot über das Webinterface zeitigt auch keine Reaktion, weder normal noch ins Rettungssystem. Also frischauf eine Supportanfrage gestartet, und dann: abwarten. (Die automatische Bestätigung läßt Gutes erwarten: in der Regel antworte man binnen 24 Stunden - vermutlich aber wohl nicht am Wochenende, oder so.)
Ein paar Stunden später hat sich noch nichts getan, also ein erneuter Blick auf die Angelegenheit. Diesmal will die Remote-Konsole mitspielen, und, oh Wunder: die Maschine läuft problemlos, sie hat auch eine Uptime seit dem letzten Kernelupdate (also kein Reboot), nur eines hat sie nicht - Netz. Kein Wunder mit einer IP aus dem local link-Bereich … Die sich aufdrängende Ahnung wird dann schnell Gewissheit: der Anbieter konfiguriert seine Server-Images alle mit einem dhcpcd, der regelmäßig per DHCP IP-Adresse und Routen aktualisiert, mutmaßlich, um Änderungen in der internen Struktur zu vereinfachen. Dumm nur, wenn sich der DHCP-Server weghängt … dann kommt nämlich per DHCP nichts mehr nach, das Lease läuft ab, und das war’s dann mit dem Netz.
Glücklicherweise läßt sich dieses Problem ja recht einfach beheben, auch dann, wenn man eigentlich von Routing (erst recht unter Linux!) keine Ahnung hat; wofür gibt es Google? Die "korrekte" IP läßt sich aus dem Logfile heraussuchen bzw. sollte bekannt sein (nehmen wir mal "85.214.50.55" an), das Gateway auch (im Logfile findet sich dann bspw. etwas wie "eth0: removing default route via 85.214.50.1 metric 0"), und dann machen wir folgendes:
ifconfig eth0 down
ifconfig eth0 85.214.50.55 netmask 255.255.255.255 up
route add -host 85.214.50.1 eth0
route add default gw 85.214.50.1
Voilà! Das Netz ist wieder da. (IP-Adressen passend ersetzen!)
Mal sehen, ob sich der Support irgendwann meldet oder man gar wieder auf DHCP antworten mag … (Ich hätte jetzt gedacht, solche Systeme hat man im Monitoring, aber gut. Immerhin hat das - kostenlose - Monitoring-Tool des Serveranbieters schon knapp 30 Minuten nach meinem eigenen Monitoring den Server"ausfall" erkannt und gemeldet.)