デーモン監視

ゾンビになっててもわかるように…ってことは、稼働するプロセスに対して何らかのメッセージを送って、その戻り値を見ることができればいいのだけど。

DHCPの場合はなかなかそうはいかないのです。

ポート67/6番の単純な応答監視だとホントにDHCPによるIPアドレス払い出しを行っているのか確認できない。

実際にIPアドレスを払い出しているかどうか、その値が正しいものかどうかを確認するには、実機で確認するしかない。

(DNSならテキトーなAレコードをクエリして戻り値を確認すればいいだけの話なんだけど)

ここがね、すごく面倒。

なので、提案。

DHCPはコケるもんだ、という認識を持ちたい。

コケたときに被害を最小限にするには、とか考えるといろいろ方法はあるんだけど(レンジ違いのサーバを用意するとか、オススメしないけどFailoverにするとか、代替サーバを用意しておくとか)、決定的に"ダウンさせない/ダウンを予期する"ことは無理なんじゃねーの?、と。

DHCPサービスに100%常時稼働のSLAは張れないね、っていうのが結論でした。