最近、うちのサーバが動かなくなることがあります。一度発生するとSSH経由ではほとんどなにもできなくなり、sudoを使ったとたんに「sudo: Can't open /var/run/sudo/ユーザー名...」というエラーが出て止まってしまいます。
そのときHTTPからアクセスを試みると、アクセスはできるもののディレクトリに書き込みができなくなっている様子(「ワークディレクトリに書き込みできない」と表示される)。
モニターをサーバPCに接続してみると「command 0x25 timeout, stat 0xd0 host_stat 0x1」というメッセージが。一般ユーザーでもルートでもログインできないです。
いったんPCの電源を落とし半日くらい寝かすとどうも動くようになるのですが・・・。原因がまったくわかりません。まあ、リセットしただけでは動かないことからして熱関係の問題かもしれませんが・・・。
とりあえず、もう一回再現したら、ログを全部記録してどこかに聞いてみるしかないでしょうか。
一応、どうすればいいかわからないものの、対策としては以下を実施
後者はサーバにあるまじき行為のような気はしますが、磯子クリエイティブチームのTrac以外外部にサービスを出していない(まあ、磯子マガジンのRSSを、Bloglinesにクロールさせてはいるものの・・・ 一回くらい404になっても大きな問題はないでしょう・・・と)
本当はもう少しまともな対策を施すべきなんでしょうが、ログの監視体制の見直しとか。まあ、徐々に追加していくしかないか。
*1:[http://vine.1-max.net/ClamAntiVirus.html:title=【Vine Linuxで自宅サーバー】アンチウイルスソフト導入(Clam AntiVirus編)]を参照