読者です 読者をやめる 読者になる 読者になる

高見知英のかいはつにっし(β)

高見知英のアプリケーション開発日誌 のほか、地域活動などの活動報告ブログ。

サーバが不調

最近、うちのサーバが動かなくなることがあります。一度発生するとSSH経由ではほとんどなにもできなくなり、sudoを使ったとたんに「sudo: Can't open /var/run/sudo/ユーザー名...」というエラーが出て止まってしまいます。

そのときHTTPからアクセスを試みると、アクセスはできるもののディレクトリに書き込みができなくなっている様子(「ワークディレクトリに書き込みできない」と表示される)。
モニターをサーバPCに接続してみると「command 0x25 timeout, stat 0xd0 host_stat 0x1」というメッセージが。一般ユーザーでもルートでもログインできないです。

いったんPCの電源を落とし半日くらい寝かすとどうも動くようになるのですが・・・。原因がまったくわかりません。まあ、リセットしただけでは動かないことからして熱関係の問題かもしれませんが・・・。
とりあえず、もう一回再現したら、ログを全部記録してどこかに聞いてみるしかないでしょうか。

一応、どうすればいいかわからないものの、対策としては以下を実施

  • 毎晩深夜にClamAV*1によるウィルススキャンを実施
  • 毎晩深夜にrebootコマンドによる再起動

後者はサーバにあるまじき行為のような気はしますが、磯子クリエイティブチームのTrac以外外部にサービスを出していない(まあ、磯子マガジンのRSSを、Bloglinesにクロールさせてはいるものの・・・ 一回くらい404になっても大きな問題はないでしょう・・・と)


本当はもう少しまともな対策を施すべきなんでしょうが、ログの監視体制の見直しとか。まあ、徐々に追加していくしかないか。

*1:[http://vine.1-max.net/ClamAntiVirus.html:title=【Vine Linux自宅サーバー】アンチウイルスソフト導入(Clam AntiVirus編)]を参照