サーバ再起動の意義
うちのセンターでは隔週で決まった日にサーバの再起動を行っています。
会社の方針では毎週!ということなのですが以前より2週に1回でもトラブルが発生していないことから申請の上、このように対応しているのが今の状態です。
メモリをリフレッシュして安定した動作を保つために必要なので日程を守ってきっちり行っております。
定期リブートにあたって
1週間のうちで最も暇でかつサーバを使用していない時間を選んでの作業となるので制約はありますし、万が一起動に失敗でもしようものなら業務全体がストップしてしまいとんでもない大事になりかねないのでいつもドキドキしながらやってるんですが、この度出勤日の変更に伴ってこの再起動業務を他の担当者に引き継ぐことになりました。
自分も決してパソコンに詳しいと胸を張って威張れるほどの知識はないのですが仕事上仕方なく覚えたことも沢山あります。というか、実際にサーバが壊れてしまったら自分にできることなど何一つとしてないので逆に割り切って対応できる部分もあるんですよね。
しかし次の担当者、組織の運用面に関してはとってもよく理解してくれているありがたい方なんですがパソコンについてはとっても疎いんですね。
再起動マニュアルがあって、基本的にはその通りに行えばハード障害でも起きない限り大丈夫なはずなんですが(って自分は過去に一度、起動直後にメモリの破損が発生してビックリした経験があります)。
マニュアルに載ってるFTサーバと周辺の再起動手順を簡単にまとめると
- 事務所内の全端末でDBサーバに接続するソフトを全て終了
- 取引先ホストとの通信を担う専用端末をシャットダウン
- サーバに接続しているNASをブラウザ経由でシャットダウン
- 仮想サーバ上のバッチファイルを起動して各種サービスを停止
- デスクトップにあるアイコンをクリックして自動でサーバをシャットダウン
- サーバ室にある基盤サーバをシャットダウン
- 10分程度休憩
- 基盤サーバを起動
- 子サーバ×2を起動
- 子サーバ×2にログイン
- 子サーバのいずれかより仮想サーバにログイン
- バッチファイルが勝手に動くので終了まで待ちぼうけ
- 間で基盤サーバにログイン
- 仮想サーバの起動が完了したら通信専用端末を起動
- NASを起動
といった具合です。なれれば30分程度で完了するのですが、デジタル機器が苦手な人にはわけが解らない事だらけだと思います。
実際に引き継いでみたんですが、子サーバと仮想サーバがサッパリわからない様子でしたし、起動失敗したときのことをとても心配していました。
まあ予想していた通りの反応だったので、ひとまずはこれでがんばってもらいます。