ブログ | 株式会社エスエーティ

サーバー故障の主な原因とは?故障に備えた事前準備を徹底解説

作成者: 株式会社エスエーティ|2022.07.06

社内のサーバー故障の原因は、ハードディスクの老朽化や熱による部品の破損・自然災害などが考えられます。サーバーが故障すると、復旧対応のための人員や部品交換のコストがかかるほか、状況によってはサービスを一時的に停止しなければなりません。こうした突発的に発生するサーバーの故障に対し日頃から備えておくことで、故障によるビジネスへの影響を最小限にとどめることができるでしょう。また、故障時の適切な判断や対応のために「第三者保守」を検討するのも選択肢の一つです。本記事では、サーバー故障の主な原因と故障に備えた事前準備について解説します。

サーバーが故障する主な原因

サーバーは常に稼働させておく必要があるため故障のリスクも高いです。はじめに、サーバーが故障する主な原因について解説します。

ハードディスクや他の部品の老朽化

サーバーの故障で最も多い要因はサーバーを構成している部品の老朽化による故障です。サーバーを構成している部品は、ハードディスクやCPU・電源・マザーボードなどがありますが、これらの部品のどれかが老朽化することで正常な動作をしなくなり、その影響でサーバーが正常に稼働しなくなります

またハードディスクに傷がついてしまうと、データを正しく読み込めなくなる恐れがあります。

熱による部品の破損

サーバーは24時間稼働させる必要があるため、サーバーを構成している各部品は熱を帯びた状態になりやすいです。そのため熱を帯びた状態が続くと、サーバーを構成している各部品の劣化や破損に繋がる恐れがあります

自然災害によってサーバーが直接ダメージを受けてしまう

地震や火災(落雷)などの自然災害により、サーバーが直接ダメージを受けて故障するケースもあります

企業システムに密接に関わる機器は、地震や津波などの自然災害を受けにくい場所に設置したり、厳重な対策を講じたりすることが多いです。しかし、自然災害を完璧に防ぐことは難しいでしょう。サーバーを設置している施設や電力設備が物理的な被害を受けてしまい、サーバー自体が稼働できない事態へと繋がるケースも起こり得ます。

サーバーが故障した際によく見られる症状

サーバーが故障すると、それまでできていた作業が急にできなくなることがあります。ここでは、サーバーが故障した際によく見られる症状について解説します。

サーバー自体の電源オンオフが制御できない

サーバー自体の電源のオンオフが制御できなくなった場合、故障の可能性があります。まずは電源設備自体が故障してしまったのか、サーバー本体だけの症状なのかを確認する必要があります。

サーバーの赤ランプが点灯・点滅している

サーバーの故障を示す赤ランプが点灯・点滅している場合も、サーバー内の部品で故障や異常が起きている可能性が高いです。内部の部品で故障や異常があることは把握できても、保守作業の知識がない個人が原因の究明や復旧対応を行うのは非常に困難なため、サーバー保守の専門業者に対応を一任する方が安全かつ確実です。

エラーメッセージが表示される

エラーメッセージが表示されて正常に稼働しない場合も、サーバー内の部品の故障が原因と考えられます。エラーメッセージの種類はたくさんあり、メーカーによって文言やエラーメッセージの意味は異なります。

サーバーから異音や焦げたにおいがする

熱などの影響によって部品の劣化が進行すると、サーバーから異音や焦げたにおいがすることがあります。部品が熱によって劣化した場合は、ファイル構成が乱れたり、データにアクセスできなくなったりするなど二次被害に繋がりやすいため、ただちに使用を中止しなければいけません。

サーバー故障に備えた事前準備と故障が起きた時の対処方法を解説

機器の故障は老朽化や熱・自然災害など様々な要因で起こりますが、こうした突発的に発生するサーバー故障による影響を最小限に抑えるためには、故障に備えた事前準備ができているかどうかが重要になってきます。ここではサーバー故障に備えた事前準備について解説します。

サーバーの持続可能環境の構築手法を検討する

機器故障が発生した際にも、サーバーの冗長化 など「サービスを止めずに継続して使えるシステム」を事前に検討・構築しておく必要があります。

システムを稼働している最中に問題が発生した場合でも、予備のサーバー・システムに切り替えることで、稼働を停止させずに運用できます。また、一つのサーバーに大きな負荷がかかってしまうケースにおいても、冗長化したサーバーにアクセスの負荷を分散して、サーバーアウトを回避することが可能です。

サーバーの運用マニュアル、障害発生時の対応方法を記載した手順書作成・準備

企業内に設置してある個々のサーバー毎に、運用マニュアルを作成しておくことも重要です。

障害発生時の対応方法について記載した手順書を作成しておけば、障害が発生した際にも適切な対処ができるでしょう。

データの保存と復旧方法についての手順書作成・準備

また、サーバー故障に備えて、バックアップを定期的に行うことも重要です。HDDが故障すると大切なデータが消えてしまう可能性もあります。保守会社のサポートによりHDDの交換を行うことで機器の復旧はできても、失われた顧客データの復旧は保守作業に含まれていないことがほとんどのため顧客データの保存・復旧に関しては自社で管理する必要があります。事前に定期的なバックアップの実施と故障の際のデータ復旧方法についての手順書を作成・準備しておきましょう。

保守業者へすぐに依頼ができるような連絡体制を作っておく

サーバーが故障した際の連絡体制をきちんと整えておけば、保守業者へスムーズに連絡でき、スピーディな復旧対応が可能となります。

メーカーサポートや保守会社と保守契約を結ぶと、障害時の連絡先などが通知されます。こうした連絡先や連絡方法を日ごろから社内で把握・管理しておくことで突発的な故障にも速やかに対応できるようになるでしょう。

空調を利用してサーバーの保管場所の温度や湿度を一定にする

サーバーが熱を帯びた状態が続くと部品の劣化に繋がりやすいです。そのため空調を利用して、サーバーの保管場所の温度や湿度を一定に保ちましょう。

故障が起きた場合は保守サポート窓口へ速やかに連絡を

故障が発生した場合、自分で電源のオンオフを頻繁に繰り返すのは危険です。サーバーにはビジネスの基盤となる商品データや顧客データなどが入っていることが多く、サーバーに詳しくない人間が個人で復旧させようとすると大きなリスクが伴います。さらに、故障箇所の特定も経験とノウハウがないと難しいため、自社内で対応することは簡単ではありません。

サーバー故障の症状が見られたら速やかに保守会社へ連絡し、不具合の状況を伝えて対応を依頼するのが安全です。メーカー保守に入っていない、あるいはメーカー保守期間が過ぎているなどメーカーのサポート窓口対応が受けられない場合は第三者保守の利用も検討してみてはいかがでしょうか。

まとめ

サーバーが故障すると、復旧対応に多くの人員や部品交換のコストがかかり、状況によってはサービスを一時的に停止しなければなりません。そのためサーバーの冗長化や運用方法の確認・バックアップの作成・空調の整備など故障が起きる前に十分な対策を講じておくことが重要です。また実際に故障が起きてしまった場合、サーバーはビジネスの基盤となる商品データや顧客データなどが入っていることが多く、サーバーに詳しくない人間が復旧させるのは非常にリスクが高いため、専門の保守会社に対応を依頼することで安全に対処できるでしょう。

SATでは「第三者保守」のサービスを提供しています。SATの第三者保守では、24時間365日での受付対応が可能であり、データ消去サービスや機器移設などのサポートも行っています。お客様に最適なサービスをご提案させていただきますので、お気軽にSATまでご相談ください。