catch-img

AWSマルチAZ×CLUSTERPROを用いた自動切替検証

近年、クラウド環境におけるシステムの高可用性は、企業のIT基盤にとって不可欠な要素となっています。特にAWSのマルチAZ(アベイラビリティゾーン)構成は、障害時のサービス継続性を高めるための有効な手段です。しかし、実際に障害発生時に自動で業務を引き継ぐ仕組みの構築には、技術的な検証が欠かせません。

そこで、社内の若手メンバー(1年目)が、NECが開発・提供するHAクラスタリングソフトウェア「CLUSTERPRO」を用い、AWS環境での自動切替(フェイルオーバー:F/O)検証を実施しました。

本記事はスライドの記載内容をもとに、検証の要点を簡潔にまとめています。詳細な検証内容や技術的な説明は埋め込みのスライド本文をご参照ください。

検証の目的

本検証の目的は、AWS Transit Gatewayを利用したVPC間通信において、CLUSTERPROによるVIP(仮想IP)制御による自動切替(F/O)が正常に動作するかを確認することです。これにより、障害発生時でもサービスを継続できる高可用性構成の実現可能性を評価しました。

検証方法

検証項目

① NID検証環境においてFTPサーバ(Linux)をマルチAZで構築し、それぞれのサーバにCLUSTERPROをインストールできること

② 各上記サーバでCLUSTERPROを使用したクラスタ構成が組めること

③ 外部VPCからの通信においてVIP制御によるF/Oが正常に作動すること(WinSCPでFTPプロトコルを使用)

構成図

検証手順

検証項目①

・kernelバージョンのダウングレード
  1. セキュリティグループにルール追加
  2. IAMポリシー・ロール作成

構成図
・ソフトウェアインストール(CLUSTERPRO)
  1. kernelバージョンのダウングレード
  2. clplcnscコマンドで、ライセンスキー登録

検証項目②

  1. VIPの設定
  2. Cluster Web UIでクラスタ生成
  3. 障害試験でのF/O確認

検証項目③

・環境の構築

構成図
・障害試験によるVPC間通信でのF/O確認
  1. Act系にのみ、「test」を作成
  2. 「test」の有無で、F/Oを確認

※構成図や詳細な検証手順はスライド本文をご参照ください

検証結果

AWS Transit Gatewayを使用したVPC間通信において、CLUSTERPROによるVIP制御でのF/Oができることを確認できた。

検証、構築時の失敗

CLUSTERPROが使用できない

CLUSTERPROはインストールできるが、ライセンスキーが登録できず、CLUSTERPROが使用できない。

⇒原因:kernelバージョン非対応
⇒対策:kernelバージョンダウングレード

F/Oはできているのに、通信ができない

Web UI上ではF/Oしており、AWSのコンソールでもルートテーブルのターゲットがStn系に切り替わっていることも確認済み。
PingもStn系に通っている。

⇒原因:「ソース/宛先チェック」を有効にしていたため、VIPのターゲットのENI切り替えの際にStn系側でパケットが破棄され、VIPが無効になってしまっていた(無効にするには停止にチェックを入れる)。
⇒対策:「ソース/宛先チェック」を無効にする。

まとめ

今回の検証により、AWSマルチAZ環境においてCLUSTERPROを活用した高可用性クラスタ構成が実現可能であることが確認できました。今後は、より幅広いクラウドサービスへの対応や、ネットワークミラーリング機能の活用など、さらなる運用の高度化が期待されます。実績あるソフトウェアを活用し、障害に強いシステム基盤の構築を目指していきます。


※本資料に登場する会社名・製品・サービス名、ロゴマークなどは該当する各社の商号・商標または登録商標です。

S.N.
S.N.
2023年入社。ICTデザイン事業部ANA部第2課に所属。2023年度基本情報技術者試験取得。現在は、インフラエンジニアとして基礎知識向上のため応用情報技術者取得に向け勉強中。

関連記事

おすすめの資料

「システム運用のアウトソーシング選び方ガイド」資料DLフォームへのバナーリンク
お役立ち資料DLバナー

サイト内検索


カテゴリ一覧

タグ一覧


人気記事ランキング


サービス

運用監視サービスサイトへのバナーリンク
脆弱性診断サービスサイトへのバナーリンク
創業50年以上の実績でIT課題を一気通貫でサポートします