
AWSマルチAZ×CLUSTERPROを用いた自動切替検証
近年、クラウド環境におけるシステムの高可用性は、企業のIT基盤にとって不可欠な要素となっています。特にAWSのマルチAZ(アベイラビリティゾーン)構成は、障害時のサービス継続性を高めるための有効な手段です。しかし、実際に障害発生時に自動で業務を引き継ぐ仕組みの構築には、技術的な検証が欠かせません。
そこで、社内の若手メンバー(1年目)が、NECが開発・提供するHAクラスタリングソフトウェア「CLUSTERPRO」を用い、AWS環境での自動切替(フェイルオーバー:F/O)検証を実施しました。
※本記事はスライドの記載内容をもとに、検証の要点を簡潔にまとめています。詳細な検証内容や技術的な説明は埋め込みのスライド本文をご参照ください。
INDEX[非表示]
- 1.検証の目的
- 2.検証方法
- 2.1.検証項目
- 2.2.検証手順
- 2.2.1.検証項目①
- 2.2.1.1.・kernelバージョンのダウングレード
- 2.2.1.2.・ソフトウェアインストール(CLUSTERPRO)
- 2.2.2.検証項目②
- 2.2.3.検証項目③
- 2.2.3.1.・環境の構築
- 2.2.3.2.・障害試験によるVPC間通信でのF/O確認
- 3.検証結果
- 4.検証、構築時の失敗
- 5.まとめ
検証の目的
本検証の目的は、AWS Transit Gatewayを利用したVPC間通信において、CLUSTERPROによるVIP(仮想IP)制御による自動切替(F/O)が正常に動作するかを確認することです。これにより、障害発生時でもサービスを継続できる高可用性構成の実現可能性を評価しました。
検証方法
検証項目
① NID検証環境においてFTPサーバ(Linux)をマルチAZで構築し、それぞれのサーバにCLUSTERPROをインストールできること
② 各上記サーバでCLUSTERPROを使用したクラスタ構成が組めること
③ 外部VPCからの通信においてVIP制御によるF/Oが正常に作動すること(WinSCPでFTPプロトコルを使用)

検証手順
検証項目①
・kernelバージョンのダウングレード
- セキュリティグループにルール追加
- IAMポリシー・ロール作成

・ソフトウェアインストール(CLUSTERPRO)
- kernelバージョンのダウングレード
- clplcnscコマンドで、ライセンスキー登録
検証項目②
- VIPの設定
- Cluster Web UIでクラスタ生成
- 障害試験でのF/O確認
検証項目③
・環境の構築

・障害試験によるVPC間通信でのF/O確認
- Act系にのみ、「test」を作成
- 「test」の有無で、F/Oを確認
※構成図や詳細な検証手順はスライド本文をご参照ください
検証結果
AWS Transit Gatewayを使用したVPC間通信において、CLUSTERPROによるVIP制御でのF/Oができることを確認できた。
検証、構築時の失敗
CLUSTERPROが使用できない
CLUSTERPROはインストールできるが、ライセンスキーが登録できず、CLUSTERPROが使用できない。
⇒原因:kernelバージョン非対応
⇒対策:kernelバージョンダウングレード
F/Oはできているのに、通信ができない
Web UI上ではF/Oしており、AWSのコンソールでもルートテーブルのターゲットがStn系に切り替わっていることも確認済み。
PingもStn系に通っている。
⇒原因:「ソース/宛先チェック」を有効にしていたため、VIPのターゲットのENI切り替えの際にStn系側でパケットが破棄され、VIPが無効になってしまっていた(無効にするには停止にチェックを入れる)。
⇒対策:「ソース/宛先チェック」を無効にする。
まとめ
今回の検証により、AWSマルチAZ環境においてCLUSTERPROを活用した高可用性クラスタ構成が実現可能であることが確認できました。今後は、より幅広いクラウドサービスへの対応や、ネットワークミラーリング機能の活用など、さらなる運用の高度化が期待されます。実績あるソフトウェアを活用し、障害に強いシステム基盤の構築を目指していきます。
※本資料に登場する会社名・製品・サービス名、ロゴマークなどは該当する各社の商号・商標または登録商標です。






