WSFC 構成で仮想マシンリソースがフェールオーバーする事象の調査に必要な資料について

目次

これまで弊社サポートのトラブルシューティングに活用されていたログ採取ツール “Shacollector” がリニューアルされます。2023 年 9 月 から、TSS.ps1 を用いた手順に順次変更されて、より包括的なログ採取が可能になります。

本記事はマイクロソフト社員によって公開されております。

いつも弊社製品をご利用いただきまして誠にありがとうございます。 日本マイクロソフトの Windows プラットフォーム サポートです。

今回のテーマは「WSFC 構成で仮想マシンリソースがフェールオーバーする事象の調査に必要な資料について」です。 WSFC 構成で仮想マシンリソースがフェールオーバーする事象の調査には以下の資料をご取得ください。

[A] 事象の再現性がある場合

仮想マシンリソースがフェールオーバーする事象には大きく 2 パターンあります。

  1. 仮想マシンの負荷が高い状況で正常性チェックが失敗する
  2. 仮想マシンがハングアップしてしまって正常性チェックが失敗する

フェールオーバーが発生すると仮想マシンが再起動してしまうためどちらの事象か判断がつきません。そのため、事前に詳細手順にて記載されております “仮想マシンのハートビート機能を無効化” していただいた状態で事象を再現していただき負荷が高い状況となるかハングアップして操作できなくなっているかどうかをご確認ください。

  • 採取いただく資料
    • 仮想マシン の メモリダンプファイル (%systemroot%\Memory.dmp) ※ 仮想マシンがハングアップする事象の場合。対象のゲスト OS で採取
    • パフォーマンスモニターのログ ※ 仮想マシンの負荷が高い状況となる場合。Hyper-V ホスト OS と対象のゲスト OS の両方で採取
    • サポートログ情報 (shaclollector の support オプションのログ) ※ Hyper-V ホスト OS と対象のゲスト OS の両方で採取

資料採取の流れ

  1. 仮想マシンのハートビート機能を無効化します。
  2. Hyper-V ホストおよび対象のゲスト OS のそれぞれに対してパフォーマンスモニターのログを採取します。
  3. OS がハングアップしてしまう事象の調査 (仮想環境/サーバー OS/クライアント OS) を参考にダンプファイルとサポートログを採取します。

採取手順

  1. 仮想マシンリソースの正常性チェックを無効化します。 仮想マシンリソースの正常性チェックを無効化することで、ハングアップが発生しても、仮想マシンのフェール オーバーは発生せず、ハングアップ中の仮想マシンのダンプ ファイルを採取可能です。

    1. フェールオーバー クラスター マネージャーを開きます。
    2. 役割をクリックし、対象の仮想マシン リソースを確認します。
    3. 中央ペイン下部の [リソース] タブで、仮想マシン リソースを右クリックします。
    4. [プロパティ] をクリックし、[設定] タブをクリックします。
    5. [ハートビート設定] - [仮想マシンでのハートビート モニタリングを有効にする] および [アプリケーションの健全性の監視で自動回復を有効にする] チェック ボックスをオフにし、[OK] ボタンをクリックします。

    チェックボックス

    以上の手順で、正常性チェック無効化は完了です。資料採取後に設定を戻す場合は、外したチェックを元に戻します。

  2. 以下の URL より “shacollector.zip” をダウンロードおよび展開いただき、対象端末へ配置します。

    ダウンロード先: shacollector.zip

    shacollector の使い方についてはこちら

    (注意) shacollector は機能の拡張などにより内容が変更されることがあります。 そのため、毎回上記のダウンロード先から shacollector を取得いただき利用してください。

  3. Hyper-V ホストおよび対象のゲスト OS のそれぞれに対して以下のスクリプトを実行してパフォーマンスモニターのログの採取を開始します。 管理者権限のコマンドプロンプトから配置した “shacollector” フォルダーへ移動して、以下のコマンドを実行します。

    shacollector.bat perf perfmon start C:\mslog interval 0:0:1 days 3
    

    ※ 出力先フォルダー名に C:\mslog 以外のフォルダーを指定することも可能です。

    ※ サンプリング インターバールは 1 秒を指定していますが interval の指定で変更することも可能です。

    ※ パフォーマンスログを保持する日数は、3 以外の日数を days オプションに指定することも可能です。

  4. OS がハングアップしてしまう事象の調査 (仮想環境/サーバー OS/クライアント OS) を参考に完全メモリーダンプの設定を行います。

  5. 仮想マシンリソースがフェールオーバーした際の操作を行い事象を再現させます。

  6. ゲスト OS に高負荷もしくはレスポンスが低下する事象が発生した場合は、Hyper-V ホストおよび対象のゲスト OS のそれぞれに対して以下のスクリプトを実行してパフォーマンスモニターのログの採取を停止します。ゲスト OS の操作ができない場合は、Hyper-V ホストのみパフォーマンスモニターのログを取得します。 管理者権限のコマンドプロンプトから配置した “shacollector” フォルダーへ移動して、以下のコマンドを実行します。

    shacollector.bat perf perfmon stop
    
  7. ゲスト OS がハングアップしてログオンできない状況の場合は、OS がハングアップしてしまう事象の調査 (仮想環境/サーバー OS/クライアント OS) に従って Hyper-V ホストから対象の仮想マシンに対してダンプファイルを採取します。仮想マシンに対して操作が行えてパフォーマンスモニターのログを採取いただいた場合は、本対応は不要です。

  8. Hyper-V ホスト及び対象の仮想マシンに対してサポートログ情報を取得します。 管理者権限のコマンドプロンプトから配置した “shacollector” フォルダーへ移動して、以下のコマンドを実行します。

    shacollector.bat support all C:\mslog
    

    ※ 出力先フォルダー名に C:\mslog 以外のフォルダーを指定することも可能です。

  9. 生成されましたログの出力先フォルダーを圧縮の上、弊社までご提供ください。

    • ゲスト OS のパフォーマンスモニターのログ ※ ゲスト OS の負荷が高い状況で採取いただいた場合
    • Hyper-V ホスト OS のパフォーマンスモニターのログ
    • ゲスト OS のメモリダンプファイル ※ ゲスト OS の操作ができずにメモリダンプを取得した場合
    • ゲスト OS のサポートログ
    • Hyper-V ホスト OS のサポートログ

[B] 過去に発生したエラーであり、再現性が無い場合

Hyper-V ホスト OS 、および、対象のゲスト OS の両方でサポート ログを採取し弊社までご提供ください。

  1. 以下の URL より “shacollector.zip” をダウンロードおよび展開いただき、対象端末へ配置します。

    ダウンロード先: shacollector.zip

    ※ shacollector の使い方についてはこちら

    (注意) shacollector は機能の拡張などにより内容が変更されることがあります。 そのため、毎回上記のダウンロード先から shacollector を取得いただき利用してください。

  2. Hyper-V ホスト及び対象の仮想マシンに対してサポートログ情報を取得します。 管理者権限のコマンドプロンプトから配置した “shacollector” フォルダーへ移動して、以下のコマンドを実行します。

    shacollector.bat support all C:\mslog
    

    ※ 出力先フォルダー名に C:\mslog 以外のフォルダーを指定することも可能です。

  3. 生成されましたログの出力先フォルダーを圧縮の上、弊社までご提供ください。

情報採取ツール TSS に関してよく寄せられる質問

情報採取を行うツール TSS に関する一般的なご質問を以下のページにお纏めしています。必要に応じてご参照ください。

TSS に関するご質問

TSS 実行時のエラー関するご質問

以上です。 本情報が少しでも皆様のお役に立てば幸いです。

本情報の内容(添付文書、リンク先などを含む)は、作成日時点でのものであり、予告なく変更される場合があります。