連続レプリケーションの監視

 

適用先: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

トピックの最終更新日: 2007-08-22

Microsoft Exchange Server 2007 Service Pack 1 (SP1) では、連続レプリケーション環境を監視するための新しい強化機能が導入されています。これらの変更により、RTM (Release To Manufacturing) 版の Microsoft Exchange Server 2007 のクラスタ レポート機能が強化され、連続レプリケーション環境の予防的監視のために設計された追加機能が組み込まれています。具体的には、Exchange 2007 SP1 では Get-StorageGroupCopyStatus コマンドレットが強化され、Test-ReplicationHealth という新しいコマンドレットが追加されており、トランスポート収集の対象になる損失が生じた期間について、大幅に詳しい情報が得られるようになっています。これらのコマンドレットを使用して連続レプリケーションの状態を監視することに加えて、Microsoft Exchange Replication Service によって公開されるいくつかのパフォーマンス カウンタを使用することもできます。

SP1 での Get-StorageGroupCopyStatus コマンドレットの強化

Exchange 2007 RTM では、Get-StorageGroupCopyStatus によって報告される状態や、連続レプリケーションのパフォーマンス カウンタが、正確ではなかったり判断を誤りやすかったりする状況がいくつかあります。

  • アクティブでない (たとえば、変更されていない) ストレージ グループが、正常な状態ではない可能性があるときに正常だと報告されることがあります。この状況は、正常ではない状態が、ログが再生されるまで検出されないために発生します。
  • レプリケーションの初期化中は、レプリケーションの状態が評価されているために正確でないことがあります。初期化が完了すると、状態は更新されます。
  • ストレージ グループ内でデータベースのマウントが解除されている場合、LastLogGenerated フィールドの値が間違っている可能性があります。
  • ログ ストリームの途中に足りないログが 1 つ以上ある場合、パッシブ コピーは引き続き回復を試みるため、レプリケーションの状態が失敗と正常の間で切り替わります。この状況が発生すると、再生とコピーのキューが拡大し続けます。
  • ごくまれに、ログの検証が正常に行われても、再生に失敗することがあります。この場合、システムが回復を試みる間、システムの状態は交互に失敗と正常になります。この状況が発生すると、再生とコピーのキューが拡大し続けます。

Exchange 2007 RTM は、Microsoft Exchange Replication Service と Exchange 管理タスクの間の通信にクラスタ データベースとレジストリを使用しますが、このプロセスは非同期です。プロセスが非同期であるため、前で説明した信頼性が低い状態になる可能性があります。

Exchange 2007 SP1 では、Microsoft Exchange Replication Service と Exchange 管理タスクの間の通信に使用する、基になるメカニズムを再設計することで、前述の問題が解決されています。クラスタ サービスやレジストリを使用する代わりに、管理タスクはリモート プロシージャ コール (RPC) を使用して Microsoft Exchange Replication Service と直接通信するようになりました。

さらに、Get-StorageGroupCopyStatus コマンドレットが強化され、新しい状態情報も追加されています。

  • 対象コンピュータ上の Microsoft Exchange Replication Service がネットワークにアクセスできない場合、Get-StorageGroupCopyStatus コマンドレットは ServiceDown という状態の SummaryCopyStatus 値を報告します。
  • 対象コンピュータの Microsoft Exchange Replication Service が初期の起動チェックを完了していない場合、Get-StorageGroupCopyStatus コマンドレットは Initializing という状態の SummaryCopyStatus 値を報告します。この状態をブール値として表すために、新しいパフォーマンス カウンタも作成されています。
  • 増分再シードを完了していない場合、Get-StorageGroupCopyStatus コマンドレットは Synchronizing という状態の SummaryCopyStatus 値を報告します。

SummaryCopyStatus 値の新しい状態が表示されるのは、Exchange 2007 SP1 バージョンの Exchange 管理ツールを使用している場合のみです。Exchange 2007 RTM 版の Exchange 管理ツールを使用している場合、前述の状態のいずれかを表す状態は Failed として報告されます。

Test-ReplicationHealth コマンドレット

Exchange 2007 SP1 では、Test-ReplicationHealth という名前の新しいコマンドレットが導入されました。このコマンドレットは、連続レプリケーションおよび連続レプリケーションのパイプラインを予防的に監視するために設計されました。Test-ReplicationHealth コマンドレットは、メールボックス サーバーでローカルに実行して、ローカル連続レプリケーション (LCR) 環境、クラスタ連続レプリケーション (CCR) 環境、およびスタンバイ連続レプリケーション (SCR) 環境におけるレプリケーションの状態を確認することを目的としています。また、Microsoft Operations Manager (MOM) 管理パックと緊密に統合されて、メールボックス サーバーの連続レプリケーションの状態について簡潔で正確な情報を提供することを目的としています。チェックはより重大であるものから実行され、より重要性の高いテストが最初に行われます。いずれかのチェックが失敗すると、重要性の低いテストも同様に失敗するか、関連性がないと想定されます。

Test-ReplicationHealth コマンドレットでは、レプリケーション、クラスタ サービス、およびストレージ グループのレプリケーションと再生の状態について、すべての面が調査され、レプリケーション システムの完全な概要が示されます。具体的には、クラスタ内のノードで Test-ReplicationHealth コマンドレットを実行すると、次の表で説明するテストが実行されます。

Test-ReplicationHealth コマンドレットによって実行されるテスト

テスト 説明

パッシブ ノードの状態 (PassiveNodeUp)

CCR 環境での使用時に、パッシブ ノードの状態が Up であることを確認します。

クラスタ ネットワークの状態 (ClusterNetwork)

ローカル ノードで見つかったクラスタ管理下のネットワークすべてが機能していることを確認します。

クォーラム グループの状態 (QuorumGroup)

クォーラム リソースを含むクラスタ グループが正常であることを確認します。

ファイル共有クォーラムの状態 (FileShareQuorum)

ファイル共有監視を行うマジョリティ ノード セット クォーラムが使用する FileSharePath の値に到達できることを確認します。

クラスタ化メールボックス サーバー グループの状態 (CmsGroup)

グループ内のすべてのリソースがオンラインであることを確認し、クラスタ化メールボックス サーバーが正常であることを確認します。

ノードの状態 (NodePaused)

クラスタ内のどのノードも一時停止状態になっていないことを確認します。

DNS の登録状態 (DnsRegistrationStatus)

"続行する場合は DNS 登録を要求する" が設定されている、クラスタ管理下のすべてのネットワーク インターフェイスが、ドメイン ネーム システム (DNS) の登録に成功済みであることを確認します。

レプリケーション サービスの状態 (ReplayService)

ローカル ノードの Microsoft Exchange Replication Service が正常であることを確認します。

フェールオーバー後のデータベースのマウント (DBMountedFailover)

フェールオーバー発生後に、マウントが解除されるか失敗したデータベースがあるかどうかを調べます。このテストでは、フェールオーバーの結果として失敗したデータベースだけをチェックします。

ストレージ グループ コピーの中断 (SGCopySuspended)

クラスタ化メールボックス サーバー上の任意のストレージ グループに対して連続レプリケーションが中断されているかどうかを調べます。

ストレージ グループ コピーの失敗 (SGCopyFailed)

状態が Failed になっているストレージ グループ コピーが存在するかどうかを調べます。

ストレージ グループの初期化 (SGInitializing)

状態が Initializing になっているストレージ グループがあるかどうかを調べます。

ストレージ グループのコピー キューの長さ (SGCopyQueueLength)

レプリケーションのコピー キューの長さが、ベスト プラクティスのしきい値より長くなっているストレージ グループがあるかどうかを調べます。現在のベスト プラクティスのしきい値は次のとおりです。

  • 警告   キューの長さがログ ファイル 3 ~ 5 個
  • 失敗   キューの長さがログ ファイル 6 個以上

ストレージ グループの再生キューの長さ (SGReplayQueueLength)

レプリケーションの再生キューの長さが、ベスト プラクティスのしきい値より長くなっているストレージ グループがあるかどうかを調べます。現在のベスト プラクティスのしきい値は次のとおりです。

  • 警告   キューの長さがログ ファイル 30 ~ 59 個
  • 失敗   キューの長さがログ ファイル 60 個以上

Test-ReplicationHealth の監視コンテキスト

Test-ReplicationHealth コマンドレットには MonitoringContext というパラメータがあります。このパラメータを使用すると、タスクの結果に監視イベントとパフォーマンス カウンタを含めることができます。このパラメータは、MOM 用の監視パックで使用します。このパラメータに指定できる値は $true または $false の 2 つです。$true を指定した場合、結果にはサービスに関する情報に加え、監視イベントとパフォーマンス カウンタが含まれます。

監視コンテキストが指定されている場合、アクティブ ノードでは以下のチェック項目のみが確認されます。

  • PassiveNodeUp
  • ClusterNetwork
  • QuorumGroup
  • FileShareQuorum
  • CmsGroup
  • NodePaused
  • DnsRegistrationStatus
  • ReplayService
  • DBMountedFailover

監視コンテキストが指定されている場合、パッシブ ノードでは以下のチェック項目のみが確認されます。

  • ClusterNetwork
  • DnsRegistrationStatus
  • ReplayService
  • SGCopySuspended
  • SGCopyFailed
  • SGInitializing
  • SGCopyQueueLength
  • SGReplayQueueLength

Microsoft Exchange Replication Service によって公開されているパフォーマンス カウンタ

Microsoft Exchange Replication Service は、LCR と CCR の両方でレプリケーションの状態の監視に使用できるパフォーマンス カウンタを提供しています。パフォーマンスに関連する問題の監視とトラブルシューティングを行う場合は、後で説明するカウンタを収集し、評価することをお勧めします。

Microsoft Exchange Replication Service の推奨されるパフォーマンス カウンタ

Microsoft Exchange Replication Service は、次の表に示すカウンタのインスタンスをストレージ グループ コピーごとに作成します。これにより、各ストレージ グループの状態とパフォーマンスを個々に監視できます。各ストレージ グループの状態を監視するには、MSExchange Replication パフォーマンス オブジェクトの ReplayQueueLength カウンタと CopyQueueLength カウンタを監視します。

note注 :
前に説明したように、Get-StorageGroupCopyStatus コマンドレットでも、これらのカウンタの値が表示されます。
カウンタ名 カウンタの説明

Copy Queue Exceeds Mount Threshold (CCR のみ)

コピー キューの長さが自動データベース マウント ダイヤルで指定されているしきい値より大きいかどうかを示します。CCR 環境では、自動データベース マウント ダイヤルのしきい値を超えた場合に、このカウンタの値が 1 になります。LCR 環境では、この値は常に 0 です。

CopyGenerationNumber

前回コピーされたログ ファイルの生成シーケンス番号を示します。

CopyNotificationGenerationNumber

Microsoft Exchange Replication Service によって最後に確認されたログ ファイルの生成シーケンス番号を示します。

CopyQueueLength

コピーまたは検査を待っているログ ファイルの数を示します。

Failed

値 1 は、選択されたインスタンス (ストレージ グループ) の連続レプリケーションの状態が Failed であることを示します。値 0 は、連続レプリケーションの状態が Failed ではないことを示します。

Initializing

値 1 は、選択されたインスタンス (ストレージ グループ) の連続レプリケーションの状態が Initializing であることを示します。この状態は、ストレージ グループ コピーが初期の起動チェックを実行中であること、または Microsoft Exchange Replication Service が増分再シードを実行中であることを示します。値 0 は、連続レプリケーションの状態が Initializing ではないことを示します。

InspectorGenerationNumber

前回検査されたログ ファイルの生成シーケンス番号を示します。

ReplayBatchSize

一緒に再生されたログ ファイルの数を示します。

ReplayGenerationNumber

前回正常に再生されたログ ファイルの生成シーケンス番号を示します。

ReplayGenerationsComplete

現在のバッチで再生されたログ ファイルの数を示します。

ReplayGenerationsPerMinute

現在のバッチでの再生速度 (1 分あたりのログ生成数) を示します。

ReplayGenerationsRemaining

現在のバッチで再生する残りのログ生成数を示します。

ReplayNotificationGenerationNumber

Microsoft Exchange Replication Service によって最後に確認されたログ ファイルの生成シーケンス番号を示します。

ReplayQueueLength

再生されるのを待っているログ ファイルの数を示します。

Suspended

値 1 は、連続レプリケーション処理が中断されていることを示します。中断は、ログ ファイルがパッシブ コピーにコピーされていないか再生されていないことを意味します。

TruncatedGenerationNumber

Microsoft Exchange Replication Service によって最後に切り捨てられたログ ファイルの生成シーケンス番号を示します。

前の表に列挙したカウンタに加えて、MSExchange Replica Seeder パフォーマンス オブジェクトの下で Seeding Finished % という名前の追加のカウンタが公開されています。このカウンタは、シードが完了した割合を示します。値は 0 ~ 100% で、カウンタはシード処理中のストレージ グループについてのみ公開されます。

参照している情報が最新であることを確認したり、他の Exchange Server 2007 ドキュメントを見つけたりするには、Exchange Server TechCenter を参照してください。