監視連續複寫

 

適用版本: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

上次修改主題的時間: 2007-08-22

Microsoft Exchange Server 2007 Service Pack 1 (SP1) 推出了可監視連續複寫環境的新增強化功能。這些變更係根據 Microsoft Exchange Server 2007 的量產發行 (RTM) 版本中的叢集報告功能進行強化,並包含了可主動監控連續複寫環境的其他功能。明確而言,Exchange 2007 SP1 推出了 Get-StorageGroupCopyStatus 指令程式的增強功能、新增名為 Test-ReplicationHealth 的指令程式,以及增加被傳輸暫放遮蔽之視窗的可見性。除了使用這些指令程式來監視連續複寫的健康狀況外,您也可以使用由 Microsoft Exchange 複寫服務所發行的數種效能計數器。

SP1 中的 Get-StorageGroupCopyStatus 增強功能

在 Exchange 2007 RTM 中,在某些情況下,可能會出現 Get-StorageGroupCopyStatus 所報告的狀態與連續複寫效能計數器不正確或誤導的情形:

  • 非使用中 (例如未變更) 的儲存群組會報告為狀況良好,但實際上可能並非如此。之所以發生這種情況,可能是因為在重新顯示記錄之前無法偵測到不正常的狀況。
  • 在複寫初始化期間,會評估複寫狀態,但可能不精確。在完成初始化時,狀態即會更新。
  • 卸載儲存群組中的資料庫時,LastLogGenerated 欄位的值可能不正確。
  • 當記錄資料流中有一或多個遺失的記錄檔時,被動副本會繼續嘗試復原,因而導致複寫狀態在失敗與正常狀態之間切換。出現這種情形時,重新顯示與複製佇列會持續成長。
  • 在少數情況下,記錄檔可順利驗證,但仍無法重新顯示。在這種情況下,系統在嘗試復原時會在失敗與正常狀態之間交替。出現這種情形時,重新顯示與複製佇列會持續成長。

Exchange 2007 RTM 可使用叢集資料庫與登錄進行 Microsoft Exchange 複寫服務與 Exchange 管理工作之間的通訊,此為非同步處理程序。由於此處理程序為非同步,因此可能導致前述不可靠的狀態。

在 Exchange 2007 SP1 中,在重新設計 Microsoft Exchange 複寫服務與 Exchange 管理工作之間的通訊所使用的基礎機制後,前述問題已獲得解決。管理工作現已不再使用叢集服務或登錄,而改為使用遠端程序呼叫 (RPC) 與 Microsoft Exchange 複寫服務直接通訊。

此外,Get-StorageGroupCopyStatus 指令程式也會在加入新狀態資訊後獲得提升:

  • Get-StorageGroupCopyStatus 指令程式會在無法從網路存取目標電腦上的 Microsoft Exchange 複寫服務時,將 SummaryCopyStatus 回報為 ServiceDown。
  • Get-StorageGroupCopyStatus 指令程式會在目標電腦上的 Microsoft Exchange 複寫服務未完成其初始啟動檢查時,將 SummaryCopyStatus 回報為 Initializing。另已建立新的效能計數器,且會以布林值的形式顯示此狀態。
  • Get-StorageGroupCopyStatus 指令程式會在未完成增量重新植入時,將 SummaryCopyStatus 回報為 Synchronizing。

只有在使用 Exchange 2007 SP1 版的 Exchange 管理工具時,您才能看見 SummaryCopyStatus 值的新狀態。若您使用 Exchange 2007 RTM 版本的 Exchange 管理工具,任何前述狀態都將回報為「失敗」。

Test-ReplicationHealth 指令程式

Exchange 2007 SP1 引進一個稱為 Test-ReplicationHealth 的新指令程式。此指令程式是為主動監視連續複寫和連續複寫管線而設計。Test-ReplicationHealth 指令程式依其設計可本機執行於 Mailbox Server 上,以檢查本機連續複寫 (LCR)、叢集連續複寫 (CCR) 與待命連續複寫 (SCR) 環境中的複寫狀態。Test-ReplicationHealth 指令程式亦可與 Microsoft Operations Manager (MOM) Management Pack 密切整合而提供簡單、正確的資訊,以詳細說明 Mailbox Server 連續複寫的健康狀況。檢查作業會依重要性的順序執行;會優先檢查重要的測試。若其中有一項檢查失敗,則會假設較不重要的測試也將失敗,或不具相關性。

Test-ReplicationHealth 指令程式會檢查複寫、叢集服務和儲存群組複寫及重新顯示狀態的所有層面,以提供複寫系統的完整概觀。明確而言,當 Test-ReplicationHealth 指令程式執行於叢集內的節點上時,將會執行下表所述之測試。

Test-ReplicationHealth 指令程式所執行的測試

測試 描述

被動節點狀態 (PassiveNodeUp)

驗證被動節點在 CCR 環境使用時處於 Up 狀態。

叢集網路狀態 (ClusterNetwork)

驗證在本機節點上找到的所有叢集管理網路皆為執行中。

仲裁群組狀態 (QuorumGroup)

驗證包含仲裁資源的叢集群組狀態正常。

檔案共用仲裁狀態 (FileShareQuorum)

驗證具有檔案共用見證的多數節點集仲裁所使用的 FileSharePath 值為可存取狀態。

叢集信箱伺服器群組狀態 (CmsGroup)

確認群組中所有的資源皆在線上,以驗證叢集信箱伺服器的狀態正常。

節點狀態 (NodePaused)

驗證叢集中的節點皆不處於暫停狀態。

DNS 登錄狀態 (DnsRegistrationStatus)

驗證所有已設定 [需進行 DNS 登錄才能繼續 (Require DNS registration to succeed)] 的叢集管理網路介面,皆已通過網域名稱系統 (DNS) 登錄。

複寫服務狀態 (ReplayService)

驗證本機節點上的 Microsoft Exchange 複寫服務狀態正常。

資料庫在容錯移轉後裝載 (DBMountedFailover)

檢查在容錯移轉發生後是否有任何資料庫進行卸載或失敗。此測試只會檢查因為容錯移轉而失敗的資料庫。

儲存群組副本已擱置 (SGCopySuspended)

檢查叢集信箱伺服器上是否有任何儲存群組的連續複寫已擱置。

儲存群組副本已失敗 (SGCopyFailed)

檢查是否有處於「失敗」狀態的儲存群組副本。

儲存群組正在初始化 (SGInitializing)

檢查是否有處於「正在初始化」狀態的儲存群組。

儲存群組副本佇列長度 (SGCopyQueueLength)

檢查是否有儲存群組的複寫複本佇列長度超過最佳作法的閾值。目前,這些閾值為:

  • Warning   佇列長度為 3–5 個記錄檔。
  • Failure   佇列長度為 6 個或更多記錄檔。

儲存群組重新顯示佇列長度 (SGReplayQueueLength)

檢查是否有儲存群組的複寫重新顯示佇列長度超過最佳作法的閾值。目前,這些閾值為:

  • Warning   佇列長度為 30-59 個記錄檔。
  • Failure   佇列長度為 60 個或更多記錄檔。

監視 Test-ReplicationHealth 的內容

Test-ReplicationHealth 指令程式包含名為 MonitoringContext 的參數,可讓您在工作結果中加入監控事件與效能計數器。此參數由 Management Pack for MOM 所使用。此參數的兩個可能值是 $true 或 $false。如果您指定 $true,則結果除了服務的相關資訊外,還會包含監視事件及效能計數器。

若指定監視內容,則只會對主動節點驗證下列檢查:

  • PassiveNodeUp
  • ClusterNetwork
  • QuorumGroup
  • FileShareQuorum
  • CmsGroup
  • NodePaused
  • DnsRegistrationStatus
  • ReplayService
  • DBMountedFailover

若指定監視內容,則只會對被動節點驗證下列檢查:

  • ClusterNetwork
  • DnsRegistrationStatus
  • ReplayService
  • SGCopySuspended
  • SGCopyFailed
  • SGInitializing
  • SGCopyQueueLength
  • SGReplayQueueLength

Microsoft Exchange 複寫服務所發行的效能計數器

Microsoft Exchange 複寫服務所提供的效能計數器可用以同時監控 LCR 與 CCR 中的複寫健康狀況。建議您取得並評估此主題稍後所討論的計數器,以監視與效能相關的問題,並進行疑難排解。

建議使用的 Microsoft Exchange 複寫服務效能計數器

Microsoft Exchange 複寫服務在下表中針對每個儲存群組副本各建立了計數器的執行個體。這可讓您個別監控每個儲存群組的健康狀況與效能。您可以監控 MSExchange Replication 效能物件下的 ReplayQueueLengthCopyQueueLength 計數器,以監控每個儲存群組的健康狀況與狀態。

note附註:
如前所述,Get-StorageGroupCopyStatus 指令程式也會顯示這些計數器的值。
計數器名稱 計數器描述

Copy Queue Exceeds Mount Threshold (CCR only)

指出複製佇列長度是否大於 Auto Database Mount Dial 所指定的閾值。在 CCR 環境中若超過 Auto Database Mount Dial 閾值,則此計數器的值將是 1。此值在 LCR 環境中一律為 0。

CopyGenerationNumber

指出最後複製之記錄檔的產生序號。

CopyNotificationGenerationNumber

指出 Microsoft Exchange 複寫服務所辨識之最後一個記錄檔的產生序號。

CopyQueueLength

指出正在等候進行複製與檢查的記錄檔數目。

Failed

若值為 1,表示所選執行個體 (儲存群組) 的連續複寫處於「失敗」狀態。0 值表示連續複寫並非處於「失敗」狀態。

Initializing

若值為 1,表示所選執行個體 (儲存群組) 的連續複寫處於「正在初始化」狀態。此狀態表示儲存群組副本正在執行初始啟動檢查,或 Microsoft Exchange 複寫服務正在執行增量重新植入。0 值表示連續複寫並非處於「正在初始化」狀態。

InspectorGenerationNumber

指出最後檢查之記錄檔的產生序號。

ReplayBatchSize

指出已一起重新顯示的記錄檔數目。

ReplayGenerationNumber

指出最後成功重新顯示之記錄檔的產生序號。

ReplayGenerationsComplete

指出在現行批次中重新顯示的記錄檔數目。

ReplayGenerationsPerMinute

指出現行批次的重新顯示速率 (以每分鐘產生的記錄檔計算)。

ReplayGenerationsRemaining

指出在現行批次中等待重新顯示的剩餘記錄檔產生數目。

ReplayNotificationGenerationNumber

指出 Microsoft Exchange 複寫服務所辨識之最後一個記錄檔的產生序號。

ReplayQueueLength

指出正在等候重新顯示的記錄檔數目。

Suspended

若值為 1,則表示連續複寫活動已遭到擱置。「擱置」表示記錄檔不會複製或重新顯示到被動副本中。

TruncatedGenerationNumber

指出 Microsoft Exchange 複寫服務所截斷之最後一個記錄檔的產生序號。

除了前一表格所列的計數器以外,MSExchange Replica Seeder 效能物件下方還會發行名為 Seeding Finished % 的計數器。此計數器會指出植入的完成百分比。其值介於 0 至 100% 之間,僅對正要植入的儲存群組發行。

若要確保您目前閱讀的是最新資訊,並尋找其他的 Exchange Server 2007 說明文件,請造訪 Exchange Server 技術資源中心.