共用方式為


監視高可用性及站台恢復

適用版本: Exchange Server 2010

上次修改主題的時間: 2010-01-11

確定您的伺服器操作確實,且資料庫副本正常,是每天通訊作業的主要目標。為了協助確保 Microsoft Exchange Server 2010 組織的可用性和可靠性,您必須主動監控硬體、Windows 作業系統和 Exchange 2010 服務。主動式監控結合了預防性維護,可在嚴重問題干擾 Exchange 組織運作之前,協助您識別潛在的錯誤。

監控您的 Exchange 組織,涵蓋定期檢查服務或資料的問題。監控通常包含發生問題時傳送警示的通知系統。Windows Server 2008 和 Exchange 2010 包含一些可協助您 Exchange 組織順利執行的工具和服務。以下是每日監控的主要優點:

  • 符合服務等級協定 (SLA) 的需求
  • 確定成功完成特定的系統管理工作,例如,每日備份作業。
  • 偵測並解決問題,例如,可能影響通訊服務或資料可用性的問題。

在 Exchange 2010 組織內,作業中包括的程序、角色及責任都應該定形。請務必瞭解,健全營運作法與狀況良好的基礎結構之間的關聯。有大量文件記錄的完善操作處理序與程序,可協助確保 Exchange 所仰賴之組織環境內的所有元件,均能有效地受到管理。

Exchange 2010 包含一些內建的工具和功能,針對高可用性或站台恢復設定 Exchange 時,可做為定期主動式監控的一部分。高可用性和站台恢復的主要監控指令程式為 Get-MailboxDatabaseCopyStatusTest-ReplicationHealth。除了提供可執行監控功能和報告狀態的指令程式之外,Exchange 2010 還具有可在 Windows Server 中充分運用Crimson 通道能力的新事件日誌資料流功能,以及可從這些事件通道收集資料的內建指令碼。

您可以使用本主題中的詳細資料,為資料庫可用性群組 (DAG) 監控信箱資料庫副本的狀況和狀態。如需監視 Exchange 2010 的一般資訊,請參閱監視 Exchange 2010

目錄

Get-MailboxDatabaseCopyStatus 指令程式

Test-ReplicationHealth 指令程式

Crimson 通道事件記錄

CollectOverMetrics.ps1 指令碼

CollectReplicationMetrics.ps1 指令碼

Get-MailboxDatabaseCopyStatus 指令程式

您可以使用 Get-MailboxDatabaseCopyStatus 指令程式來檢視信箱資料庫副本的狀態資訊。此指令程式可讓您檢視特定資料庫的所有副本資訊、特定伺服器的特定副本資訊,或伺服器的所有資料庫副本資訊。下表說明信箱資料庫可能的副本狀態值。

資料庫副本狀態

資料庫副本狀態 描述

失敗

因為信箱資料庫副本未擱置且無法複製或重新顯示記錄檔,所以信箱資料庫副本的狀態為「失敗」。當狀態為「失敗」且未擱置時,系統會定期檢查導致副本狀態變更為「失敗」的問題是否已解決。當系統偵測到問題已解決且沒有其他問題,副本狀態會自動變更為「正常」。

植入

已植入信箱資料庫副本、信箱資料庫副本的內容索引,或是兩者皆已植入。成功完成植入時副本狀態應變更為正在初始化。

SeedingSource

信箱資料庫副本正被用來作為資料庫副本植入作業的來源。

已擱置

因為系統管理員執行 Suspend-MailboxDatabaseCopy 指令程式,手動擱置資料庫副本,所以信箱資料庫副本的狀態為「已擱置」。

正常

信箱資料庫副本成功複製並重新顯示記錄檔,或已成功複製並重新顯示所有可用的記錄檔。

ServiceDown

Microsoft Exchange 複寫服務無法在主控信箱資料庫副本的伺服器上使用或執行。

初始化

當已建立信箱資料庫副本、Microsoft Exchange 複寫服務開始或剛開始,以及從「已擱置」、「ServiceDown」、「失敗」、「植入」、「SinglePageRestore」、「LostWrite」或「已中斷」轉換為其他狀態期間,信箱資料庫副本的狀態將為「正在初始化」。在此狀態下,系統會驗證資料庫和記錄資料流的狀態是否一致。在大部分情況下,副本狀態會維持在「正在初始化」的狀態約 15 秒,但在任何情況下,通常維持在此狀態的時間不應超過 30 秒。

重新同步處理

信箱資料庫副本及其記錄檔已經和資料庫的主動副本比對過,以檢查兩份副本之間的任何分歧。副本狀態會維持在此狀態,直到偵測到分歧或分歧解決為止。

已裝載

主動副本為線上並接受用戶端連線。只有信箱資料庫的主動副本可以有「已裝載」的副本狀態。

已卸載

主動副本為離線且不接受用戶端連線。只有信箱資料庫的主動副本可以有「已卸載」的副本狀態。

裝載中

主動副本正在進入線上,並且尚未接受用戶端連線。只有信箱資料庫的主動副本可以有「裝載中」的副本狀態。

卸載中

主動副本即將離線並終止用戶端連線。只有信箱資料庫的主動副本可以有「卸載中」的副本狀態。

DisconnectedAndHealthy

信箱資料庫副本不再連線至主動資料庫副本,並且在中斷連線時其狀態為「正常」。此狀態表示資料庫副本與其來源資料庫副本的連接性。來源副本和目標資料庫副本之間發生 DAG 網路失敗時即可能報告此狀態。

DisconnectedAndResynchronizing

信箱資料庫副本不再連線至主動資料庫副本,並且在中斷連線時其狀態為「重新同步處理」。此狀態表示資料庫副本與其來源資料庫副本的連接性。來源副本和目標資料庫副本之間發生 DAG 網路失敗時即可能報告此狀態。

FailedAndSuspended

由於偵測到失敗,並且明確需要系統管理員的介入來解決失敗,所以系統同時設定了「失敗」和「已擱置」狀態。例如,如果系統在作用中信箱資料庫和資料庫副本之間偵測到無法復原的分歧。不像「失敗」狀態,系統不會定期檢查問題是否已解決並自動復原。而是在資料庫副本可以轉換為正常狀態之前,由系統管理員介入來解決失敗的根本原因。

ActivationSuspended

信箱資料庫副本已由系統管理員手動鎖定而無法啟動。

SinglePageRestore

此狀態表示信箱資料庫副本發生單一頁面還原操作。

Get-MailboxDatabaseCopyStatus 指令程式還包含稱為 ConnectionStatus 的參數,可傳回使用中複寫網路的相關資訊。如果您使用此參數,IncomingLogCopyingNetworkSeedingNetwork 等兩個其他輸出欄位將填入該工作的輸出。

Get-MailboxDatabaseCopyStatus 範例

下列範例使用 Get-MailboxDatabaseCopyStatus 指令程式。每一個範例都會將結果以管線傳送至 Format-List 指令程式,以便以清單格式顯示輸出。

本範例傳回 DB2 資料庫所有複本的狀態資訊。

Get-MailboxDatabaseCopyStatus -Identity DB2 | Format-List

本範例傳回信箱伺服器 MBX2 上所有資料庫複本的狀態。

Get-MailboxDatabaseCopyStatus -Server MBX2 | Format-List

此範例傳回本機 Mailbox Server 上所有資料庫副本的狀態。

Get-MailboxDatabaseCopyStatus -Local | Format-List

此範例傳回 Mailbox Server MBX1 上資料庫 DB3 的狀態、記錄傳送和植入網路資訊。

Get-MailboxDatabaseCopyStatus -Identity DB3\MBX1 -ConnectionStatus | Format-List

如需使用 Get-MailboxDatabaseCopyStatus 指令程式的相關資訊,請參閱 Get-MailboxDatabaseCopyStatus

回到頁首

Test-ReplicationHealth 指令程式

您可以使用 Test-ReplicationHealth 指令程式來檢視信箱資料庫副本的連續複寫狀態資訊。此指令程式可用來檢查複寫和重新顯示的各個部分,以提供 DAG 中特定 Mailbox Server 的完整概觀。

Test-ReplicationHealth 指令程式旨在用來主動監視連續複寫和連續複寫管線、Active Manager 的可用性,以及基礎叢集服務、仲裁及網路元件的健全狀況和狀態。可在本機或在遠端針對 DAG 中任何的信箱伺服器執行。Test-ReplicationHealth 指令程式會執行下表所列出的測試。

Test-ReplicationHealth 指令程式測試

測試名稱 描述

ClusterService

驗證在指定的 DAG 成員上是否正在執行叢集服務並且可以存取,若沒有指定任何 DAG 成員,則驗證本機伺服器。

ReplayService

驗證在指定的 DAG 成員上是否正在執行 Microsoft Exchange 複寫服務並且可以存取,若沒有指定任何 DAG 成員,則驗證本機伺服器。

ActiveManager

驗證在指定的 DAG 成員上所執行的 Active Manager 執行個體 (若沒有指定任何 DAG 成員,則為本機伺服器),其角色是有效的 (主要、次要或獨立)。

TasksRpcListener

驗證在指定的 DAG 成員上是否正在執行工作遠端程序呼叫 (RPC) 伺服器並且可以存取,若沒有指定任何 DAG 成員,則驗證本機伺服器。

TcpListener

驗證在指定的 DAG 成員上是否正在執行 TCP 記錄複製接聽程式並且可以存取,若沒有指定任何 DAG 成員,則驗證本機伺服器。

DagMembersUp

驗證所有 DAG 成員是否可以使用、執行和存取。

ClusterNetwork

驗證在指定的 DAG 成員上找到的所有叢集管理網路是否皆可用 (若沒有指定任何 DAG 成員,則為本機伺服器)。

QuorumGroup

驗證預設的叢集群組 (仲裁群組) 的狀態為正常且為線上。

FileShareQuorum

驗證見證伺服器、見證目錄和 DAG 的共用設定是否皆可存取。

DBCopySuspended

檢查在指定的 DAG 成員上所有信箱資料庫副本的狀態是否皆為「已擱置」,若沒有指定任何 DAG 成員,則檢查本機伺服器。

DBCopyFailed

檢查在指定的 DAG 成員上所有信箱資料庫副本的狀態是否皆為「失敗」,若沒有指定任何 DAG 成員,則檢查本機伺服器。

DBInitializing

檢查在指定的 DAG 成員上所有信箱資料庫副本的狀態是否皆為「正在初始化」,若沒有指定任何 DAG 成員,則檢查本機伺服器。

DBDisconnected

檢查在指定的 DAG 成員上所有信箱資料庫副本的狀態是否皆為「已中斷連線」,若沒有指定任何 DAG 成員,則檢查本機伺服器。

DBLogCopyKeepingUp

驗證在指定的 DAG 成員 (若沒有指定任何 DAG 成員,則驗證本機伺服器) 上資料庫被動副本的記錄檔複製和檢查是否可跟得上被動副本上的記錄檔產生活動。

DBLogReplayKeepingUp

驗證在指定的 DAG 成員 (若沒有指定任何 DAG 成員,則驗證本機伺服器) 上資料庫被動副本的重新顯示活動是否可跟得上記錄檔複製和檢查活動。

Test-ReplicationHealth 範例

這個範例使用 Test-ReplicationHealth 指令程式來測試 Mailbox Server MBX1 的複寫狀況。

Test-ReplicationHealth -Identity MBX1

回到頁首

Crimson 通道事件記錄

Windows Server 2008 包含兩個類別的事件記錄:Windows 記錄與「應用程式及服務」記錄。Windows 記錄類別包含可於舊版 Windows 使用的事件記錄:應用程式、 安全性和系統事件記錄。也包含兩個新記錄:「安裝」記錄與 ForwardedEvents 記錄。Windows 記錄的目的是從舊版應用程式和套用到整個系統的事件儲存事件。

「應用程式及服務」記錄是新的事件記錄類別。這些記錄儲存單一應用程式或元件中的事件,而非可能影響整個系統的事件。事件記錄的這個新類別稱為應用程式的Crimson 通道。

「應用程式及服務」記錄類別包含四個子類型:「系統管理」、「操作」、「分析」和「偵錯」記錄。如果您使用事件記錄來疑難排解問題,則「系統管理」記錄中的事件特別有用。「系統管理」記錄中的事件應提供您如何回應事件的指引。「操作」記錄中的事件也相當有用,但可能需要更多解譯。「系統管理」與「偵錯」記錄難以使用。「分析」記錄 (預設為隱藏並停用) 儲存用於追蹤問題的事件,經常記錄著大量事件。「偵錯」記錄供開發人員於偵錯應用程式時使用。

Exchange 2010 將事件記錄到「應用程式及服務」記錄區的Crimson 通道內。您可以執行下列步驟來檢視這些通道:

  1. 開啟 [事件檢視器]。
  2. 在主控台樹狀目錄中,瀏覽至 [應用程式及服務記錄] > [Microsoft] > [Exchange]。
  3. 選取 [Exchange] 下的Crimson 通道:[HighAvailability] 或 [MailboxDatabaseFailureItems]。

HighAvailability 通道包含與啟動和關閉 Microsoft Exchange 複寫服務相關的事件,以及 Microsoft Exchange 複寫服務內執行的元件,例如,Active Manager、第三方同步處理複寫 API、工作 RPC 伺服器、TCP 接聽程式和磁碟區陰影複製服務 (VSS) 編寫器。Active Manager 也會使用 HighAvailability 通道來記錄與 Active Manager 角色監視相關的事件和資料庫動作事件,例如,資料庫裝載操作和記錄檔截斷,以及記錄與 DAG 基礎叢集相關的事件。

MailboxDatabaseFailureItems 通道可用來記錄影響複寫信箱資料庫失敗的所有相關事件。

回到頁首

CollectOverMetrics.ps1 指令碼

Exchange 2010 包含稱為 CollectOverMetrics.ps1 的指令碼,您可以在 Scripts 資料夾內找到這個指令碼。這是一個工作流程指令碼,可收集各種轉換及容錯移轉相關統計資料的資訊。使用 CollectOverMetrics.ps1 指令碼是一種被動形式的監控。指令碼收集及分析已記錄的事件。指令碼支援可讓您自訂指令碼行為和輸出的參數。下表列出可用的參數。

CollectOverMetrics.ps1 指令碼參數

參數 描述

DatabaseAvailabilityGroup

指定您想從其中收集度量資訊的 DAG 名稱。若省略此參數,會使用本機伺服器為其成員的 DAG。

資料庫

提供需產生報告的資料庫清單。支援萬用字元,例如,-Database:"DB1","DB2"-Database:"DB*"

TemporaryDataPath

指定暫存檔案的儲存位置。若省略此參數,則目錄名稱如下:%SystemDrive%\Temp\CollectOverMetrics\<ScriptStartTime>

StartTime

指定開始收集事件資料的時間。若省略此參數,則開始時間為昨天 00:00 (午夜)。

EndTime

指定停止收集事件資料的時間。若省略此參數,則事件會收集到昨天 23:59 為止。

ReportPath

指定用來儲存事件處理結果的資料夾。若省略此參數,則會使用 Scripts 資料夾。

ReportAlias

指定報告傳送目標的電子郵件別名。

IncludeAppLogs

指定如果事件是在應用程式事件記錄中仍應收集、合併和處理。預設情況下,將會包含下列提供者:MSExchangeIS、MSExchangeIS 信箱儲存區和 MSExchangeRepl。

AppLogProviders

指定是否應該收集特定的應用程式事件記錄事件。若指定此參數,則不包含為 IncludeAppLogs 所列出的提供者,並且需使用 AppLogProviders 參數來明確指定。

AnalyzeOnly

指定資料已收集且只需進行處理。

MergedXmlFile

指定將與所有收集到的事件記錄合併的 XML 檔案的名稱。

GenerateHtmlReport

指定報表應以簡單的 HTML 表格格式輸出,以方便檢視。

ShowHtmlReport

指定 HTML 產生的報表於產生後應以 Web 瀏覽器顯示。

DotSourceMode

指定無需立即執行,但此檔案是使用其中定義的 Windows PowerShell 方法來設定點來源。

CollectOverMetrics.ps1 範例

下列範例使用 CollectOverMetrics.ps1 指令碼。

這個範例會收集 DAG DAG1 中符合 DB* (包含萬用字元) 的所有資料庫度量資訊。收集度量資訊之後,會產生並顯示 HTML 報告。

CollectOverMetrics.ps1 -DatabaseAvailabilityGroup DAG1 -Database:"DB*" -GenerateHTMLReport -ShowHTMLReport

這個範例會收集 DAG DAG2 中所有資料庫的度量資訊。收集度量資訊之後,會產生並顯示 HTML 報告。

CollectOverMetrics.ps1 -DatabaseAvailabilityGroup DAG2 -GenerateHTMLReport -ShowHTMLReport

回到頁首

CollectReplicationMetrics.ps1 指令碼

另一個包含在 Exchange 2010 內的狀況度量資訊是 CollectReplicationMetrics.ps1。這個指令碼在執行時即時收集度量資訊,所以是一種主動形式的監視。指令碼支援可讓您自訂指令碼行為和輸出的參數。下表列出可用的參數。

CollectReplicationMetrics.ps1 指令碼參數

參數 描述

DagName

指定您想從其中收集度量資訊的 DAG 名稱。若省略此參數,會使用本機伺服器為其成員的 DAG。

DatabaseNames

提供需產生報告的資料庫清單。支援使用萬用字元,例如,-DatabaseNames:"DB1","DB2"-DatabaseNames:"DB*"

ReportAlias

指定報告傳送目標的電子郵件別名。

TemporaryDataPath

指定暫存檔案的儲存位置。若省略此參數,則目錄名稱如下:%SystemDrive%\Temp\CollectReplicationMetrics\<ScriptStartTime>

ReportPath

指定用來儲存事件處理結果的資料夾。若省略此參數,則會使用 Scripts 資料夾。

持續時間

指定收集程序應執行的時間量。

頻率

指定資料度量資訊的收集頻率。

詳細

工作完成後在畫面上顯示工作輸出。

ProcessOnly

指定資料已收集且只需進行處理。

CollectReplicationMetrics.ps1 範例

下列範例使用 CollectReplicationMetrics.ps1 指令碼。

這個範例收集 DAG DAG1 上所有資料庫的度量資訊,並以畫面報告顯示所收集到的資料。

CollectReplicationMetrics.ps1 -DagName DAG1 -Verbose

回到頁首