如何疑難排解叢集連續複寫問題

Exchange 2007
 

適用版本: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

上次修改主題的時間: 2008-01-14

本主題討論叢集連續複寫 (CCR) 的相關疑難排解問題。如需可協助疑難排解 CCR 問題之工具的相關資訊,請參閱疑難排解高可用性部署問題的工具

本主題中的程序可以用來處理下列在 CCR 環境中的問題:

  • Get-StorageGroupCopyStatus 報告資料庫「失敗」且無法植入。
  • Get-StorageGroupCopyStatus 報告資料庫失敗。FailedMessage 值指出儲存群組副本有分歧。
  • Get-StorageGroupCopyStatus 報告資料庫失敗。FailedMessage 值提供關於失敗來源的特定資訊。
  • 警示、效能計數器或 Get-StorageGroupCopyStatus 指出已針對儲存群組副本備份複製或重新顯示佇列。
  • Get-StorageGroupCopyStatus 報告 LastInspectedLogTime 過舊。
  • 容錯移轉或 Move-ClusteredMailboxServer 成功,但無法裝載資料庫。
  • 容錯移轉成功,但無法自動或手動裝載某些資料庫。或者,Get-ClusteredMailboxServerStatus 報告一或多個資料庫失敗。
  • 在 CCR 環境中,無法於啟動時裝載資料庫。
  • 記錄了 MSExchangeRepl 事件 2073,警示 Microsoft Exchange 複寫服務找不到目錄。
  • Move-ClusteredMailboxServer 因複寫問題而無法起始排定的中斷。
  • 在一或多個儲存群組上發生容錯移轉後,複寫無法重新同步處理。
  • 植入正在發生錯誤。

發生不在此處所列的失敗時,請查看兩個節點上的事件日誌來判斷原因,並使用日誌中的資訊來判斷必須採取哪些復原動作。識別出發生失敗的時間後,其他事件日誌也可能可以協助您更加了解問題。若此資訊不夠充足,知悉問題發生時間將可縮小分析範圍及 cluster.log 中檢閱視窗的大小。叢集記錄檔會提供叢集管理系統所採取之動作的追蹤等級資訊。

若要執行此程序,必須對您使用的帳戶委派 Exchange Server 系統管理員角色及目標伺服器本機 Administrators 群組。如需管理 Microsoft Exchange Server 2007 所需之權限、委派角色及權利的相關資訊,請參閱權限考量

  • 可能的原因   組態問題或複寫副本沒有有效的基準資料庫。此問題可能是因新增被動節點時無法植入儲存群組副本所造成。

  • 解決方案

    • 確認副本的儲存已正確地設定且運作正常。若您發現錯誤,可以暫停再繼續儲存群組來觸發副本的新檢查。
    • 確認儲存群組及資料庫路徑已正確地針對相對於被動伺服器上的儲存來進行設定。您可以在 Exchange 管理主控台中使用 Get-StorageGroup 指令程式來進行確認。
    • 使用 Update-StorageGroupCopy 指令程式來植入儲存群組副本。

  • 可能的原因   若有容錯移轉且遺失過多記錄檔,在不進行完整重新植入的情況下,先前主動伺服器上的資料庫就無法與目前的主動資料庫進行重新同步處理時,便會發生此問題。LCR 中不可能發生此情況。

  • 解決方案   使用 Update-StorageGroupCopy 指令程式植入儲存群組副本。

  • 可能的原因   有許多可能的原因會導致儲存群組副本被判別為失敗。前述無法植入與有分歧的情況就是其中兩個例子。FailedMessage 值會特別識別偵測到的問題。

  • 解決方案   執行 Get-StorageGroupCopyStatus 指令程式來獲得完整的 FailedMessage 值,此值可識別偵測到的特定問題。分析 FailedMessage 值所提供的資訊,並解決報告的狀況。如果報告的狀況是記錄檔損毀或遺失,請嘗試尋找具有正確產生編號的未損毀記錄檔。如果找不到正確的記錄檔,請使用 Update-StorageGroupCopy 指令程式來重新植入。若訊息暗示來源上的記錄檔無法使用,請移除來源之記錄檔目錄上的共用,並重新啟動該節點上的複寫服務。

  • 可能的原因   記錄檔複製或重新顯示積存可能表示復原程序中發生問題或過渡情況。當先前離線的被動節點連線時,或儲存群組副本已暫停一大段時間而在最近繼續時,便會發生過渡情況。停止被動節點上的 Microsoft Exchange 複寫服務將產生的影響與暫停節點上的所有儲存群組副本類似。如果不是過渡情況,則可能是下列其中一個原因所致:

    • 組態問題。
    • 儲存副本已擱置。
    • 重新顯示服務已停止。
    • 儲存失敗或離線。
    • 被動節點離線。
  • 解決方案   判斷是實際問題或過渡情況。

    • 判斷 Microsoft Exchange 複寫服務是否正同時在兩個節點上執行。您可以使用 [服務] 嵌入式管理單元可完成此動作。如果其中一個節點上的服務停止,則您必須啟動該服務。
    • 執行 Exchange 管理命令介面指令程式 Get-StorageGroupCopyStatus 加上 fl (格式化清單) 選項,並判斷被動副本是否已擱置。若被動副本已擱置,請確認被動副本的檔案正確存在,然後使用 Resume-StorageGroupCopy 指令程式繼續儲存群組副本。
    • 執行 Get-StorageGroupCopyStatus 指令程式加上 fl 選項,並判斷副本是否「正常」。若副本「失敗」,請檢閱狀態欄位清單以判斷必要的修正動作。
    • 觀察複寫效能計數器幾分鐘,判斷是否有進度。請特別查看重新顯示產生編號及檢查產生編號。如果複製佇列長度持續增長,但重新顯示佇列長度偏短或正在縮短,表示主動伺服器上的網路檔案共用或主動伺服器本身可能有問題。確認主動儲存群組副本的記錄檔目錄上,已使用 "net share" 命令、Windows 檔案總管或 [電腦管理] 嵌入式管理單元來定義網路檔案共用。您可以在 Exchange 管理命令介面中使用 Get-StorageGroup 指令程式加上 fl 選項來判斷儲存群組的 GUID。

  • 可能原因   此徵狀有三個可能原因:

    • 主動儲存群組副本的資料庫已卸載。
    • 主動儲存群組副本已裝載,但其變更速率不大。因此,主動儲存群組副本並未產生記錄檔。
    • 被動節點上沒有執行 Microsoft Exchange 複寫服務。
  • 解決方案   執行下列動作來判斷發生的是三個原因中的哪一個:

    • 使用 Exchange 管理主控台,或在 Exchange 管理命令介面中使用 Get-StorageGroupStatus 指令程式,判斷資料庫是否已卸載。若資料庫已卸載,則必須裝載資料庫,且必須在資料庫進行變更 (例如,資料庫內的活動),這樣 LastInspectedLogTime 才能變更。
    • 請確認 Microsoft Exchange 複寫服務正在被動節點上執行。若服務已停止,則必須加以啟動。
    • 確認資料庫已裝載後,請檢查資料庫是否正在產生記錄檔。查看主動資料庫的記錄檔目錄,並識別產生編號最高的記錄檔。檢查該記錄檔上的時間戳記;此時間戳記應與 LastInspectedLogTime 中的值相符。

  • 可能的原因   此問題的一般原因是叢集服務帳戶沒有裝載資料庫所需的權限。或者,也有可能是因為容錯移轉遺失的記錄檔數目多於自動裝載組態設定所允許的數目。容錯移轉狀況中的其他一般原因是被動副本在發生失敗時已經有異常。

  • 解決方案   叢集服務帳戶的權限問題一般都是發生於安裝期間。如果資料庫在安裝結束時沒有裝載,通常是表示叢集服務帳戶沒有被授與適當的權限。若要解決這個問題,請將適當的權限授與叢集服務帳戶,然後執行正常關閉程序,再重新啟動整個叢集。您可以使用六個步驟來完成這項工作:(1) 讓叢集信箱伺服器離線;(2) 關閉被動節點;(3) 關閉主動節點;(4) 啟動主動節點;(5) 啟動被動節點,以及 (6) 讓叢集信箱伺服器上線。

    • 請檢閱事件日誌,判斷容錯移轉遺失的記錄檔數目是否多於自動裝載組態設定允許的數目。判斷儲存群組副本之資料庫的狀態後,您可以在 Exchange 管理命令介面中執行 Restore-StorageGroupCopy 指令程式來明確裝載資料庫。最後,執行Get-StorageGroupCopy 指令程式並查看 SummaryCopyStatus 值,識別先前是否有主動副本問題導致無法裝載資料庫。若有任何問題,請檢閱事件日誌來識別問題的原因,然後採取步驟以解決問題。

  • 可能的原因   最近的容錯移轉遺失的記錄檔數目多於自動裝載組態設定所允許的數目。容錯移轉狀況中的其他一般原因是被動副本在發生失敗時已經有異常。

    note附註:
    在排定或未排定的中斷期間,資料庫可能會短暫標示為失敗或離線。此狀態是過渡性的,並且會發生於複寫服務嘗試製作任何可用記錄檔的最後一個副本時。
  • 解決方案   檢閱事件日誌以判斷無法裝載資料庫的原因。無法裝載資料庫的原因可能是記錄檔或資料庫檔案損毀。如果事件指出此情況,請將主動伺服器移至其他節點來還原對資料庫的存取。您可以檢閱事件日誌來判斷資料庫是否失敗。判斷儲存群組副本之資料庫的狀態後,您可以在 Exchange 管理命令介面中執行 Restore-StorageGroupCopy 指令程式來明確裝載資料庫。接著,執行 Get-StorageGroupCopyStatus 指令程式並查看 SummaryCopyStatus 值,識別先前是否有主動副本問題導致無法裝載資料庫。如果狀態顯示儲存群組副本太舊而無法啟動,則當失敗的節點恢復服務且有更多記錄檔可用時,即可還原資料庫。記錄檔會自動複製,因此您不需要採取任何動作。

  • 可能的原因   無法裝載資料庫可能是明確的系統管理員動作所造成。如果資料庫經明確卸載,接著叢集信箱伺服器離線,則資料庫將不會在下次啟動時連線。另一個可能的原因是容錯移轉期間遺失的記錄檔超過可接受的數目。

  • 解決方案   您可以在 Exchange 管理命令介面中執行 Get-ClusteredMailboxServerStatus 指令程式,確認節點上的儲存區是否運作正常。使用 Exchange 管理主控台或 Exchange 管理命令介面嘗試進行受影響之資料庫副本的裝載作業。如需裝載資料庫副本的相關資訊,請參閱如何在叢集連續複寫環境裝載資料庫。裝載作業完成後,請檢閱事件日誌以判斷是否有報告任何錯誤。

  • 可能原因   錯誤事件指出 Microsoft Exchange 複寫服務無法建立事件指定的目錄。Microsoft Exchange 複寫服務嘗試建立幾個必要的目錄 (如果這些目錄不存在的話)。這些包括來源記錄檔、目的記錄檔、目的系統檔案的目錄路徑及記錄檔檢查程式的路徑。

    由於權限問題、硬體失敗或組態失敗,Microsoft Exchange 複寫服務可能無法建立指定的目錄。

  • 解決方案   檢查事件傳回的錯誤碼。確認目錄位置可用且可存取。檢查檔案系統權限。確認儲存設定正確,硬體運作正常。

  • 可能的原因   Exchange 管理命令介面 Move-ClusteredMailboxServer 指令程式包含驗證檢查,它會在發現所有儲存群組副本上的複寫不完全正常時,防止對被動節點進行排定的中斷。此行為可確定排定的中斷進行的時間不至於過久。

  • 解決方案   識別有問題的特定儲存群組,並更正任何問題。來自 Move-ClusteredMailboxServer 指令程式的錯誤訊息可識別有問題的儲存群組副本。若要執行移動並略過驗證檢查,請確定只有失敗儲存群組副本的資料庫是卸載狀態。重試移動作業並使用 -IgnoreDismounted 參數。IgnoreDismounted 參數指出為了複寫狀況檢查目的而略過的已卸載儲存群組。

  • 可能的原因   Get-StorageGroupCopyStatus 指令程式傳回的失敗訊息指出資料庫有分歧。此情況是因為在發生容錯移轉之前,舊的主動伺服器未複寫足夠的記錄檔所致。

  • 解決方案   在 Exchange 管理命令介面中使用 Update-StorageGroupCopy 指令程式重新植入資料庫。

  • 可能的原因   主動伺服器上正在進行備份或發生通訊問題。

  • 解決方案   確認受影響之儲存群組副本或資料庫的備份不在進行中。確定主動節點為連線狀態。

如需本主題中所述之 Exchange 管理命令介面的相關資訊,請參閱下列主題:

如需進行本機連續複寫疑難排解的相關資訊,請參閱如何疑難排解本機連續複寫問題

若要確保您目前閱讀的是最新資訊,並尋找其他的 Exchange Server 2007 說明文件,請造訪 Exchange Server 技術資源中心.
顯示: