클러스터 연속 복제 문제를 해결하는 방법

 

적용 대상: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

마지막으로 수정된 항목: 2008-01-14

이 항목에서는 CCR(클러스터 연속 복제)와 관련된 문제의 해결 방법에 대해 설명합니다. CCR 문제 해결에 도움이 될 수 있는 도구에 대한 자세한 내용은 고가용성 배포와 관련된 문제 해결 도구를 참조하십시오.

이 항목의 절차는 CCR 환경에서 발생할 수 있는 다음 문제를 처리합니다.

  • Get-StorageGroupCopyStatus는 데이터베이스가

  • Get-StorageGroupCopyStatus는 데이터베이스가 FailedMessage 값은 저장소 그룹 복사본이 원본에서 많이 달라졌음을 나타냅니다.

  • Get-StorageGroupCopyStatus는 데이터베이스가 FailedMessage 값은 실패의 원인에 대한 특정 정보를 제공합니다.

  • 경고, 성능 카운터 또는 Get-StorageGroupCopyStatus는 복사 큐 또는 재생 큐가 저장소 그룹 복사본에 대해 백업되었음을 나타냅니다.

  • Get-StorageGroupCopyStatusLastInspectedLogTime에 대해 정확하지 않은 시간을 보고합니다.

  • 장애 조치(failover) 또는 Move-ClusteredMailboxServer가 계속되지만 데이터베이스가 탑재되지 않습니다.

  • 장애 조치가 계속되지만 일부 데이터베이스가 자동 또는 수동으로 탑재되지 않습니다. 또는 Get-ClusteredMailboxServerStatus가 하나 이상의 실패한 데이터베이스를 보고합니다.

  • 데이터베이스가 CCR 환경에서 시작 시에 탑재되지 않습니다.

  • Microsoft Exchange Replication Service가 디렉터리를 찾을 수 없음을 경고하는 MSExchangeRepl 이벤트 2073이 기록됩니다.

  • Move-ClusteredMailboxServer는 복제 문제로 인해 예약된 중단을 시작하지 않습니다.

  • 하나 이상의 저장소 그룹에서 장애 조치가 수행된 후에 복제가 다시 동기화되지 않습니다.

  • 시드가 실패합니다.

여기에 나열된 실패 이외의 실패가 발생하면 양쪽 노드에 대한 이벤트 로그를 검토하여 실패의 원인을 확인하고 로그의 정보를 사용하여 수행해야 하는 복구 작업을 알아 보십시오. 실패 발생 시점을 확인하면 다른 이벤트 로그를 통해 문제를 보다 잘 이해하는 데 도움을 얻을 수 있습니다. 이 정보가 부족할 경우 문제가 발생한 시간을 알면 cluster.log의 분석 범위와 검토 시간대를 좁힐 수 있습니다. 클러스터 로그는 클러스터 관리 시스템에서 수행된 작업에 대한 추적 수준 정보를 제공합니다.

시작하기 전에

이 절차를 수행하려면 사용하는 계정이 Exchange Server 관리자 역할 및 대상 서버에 대한 로컬 관리자 그룹 권한을 위임받아야 합니다. 사용 권한, 역할 위임 및 Microsoft Exchange Server 2007 관리에 필요한 권한에 대한 자세한 내용은 사용 권한 고려 사항을 참조하십시오.

절차

Get-StorageGroupCopyStatus는 데이터베이스가 “실패” 상태이며 시드되지 않았음을 보고합니다.

  • 가능한 원인 구성에 문제가 있거나 복제 복사본에 유효한 기준 데이터베이스가 없습니다. 이 문제는 수동 노드를 추가할 때 저장소 그룹 복사본을 시드하지 않으면 발생할 수 있습니다.

  • 해결 방안

    • 복사본에 대한 저장소가 제대로 구성되어 있고 작동 가능한지 확인하십시오. 오류가 발생하면 저장소 그룹을 일시 중단했다가 다시 시작하여 복사본의 새 검사를 트리거할 수 있습니다.

    • 저장소 그룹 및 데이터베이스 경로가 수동 서버의 저장소를 기준으로 올바르게 구성되어 있는지 확인하십시오. Exchange 관리 콘솔에서 Get-StorageGroup cmdlet를 사용하여 이 작업을 수행할 수 있습니다.

    • Update-StorageGroupCopy cmdlet를 사용하여 저장소 그룹 복사본을 시드합니다.

Get-StorageGroupCopyStatus는 데이터베이스가 “실패” 상태임을 보고하고 FailedMessage 값은 저장소 그룹 복사본이 원본에서 많이 달라졌음을 나타냅니다.

  • 가능한 원인   장애 조치(failover)가 수행되었으며 전체 다시 시드 없이는 이전 활성 서버의 데이터베이스가 현재 활성 데이터베이스와 다시 동기화될 수 없을 만큼 많은 양의 로그가 손실되었을 때 발생합니다. LCR에서는 이 상황이 발생하지 않습니다.

  • 해결 방법 Update-StorageGroupCopy cmdlet를 사용하여 저장소 그룹 복사본을 시드합니다.

Get-StorageGroupCopyStatus는 데이터베이스가 “실패” 상태임을 보고하고 FailedMessage 값은 실패의 원인에 대한 특정 정보를 제공합니다.

  • 가능한 원인 여러 가능한 원인으로 인해 저장소 그룹 복사본이 실패 상태로 확인될 수 있습니다. 시드되지 않고 원본에 비해 많이 달라진 이전 사례가 두 가지 예가 될 수 있습니다. FailedMessage 값은 감지된 문제를 구체적으로 식별합니다.

  • 해결 방법 Get-StorageGroupCopyStatus cmdlet를 실행하여 감지된 특정 문제를 식별하는 완전한 FailedMessage 값을 가져옵니다. FailedMessage 값이 제공하는 정보를 분석하고 보고된 상태를 확인합니다. 로그 손상 또는 누락이 보고되면 정확한 생성 번호를 포함하는 손상되지 않은 로그를 찾아 보십시오. 정확한 로그를 찾을 수 없으면 Update-StorageGroupCopy cmdlet를 사용하여 다시 시드합니다. 메시지에 원본의 로그를 사용할 수 없다고 표시되면 원본의 로그 디렉터리에서 공유를 제거한 후 해당 노드에서 복제 서비스를 다시 시작합니다.

경고, 성능 카운터 또는 Get-StorageGroupCopyStatus는 복사 큐 또는 재생 큐가 저장소 그룹 복사본에 대해 백업되었음을 나타냅니다.

  • 가능한 원인 로그 복사 또는 재생의 백로그는 복구 프로세스에 문제가 있거나 전환 상태임을 나타낼 수 있습니다. 전환 상태는 이전 오프라인 수동 노드가 온라인 상태가 되거나, 저장소 그룹 복사본이 오랫 동안 일시 중단되었다가 최근에 다시 시작되었을 때 발생합니다. 수동 노드에서 Microsoft Exchange Replication Service를 중지하면 해당 노드에 있는 모든 저장소 그룹 복사본을 일시 중단하는 것과 비슷한 효과를 가져옵니다. 전환 상태가 아니라면 다음 중 한 가지로 인해 발생할 수 있습니다.

    • 구성 문제

    • 일시 중단된 저장소 복사본

    • 재생 서비스가 중지됨

    • 저장소에 문제가 있거나 오프라인 상태임

    • 수동 노드가 오프라인 상태임

  • 해결 방법 실제로 문제가 있는지 또는 전환 상태인지 확인합니다.

    • 양쪽 노드에서 Microsoft Exchange Replication Service가 실행 중인지 확인합니다. 이는 서비스 스냅인을 사용하여 확인할 수 있습니다. 어느 한 노드에서 서비스가 중지된 경우 시작해야 합니다.

    • fl(서식 있는 목록) 옵션을 지정하여 Exchange 관리 셸 cmdlet Get-StorageGroupCopyStatus를 실행하고 수동 복사가 일시 중단되었는지 여부를 확인합니다. 수동 복사가 일시 중단된 경우 수동 복사본의 파일이 제대로 존재하는지 확인한 후 Resume-StorageGroupCopy cmdlet를 사용하여 저장소 그룹 복사본을 다시 시작합니다.

    • fl 옵션을 지정하여 Get-StorageGroupCopyStatus cmdlet를 실행한 후 복사본이 "정상" 상태인지 확인합니다. 복사본 상태가 "실패"이면 상태 필드 목록을 검토하여 필요한 수정 작업이 있는지 확인합니다.

    • 몇 분 동안 복제 성능 카운터를 조사하여 진행 상태를 확인합니다. 특히 재생 생성 번호와 검사 생성 번호를 확인합니다. 복사 큐 길이가 증가하고 있지만 재생 큐 길이는 짧거나 감소하면 활성 서버의 네트워크 파일 공유나 활성 서버 자체에 문제가 있을 수 있습니다. "net share" 명령, Windows 탐색기 또는 컴퓨터 관리 스냅인을 사용하여 활성 저장소 그룹 복사본의 로그 디렉터리에 네트워크 파일 공유가 정의되어 있는지 확인하십시오. Exchange 관리 셸에서 fl 옵션과 함께 Get-StorageGroup cmdlet를 사용하여 저장소 그룹의 GUID를 확인할 수 있습니다.

Get-StorageGroupCopyStatus는 LastInspectedLogTime에 대해 오래된 시간을 보고합니다.

  • 가능한 원인 이러한 증상의 가능한 원인으로는 다음의 세 가지가 있습니다.

    • 활성 저장소 그룹 복사본의 데이터베이스가 분리되어 있습니다.

    • 활성 저장소 그룹 복사본이 탑재되었지만 달라진 부분이 별로 없습니다. 따라서 활성 저장소 그룹 복사본에 의해 로그가 생성되지 않습니다.

    • Microsoft Exchange Replication Service가 수동 노드에서 실행되고 있지 않습니다.

  • 해결 방법 다음을 수행하여 이러한 세 가지 원인 중에서 실제로 발생한 원인을 확인하십시오.

    • Exchange 관리 콘솔을 사용하거나 Exchange 관리 셸에서 Get-StorageGroupStatus cmdlet를 실행하여 데이터베이스가 분리되어 있는지 확인합니다. 데이터베이스가 분리된 경우 LastInspectedLogTime이 변경되기 전에 데이터베이스를 탑재하고 데이터베이스(데이터베이스 내 작업)를 변경합니다.

    • Microsoft Exchange Replication Service가 수동 노드에서 실행되고 있는지 확인합니다. 이 서비스가 중지된 경우 시작해야 합니다.

    • 데이터베이스가 탑재되었는지 확인한 후에 데이터베이스가 로그를 생성 중인지 여부를 확인합니다. 활성 데이터베이스의 로그 디렉터리를 검사하고 생성 번호가 가장 높은 로그 파일을 식별합니다. 해당 로그의 타임 스탬프를 확인합니다. 이 타임 스탬프는 LastInspectedLogTime의 값과 일치해야 합니다.

장애 조치 또는 Move-ClusteredMailboxServer가 계속되지만 데이터베이스가 탑재되지 않습니다.

  • 가능한 원인 이 문제의 일반적인 원인은 클러스터 서비스 계정에 데이터베이스 탑재에 필요한 권한이 없는 경우입니다. 또는 최근에 실행된 장애 조치로 인해 자동 탑재 구성 설정에서 허용하는 것보다 더 많은 로그가 손실된 경우입니다. 장애 조치 경우 중에 가능한 다른 일반적인 원인으로는 실패 발생 시 수동 복사본이 정상 상태가 아닌 경우입니다.

  • 해결 방법 클러스터 서비스 계정의 사용 권한 문제는 일반적으로 설치 중에 발생합니다. 설치가 끝난 후에 데이터베이스가 탑재되지 않은 경우 일반적으로 클러스터 서비스 계정에 적절한 권한이 부여되지 않은 것입니다. 이 문제를 해결하려면 클러스터 서비스 계정에 적절한 권한을 부여한 후 전체 클러스터를 종료하고 다시 시작하십시오. 이렇게 하려면 (1) 클러스터된 사서함 서버를 오프라인 상태로 만들고, (2) 수동 노드를 종료하고, (3) 활성 노드를 종료하고, (4) 활성 노드를 시작하고, (5) 수동 노드를 시작한 후 (6) 클러스터된 사서함 서버를 온라인 상태로 만들면 됩니다.

    • 이벤트 로그를 검토하여 장애 조치로 인해 자동 탑재 구성 설정에서 허용하는 것보다 더 많은 로그가 손실되었는지 여부를 확인하십시오. 저장소 그룹 복사본 데이터베이스의 상태를 확인한 후에는 Exchange 관리 셸에서 Restore-StorageGroupCopy cmdlet를 실행하여 데이터베이스를 명시적으로 탑재할 수 있습니다. 마지막으로 Get-StorageGroupCopy cmdlet를 실행하고 SummaryCopyStatus 값을 확인하여 이전 활성 복사본에 데이터베이스 탑재를 방해하는 문제가 있는지 알아봅니다. 다른 문제가 있으면 이벤트 로그를 검토하여 문제의 원인을 식별한 후 문제 해결을 위한 조치를 취하십시오.

장애 조치가 계속되지만 일부 데이터베이스가 자동 또는 수동으로 탑재되지 않습니다. 또는 Get-ClusteredMailboxServerStatus가 하나 이상의 실패한 데이터베이스를 보고합니다.

  • 가능한 원인 최근에 실행된 장애 조치로 인해 자동 탑재 구성 설정에서 허용하는 것보다 더 많은 로그가 손실되었습니다. 장애 조치 경우 중에 가능한 다른 일반적인 원인으로는 실패 발생 시 수동 복사본이 정상 상태가 아닌 경우입니다.

    참고

    예약된 중단 또는 갑작스러운 중단 중에 데이터베이스가 실패 또는 오프라인 상태로 표시될 수 있습니다. 이 상태는 전환 상태를 나타내며 복제 서비스가 사용 가능한 로그의 최종 복사본을 만들려고 할 때 발생합니다.

  • 해결 방법 이벤트 로그를 검토하여 데이터베이스 탑재 실패 이유를 확인하십시오. 데이터베이스는 로그 또는 데이터베이스 파일의 손상 때문에 탑재되지 못할 수 있습니다. 이벤트가 이러한 경우를 나타내면 활성 서버를 다른 노드로 이동하여 데이터베이스에 대한 액세스를 복원하십시오. 이벤트 로그를 검토하여 데이터베이스에 오류가 있는지 확인할 수 있습니다. 저장소 그룹 복사본 데이터베이스의 상태를 확인한 후에는 Exchange 관리 셸에서 Restore-StorageGroupCopy cmdlet를 실행하여 데이터베이스를 명시적으로 탑재할 수 있습니다. 다음에는 Get-StorageGroupCopyStatus cmdlet를 실행하고 SummaryCopyStatus 값을 확인하여 이전 활성 복사본에 데이터베이스 탑재를 방해하는 문제가 있는지 알아봅니다. 상태에 저장소 그룹 복사본이 너무 오래되어 활성화할 수 없다고 표시되면 실패한 노드가 작동 가능 상태가 되고 더 많은 로그를 사용할 수 있게 될 때 데이터베이스를 복원할 수 있습니다. 로그는 자동으로 복사되며 사용자가 수행해야 할 작업은 없습니다.

데이터베이스가 CCR 환경에서 시작 시에 탑재되지 않습니다.

  • 가능한 원인 데이터베이스의 탑재 실패는 명시적인 관리자 작업의 결과일 수 있습니다. 데이터베이스가 명시적으로 분리된 후 클러스터된 사서함 서버가 오프라인 상태가 되면 다음 시작 시에 데이터베이스가 온라인 상태가 되지 않습니다. 또 다른 원인으로는 장애 조치 동안 허용 가능한 로그 수보다 많은 로그를 손실한 경우를 들 수 있습니다.

  • 해결 방법 Exchange 관리 셸에서 Get-ClusteredMailboxServerStatus cmdlet를 실행하여 노드에서 저장소가 작동 가능한지 확인할 수 있습니다. Exchange 관리 콘솔 또는 Exchange 관리 셸을 사용하여 영향 받는 데이터베이스 복사본의 탑재를 시도하십시오. 데이터베이스 복사본 탑재에 대한 자세한 내용은 클러스터 연속 복제 환경에 데이터베이스를 탑재하는 방법을 참조하십시오. 탑재 후에 이벤트 로그를 검토하여 보고된 오류가 있는지 확인하십시오.

Microsoft Exchange Replication Service가 지정된 디렉터리를 찾을 수 없음을 경고하는 MSExchangeRepl 2073 클러스터 이벤트가 기록됩니다.

  • 가능한 원인   이 오류 이벤트는 Microsoft Exchange Replication Service에서 이벤트가 지정한 디렉터리를 만들 수 없음을 나타냅니다. Microsoft Exchange Replication Service는 필요한 여러 디렉터리가 없을 경우 만들기를 시도합니다. 여기에는 원본 로그 파일, 대상 로그 파일 및 대상 시스템 파일의 디렉터리 경로와 로그 파일 검사자의 경로가 포함됩니다.

    사용 권한 문제, 하드웨어 오류, 구성 오류 등으로 인해 Microsoft Exchange Replication Service가 지정된 디렉터리를 만들지 못할 수 있습니다.

  • 해결 방법   이벤트에서 반환하는 오류 코드를 확인합니다. 해당 디렉터리 위치를 사용 및 액세스할 수 있는지 확인합니다. 파일 시스템 사용 권한을 확인합니다. 저장소가 제대로 구성되어 있으며 하드웨어가 제대로 작동하는지 확인합니다.

Move-ClusteredMailboxServer는 복제 문제로 인해 예약된 중단을 시작하지 않습니다.

  • 가능한 원인 모든 저장소 그룹 복사본에서 복제 상태가 완전히 정상이 아닐 때 Exchange 관리 셸 Move-ClusteredMailboxServer cmdlet를 실행하면 수동 노드에서 예약된 중단이 일어나지 않도록 하기 위해 유효성 검사가 진행됩니다. 이 작업은 예약된 중단이 너무 오래 지속되지 않도록 합니다.

  • 해결 방법 문제가 있는 특정 저장소 그룹을 식별하고 문제를 수정하십시오. Move-ClusteredMailboxServer cmdlet에서 발생한 오류 메시지를 통해 문제가 있는 저장소 그룹 복사본을 알 수 있습니다. 이동을 수행하고 유효성 검사를 무시하려면 실패한 저장소 그룹 복사본의 데이터베이스만 분리되는지 확인하십시오. 이동 작업을 다시 시도하고 -IgnoreDismounted 매개 변수를 사용하십시오. IgnoreDismounted 매개 변수는 분리된 저장소 그룹이 복제 상태 검사를 위해 무시되어야 함을 표시합니다.

하나 이상의 저장소 그룹에서 장애 조치가 수행된 후에 복제가 다시 동기화되지 않습니다.

  • 가능한 원인   Get-StorageGroupCopyStatus cmdlet에서 반환된 오류 메시지는 데이터베이스가 원본에서 많이 달라졌음을 나타냅니다. 이 상황은 이전 활성 서버에 장애 조치 전에 복제된 충분한 로그가 없을 때 장애 조치 중에 발생합니다.

  • 해결 방법 Exchange 관리 셸의 Update-StorageGroupCopy cmdlet를 사용하여 데이터베이스를 다시 시드하십시오.

시드가 실패합니다.

  • 가능한 원인 활성 서버에서 백업이 진행 중이거나 통신에 문제가 있습니다.

  • 해결 방법 영향 받는 저장소 그룹 복사본이나 데이터베이스의 백업이 진행되고 있지 않은지 확인하십시오. 활성 노드가 온라인 상태인지 확인하십시오.

자세한 내용

이 항목에서 설명하는 Exchange 관리 셸 cmdlet에 대한 자세한 내용은 다음 항목을 참조하십시오.

로컬 연속 복제 문제 해결에 대한 자세한 내용은 로컬 연속 복제 문제를 해결하는 방법을 참조하십시오.