연속 복제 모니터링

 

적용 대상: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

마지막으로 수정된 항목: 2007-08-22

Microsoft Exchange Server 2007 SP1(서비스 팩 1)에서는 연속 복제 환경을 모니터링하기 위한 새로운 기능과 향상된 기능이 소개됩니다. 이러한 기능은 Microsoft Exchange Server 2007의 RTM(Release To Manufacturing) 버전에 있는 클러스터 보고 기능을 향상시키고 연속 복제 환경의 사전 모니터링을 위한 추가 기능을 제공합니다. 특히 Exchange 2007 SP1에서는 Get-StorageGroupCopyStatus cmdlet가 향상되었고 Test-ReplicationHealth라는 새로운 cmdlet가 제공되며 전송 쓰레기 수거통의 손실 창을 더 잘 볼 수 있습니다. 이러한 cmdlet를 사용하여 연속 복제의 상태를 모니터링하는 것 외에도 Microsoft Exchange Replication Service에서 게시하는 여러 성능 카운터를 사용할 수 있습니다.

SP1에서 향상된 Get-StorageGroupCopyStatus Cmdlet

Exchange 2007 RTM에는 다음과 같이 Get-StorageGroupCopyStatus 및 연속 복제 성능 카운터가 보고하는 상태가 정확하지 않거나 잘못 이해되는 여러 상황이 있습니다.

  • 변경되지 않는 저장소 그룹 같은 활성 상태가 아닌 저장소 그룹은 정상 상태가 아닌 경우에도 정상인 것으로 보고될 수 있습니다. 이러한 상황은 로그를 재생하기 전까지는 비정상 상태가 탐지되지 않기 때문에 발생합니다.

  • 복제 초기화 중에는 복제 상태가 평가되므로 정확하지 않을 수 있습니다. 초기화가 완료되면 상태가 업데이트됩니다.

  • 저장소 그룹의 데이터베이스를 분리할 때 LastLogGenerated 필드의 값이 잘못될 수 있습니다.

  • 로그 스트림 도중에 하나 이상의 로그 파일이 누락된 경우 수동 복사본이 계속해서 복구를 시도하면서 복제 상태가 실패와 정상 간에 전환되는 상황이 발생합니다. 이러한 상황이 발생하면 재생 큐와 복사 큐의 크기가 계속 증가합니다.

  • 드물지만 로그를 확인한 경우에도 재생할 수 없는 경우가 있습니다. 이러한 경우 시스템에서 복구를 시도하면서 실패와 정상 상태가 번갈아 일어납니다. 이러한 상황이 발생하면 재생 큐와 복사 큐의 크기가 계속 증가합니다.

Exchange 2007 RTM에서는 Microsoft Exchange Replication Service와 Exchange 관리 작업 간 통신에 클러스터 데이터베이스와 레지스트리가 사용되며 이는 비동기 프로세스입니다. 이 프로세스가 비동기식이기 때문에 앞에 설명한 불안정한 상태가 발생할 수 있습니다.

Exchange 2007 SP1에서는 Microsoft Exchange Replication Service와 Exchange 관리 작업 간 통신에 사용되는 기본 메커니즘을 다시 디자인하여 이러한 문제를 해결했습니다. 이제 관리 작업은 클러스터 서비스나 레지스트리를 사용하는 대신 RPC(원격 프로시저 호출)를 사용하여 Microsoft Exchange Replication Service와 직접 통신합니다.

또한 새 상태 정보 추가로 Get-StorageGroupCopyStatus cmdlet가 향상되었습니다.

  • Get-StorageGroupCopyStatus cmdlet는 대상 컴퓨터의 Microsoft Exchange Replication Service에 네트워크를 통해 액세스할 수 없는 경우 ServiceDown의 SummaryCopyStatus를 보고합니다.

  • Get-StorageGroupCopyStatus cmdlet는 대상 컴퓨터의 Microsoft Exchange Replication Service가 초기 시작 검사를 완료하지 않은 경우 Initializing의 SummaryCopyStatus를 보고합니다. 또한 이 상태를 부울로 나타내기 위해 새 성능 카운터를 만들었습니다.

  • Get-StorageGroupCopyStatus cmdlet는 증분 다시 시드가 완료되지 않은 경우 Synchronizing의 SummaryCopyStatus를 보고합니다.

Exchange 관리 도구의 Exchange 2007 SP1 버전을 사용할 경우에만 SummaryCopyStatus 값의 새 상태를 볼 수 있습니다. Exchange 관리 도구의 Exchange 2007 RTM 버전을 사용할 경우 모든 이전 상태에 대한 상태는 실패로 보고됩니다.

Test-ReplicationHealth Cmdlet

Exchange 2007 SP1에는 Test-ReplicationHealth라는 새 cmdlet가 도입되었습니다. 이 cmdlet는 연속 복제의 사전 모니터링과 연속 복제 파이프라인을 위한 것입니다. Test-ReplicationHealth cmdlet는 사서함 서버에서 로컬로 실행되어 LCR(로컬 연속 복제), CCR(클러스터 연속 복제) 및 SCR(대기 연속 복제) 환경에서 복제 상태를 검사합니다. 또한 Test-ReplicationHealth cmdlet는 MOM(Microsoft Operations Manager) 관리 팩과 긴밀하게 통합되어 사서함 서버에 대한 연속 복제 상태를 설명하는 간단하고 정확한 정보를 제공합니다. 이러한 검사는 중요한 순서대로 수행되므로 더 중요한 테스트가 먼저 검사됩니다. 이러한 검사 중 하나가 실패할 경우 덜 중요한 테스트도 실패하거나 관련이 없다고 가정합니다.

Test-ReplicationHealth cmdlet는 복제, 클러스터 서비스 및 저장소 그룹 복제와 재생 상태의 모든 측면을 확인하여 복제 시스템에 대한 전체 개요를 제공합니다. 특히 클러스터의 노드에서 실행될 경우 Test-ReplicationHealth cmdlet는 다음 표에 설명한 테스트를 수행합니다.

Test-ReplicationHealth cmdlet가 수행하는 테스트

Test 설명

수동 노드 상태(PassiveNodeUp)

CCR 환경에서 사용될 경우 수동 노드의 상태가 위로인지 확인합니다.

클러스터 네트워크 상태(ClusterNetwork)

로컬 노드에 있는 모든 클러스터 관리 네트워크가 운영 중인지 확인합니다.

쿼럼 그룹 상태(QuorumGroup)

쿼럼 리소스를 포함하는 클러스터 그룹이 정상인지 확인합니다.

파일 공유 쿼럼 상태(FileShareQuorum)

파일 공유 감시가 있는 주 노드 집합 쿼럼이 사용하는 FileSharePath의 값에 도달할 수 있는지 확인합니다.

클러스터된 사서함 서버 그룹 상태(CmsGroup)

그룹의 모든 자원이 온라인 상태인지 확인하여 클러스터된 사서함 서버가 정상인지 확인합니다.

노드 상태(NodePaused)

클러스터의 노드가 일시 중지된 상태가 아닌지 확인합니다.

DNS 등록 상태(DnsRegistrationStatus)

성공적인 DNS 등록 필요가 설정된 모든 클러스터 관리 네트워크 인터페이스가 DNS(Domain Name System) 등록을 통과했는지 확인합니다.

Replication Service 상태(ReplayService)

로컬 노드의 Microsoft Exchange Replication Service가 정상인지 확인합니다.

장애 조치(failover) 후 탑재된 데이터베이스(DBMountedFailover)

장애 조치(failover)가 발생한 후에 분리 또는 실패한 데이터베이스가 있는지 검사합니다. 이 테스트는 장애 조치(failover)로 인해 실패한 데이터베이스만 확인합니다.

일시 중단된 저장소 그룹 복사본(SGCopySuspended)

클러스터된 사서함 서버에서 저장소 그룹에 대해 연속 복제가 일시 중단되었는지 검사합니다.

실패한 저장소 그룹 복사본(SGCopyFailed)

실패 상태인 저장소 그룹 복사본이 있는지 검사합니다.

초기화 중인 저장소 그룹(SGInitializing)

초기화 중 상태인 저장소 그룹이 있는지 검사합니다.

저장소 그룹 복사본 큐 길이(SGCopyQueueLength)

최상의 임계값보다 큰 복제 복사본 큐 길이를 가진 저장소 그룹이 있는지 검사합니다. 현재 이러한 임계값은 다음과 같습니다.

  • 경고   큐 길이가 3–5개의 로그 파일입니다.

  • 실패   큐 길이가 6개 이상의 로그 파일입니다.

저장소 그룹 재생 큐 길이(SGReplayQueueLength)

최상의 임계값보다 큰 복제 재생 큐 길이를 가진 저장소 그룹이 있는지 검사합니다. 현재 이러한 임계값은 다음과 같습니다.

  • 경고   큐 길이가 30-59개의 로그 파일입니다.

  • 실패   큐 길이가 60개 이상의 로그 파일입니다.

Test-ReplicationHealth용 모니터링 컨텍스트

Test-ReplicationHealth cmdlet에는 작업 결과에 모니터링 이벤트 및 성능 카운터를 포함하는 데 사용할 수 있는 MonitoringContext라는 매개 변수가 포함되어 있습니다. MOM용 관리 팩에서 이 매개 변수를 사용합니다. 이 매개 변수에 사용할 수 있는 두 가지 값은 $true 또는 $false입니다. $true를 지정하는 경우 결과에 모니터링 이벤트 및 성능 카운터와 함께 서비스에 대한 정보가 포함됩니다.

모니터링 컨텍스트가 지정된 경우 활성 노드에서는 다음 검사만 확인됩니다.

  • PassiveNodeUp

  • ClusterNetwork

  • QuorumGroup

  • FileShareQuorum

  • CmsGroup

  • NodePaused

  • DnsRegistrationStatus

  • ReplayService

  • DBMountedFailover

모니터링 컨텍스트가 지정된 경우 수동 노드에서는 다음 검사만 확인됩니다.

  • ClusterNetwork

  • DnsRegistrationStatus

  • ReplayService

  • SGCopySuspended

  • SGCopyFailed

  • SGInitializing

  • SGCopyQueueLength

  • SGReplayQueueLength

Microsoft Exchange Replication Service가 게시하는 성능 카운터

Microsoft Exchange Replication Service는 LCR 및 CCR 모두에서 복제 상태를 모니터링하는 데 사용할 수 있는 성능 카운터를 제공합니다. 성능 관련 문제를 모니터링하고 해결하려면 나중에 이 항목에서 설명하는 카운터를 수집하여 평가하는 것이 좋습니다.

권장되는 Microsoft Exchange Replication Service 성능 카운터

Microsoft Exchange Replication Service는 각 저장소 그룹 복사본에 대해 다음 표에 있는 카운터의 인스턴스를 만듭니다. 따라서 각 저장소 그룹의 상태와 성능을 독립적으로 모니터링할 수 있습니다. MSExchange Replication 성능 개체에서 ReplayQueueLengthCopyQueueLength 카운터를 모니터링하여 각 저장소 그룹의 상태를 모니터링할 수 있습니다.

참고

앞에서 설명한 대로 Get-StorageGroupCopyStatus cmdlet도 이러한 카운터의 값을 표시합니다.

카운터 이름 카운터 설명

복사 큐가 탑재 임계값을 초과함(CCR에만 해당)

복사 큐 길이가 Auto Database Mount Dial에서 지정한 임계값보다 큰지 여부를 나타냅니다. CCR 환경에서 Auto Database Mount Dial 임계값을 초과할 경우 이 카운터의 값은 1입니다. LCR 환경에서 이 값은 항상 0입니다.

CopyGenerationNumber

복사된 마지막 로그 파일의 생성 시퀀스 번호를 나타냅니다.

CopyNotificationGenerationNumber

Microsoft Exchange Replication Service에 알려진 마지막 로그 파일의 생성 시퀀스 번호를 나타냅니다.

CopyQueueLength

복사 및 검사를 위해 대기 중인 로그 파일 수를 나타냅니다.

Failed

값이 1이면 선택한 인스턴스(저장소 그룹)에 대해 연속 복제가 실패 상태라는 것을 나타냅니다. 값이 0이면 연속 복제가 실패 상태가 아니라는 것을 나타냅니다.

초기화 중

값이 1이면 선택한 인스턴스(저장소 그룹)에 대해 연속 복제가 초기화 중 상태라는 것을 나타냅니다. 이 상태는 저장소 그룹 복사본이 초기 시작 검사를 수행 중이거나 Microsoft Exchange Replication Service가 증분 다시 시드를 수행 중이라는 것을 나타냅니다. 값이 0이면 연속 복제가 초기화 중 상태가 아니라는 것을 나타냅니다.

InspectorGenerationNumber

검사된 마지막 로그 파일의 생성 시퀀스 번호를 나타냅니다.

ReplayBatchSize

함께 재생된 로그 파일 수를 나타냅니다.

ReplayGenerationNumber

재생된 마지막 로그 파일의 생성 시퀀스 번호를 나타냅니다.

ReplayGenerationsComplete

현재 배치에서 재생되는 로그 파일 수를 나타냅니다.

ReplayGenerationsPerMinute

현재 배치에 대한 분당 로그 생성의 재생률을 나타냅니다.

ReplayGenerationsRemaining

현재 배치에서 재생될 나머지 로그 생성 수를 나타냅니다.

ReplayNotificationGenerationNumber

Microsoft Exchange Replication Service에 알려진 마지막 로그 파일의 생성 시퀀스 번호를 나타냅니다.

ReplayQueueLength

재생을 위해 대기 중인 로그 파일 수를 나타냅니다.

Suspended

값이 1이면 연속 복제 작업이 일시 중단되었다는 것을 나타냅니다. 일시 중단되면 로그 파일이 수동 복사본으로 복사 또는 재생되지 않습니다.

TruncatedGenerationNumber

Microsoft Exchange Replication Service가 삭제한 마지막 로그 파일의 생성 시퀀스 번호를 나타냅니다.

위 표에 나열된 카운터 외에도 **시드 완료 %**라는 추가 카운터가 MSExchange Replica Seeder 성능 개체에서 게시됩니다. 이 카운터는 시드의 완료율을 나타냅니다. 카운터 값은 0-100%이며 시드 중인 저장소 그룹에 대해서만 게시됩니다.