단일 복사본 클러스터 복구 동작

 

적용 대상: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

마지막으로 수정된 항목: 2007-10-26

SCC(단일 복사본 클러스터)는 데이터에 대한 액세스를 제공하는 서비스를 위한 중복성을 제공합니다. 서비스 중복성을 통해 호스트 노드에 오류가 있을 경우에 데이터 손실 없이도 빠른 복구가 가능합니다. SCC는 장애 조치 서비스의 일부로 데이터베이스가 포함된 저장소를 새 노드에 전달하므로 서비스가 데이터 손실 없이 복원됩니다.

하지만 SCC에서 저장소 하위 시스템은 단일 오류 지점에 해당합니다. 저장소 하위 시스템의 전체 오류로 인해 일반적으로 24시간 중단과 12시간의 평균 데이터 손실이 발생합니다. 이는 매일 전체 백업을 한다고 가정할 경우입니다. 또한 SCC 솔루션의 저장소 구성은 또 다른 유형의 Exchange 클러스터 솔루션인 CCR(클러스터 연속 복제)에서 필요한 것보다 설치 및 작동 면에서 일반적으로 더 복잡합니다. CCR에 대한 자세한 내용은 클러스터 연속 복제를 참조하십시오.

SCC 복구 동작은 다음 두 가지 중단 유형으로 구분할 수 있습니다.

  • 예약된 중단   예약된 중단은 관리자에 의해 시작됩니다. 예약된 중단은 시스템 모니터링 시 검색되는 오류를 복구하거나 하드웨어 유지 관리나 소프트웨어 또는 소프트웨어 업데이트 설치와 같은 일부 관리 작업을 수행하는 데 사용될 수 있습니다.

  • 예약되지 않은 중단   예약되지 않은 중단은 검색된 오류에 대한 복구 작업으로 시스템에서 시작됩니다. 이러한 중단이 검색되면 Windows 클러스터 서비스에 의해 복구가 트리거됩니다.

다음 표에서는 다양한 오류에 대한 예상되는 복구 작업을 설명합니다. 일부 오류의 경우 관리자가 복구를 시작해야 하는 반면, Windows 클러스터 서비스에서 자동으로 처리되는 오류도 있습니다.

공유 디스크가 전환되었다고 가정할 경우, 서로 다르게 트리거됨에도 불구하고 예약된 중단과 예약되지 않은 중단에 따라 수동 노드가 활성화되고 데이터베이스가 탑재됩니다. 공유 디스크가 구성 오류로 인해 올바르게 전환되지 않는 경우에도 동일한 동작이 수행됩니다. 영향을 받은 데이터베이스가 탑재되지 않습니다.

참고

지정된 시간에는 단 하나의 클러스터된 사서함 서버만 수동 노드에서 활성화할 수 있습니다. 노드가 이미 활성 클러스터된 사서함 서버를 호스팅하고 있으면 다른 서버를 온라인으로 만들 수 없습니다.

참고

이전 버전의 Exchange에서와 달리, Microsoft Exchange Server 2007은 데이터베이스 오류 결과로 인한 SCC 예약되지 않은 자동 중단(장애 조치)을 트리거하지 않습니다.

오류에 대한 복구 작업

오류 설명 작업 설명

운영 체제 중지 오류, 운영 체제의 응답 중지, 노드의 전체 전원 오류, 프로세서 칩, 마더보드, 백플레인의 복구할 수 없는 오류 또는 노드의 전체 통신 오류

가능한 경우 수동 노드로 자동 장애 조치. 저장소가 온라인 상태가 되면 데이터베이스가 탑재됩니다.

오류 후 쿼럼을 설정할 수 있어야 수동 노드를 사용할 수 있습니다. 이는 나머지 노드가 쿼럼에 액세스할 수 있어야 한다는 의미입니다.

활성 노드의 전체 저장소 오류

저장소 오류는 모니터링 시스템을 통해 보고됩니다. 관리자가 저장소를 복구할 수 있거나 백업을 사용하여 복구해야 합니다.

가능한 경우 수동 노드로 자동 장애 조치됩니다. 저장소가 온라인 상태가 되면 데이터베이스가 탑재됩니다.

오류 후 쿼럼을 설정할 수 있어야 수동 노드를 사용할 수 있습니다. 이는 나머지 노드가 쿼럼에 액세스할 수 있어야 한다는 의미입니다.

전체 저장소 오류

저장소 오류는 모니터링 시스템을 통해 보고됩니다. 관리자가 저장소를 복구할 수 있거나 백업을 사용하여 복구해야 합니다.

쿼럼 및 데이터베이스에 액세스할 수 없으므로 이 오류는 클러스터(및 모든 해당 리소스)의 오류로 보고됩니다.

데이터 센터 오류

타사 복제 솔루션이 없으면 자동 장애 조치가 지원되지 않습니다.

사용 중인 데이터에서 복제하는 경우에는 복제를 동기화해야 합니다.

운영 체제 드라이브 오류

자동 복구 작업이 없습니다. 운영 체제가 실패하지 않는 한, Exchange에서 검색되지 않습니다. 주 원인이 아니라 명백한 오류를 기반으로 검색됩니다.

운영 체제 드라이브 오류는 운영 체제 모니터링 서비스에서 보고되며 이 오류로 인해 운영 체제에 오류가 발생할 수 있습니다.

운영 체제 드라이브 공간 부족

가능한 경우 자동으로 수동 노드로 장애 조치합니다. 저장소가 온라인 상태가 되면 데이터베이스가 탑재됩니다.

이 오류는 모니터링 서비스를 통해 보고됩니다. 자동 장애 조치가 발생하지 않거나 발생할 수 없는 경우 관리자가 이 시나리오에 대한 복구 작업을 결정합니다.

활성 노드에 있는 클러스터의 공용 네트워크 오류

전체 정전 시나리오에서와 같은 복구 작업.

활성 노드와 수동 노드 간 통신에 사용되는 하드웨어와 소프트웨어 외에는 공용 네트워크 상태가 검색되지 않습니다. Exchange 2007에서는 실제 클라이언트 연결에 대해 확인하지 않습니다.

클러스터 공용 네트워크의 전체 오류

자동 복구 작업이 없습니다.

공용 네트워크의 연결이 끊어지면 경우 IP 주소 리소스가 오류 상태가 됩니다. 공용 네트워크 문제를 해결한 후에는 해당 리소스를 다시 온라인 상태로 만들 수 있습니다.

클러스터 쿼럼 손실

클러스터된 사서함 서버 및 클러스터 쿼럼이 오프라인 상태입니다.

쿼럼을 만들 수 없으면 이 시나리오에 사용할 수 있는 서비스가 없습니다.

정보 저장소 오류

정보 저장소 리소스의 자동 다시 시작.

오류가 반복되면 관리자가 클러스터된 사서함 서버를 수동 노드로 수동으로 이동하여 서버를 온라인 상태로 만들어 볼 수 있습니다.

응용 프로그램(이진 파일) 드라이브 오류

자동 복구 작업이 없습니다.

일반적으로 이 시나리오로 인해 모니터링 서비스를 통해 보고되고 관리자가 작업할 수 있는 다른 오류가 발생합니다. 관리자가 이 시나리오의 복구 작업을 결정합니다.

응용 프로그램(이진 파일) 드라이브 공간 부족

자동 복구 작업이 없습니다.

모니터링 서비스에서 이 상태를 보고합니다. 관리자가 이 시나리오의 복구 작업을 결정합니다.

데이터베이스나 저장소 그룹의 전체 손실 또는 데이터베이스 전체 오류

영향을 받은 데이터베이스 다시 탑재를 자동으로 시도합니다. 이 시도가 실패하면 데이터베이스가 오류 상태로 남게 되지만 클러스터된 사서함 서버가 장애 조치되지 않습니다.

저장소 그룹이나 데이터베이스가 소프트웨어 오류나 손상으로 인해 분리되거나 하드웨어 오류 때문에 실패했습니다. 예를 들어, 저장소 그룹의 로그 디렉터리를 사용할 수 없을 때 저장소 그룹에서 모든 데이터베이스를 즉시 분리합니다. 관리자가 해결 조치를 결정합니다. 복구는 수동 노드를 활성화하기 위해 예약된 중단일 수 있습니다.

저장소 그룹 또는 데이터베이스의 부분 오류, 일부 데이터 사용할 수 없음 또는 초기 데이터베이스 탑재 오류

자동 복구 작업이 없습니다.

부분 오류는 일부 손상이 보고되었지만 이로 인해 저장소 그룹이나 데이터베이스가 즉시 분리되지 않았음을 의미합니다. 시작 시 데이터베이스가 탑재되지 않으면 어떠한 작업도 수행되지 않고 모니터링 서비스에서 오류를 보고합니다. 오류가 검색되면 모니터링 서비스에서 이벤트를 생성하고, 이 오류는 모니터링 서비스에서 보고할 수 있습니다. 또한 모니터링에서 분리된 데이터베이스를 검색하고 보고합니다.

저장소 그룹에 대해 검색된 손상된 로그

자동 복구 작업이 없습니다.

모니터링 서비스에서 이 상태를 보고합니다.

데이터베이스 또는 트랜잭션 로그 드라이브 공간 부족

자동 복구 작업이 없습니다. 저장소 그룹의 데이터베이스가 분리됩니다.

사용 가능한 드라이브 공간 부족 상태가 모니터링 시스템을 통해 보고됩니다. 관리자가 해결 조치를 결정합니다.