구성 요소 수준 내결함성 조치

 

마지막으로 수정된 항목: 2005-05-20

이 섹션에는 Exchange 2003 조직의 내결함성 향상을 위한 구성 요소 수준의 고려 사항과 전략이 있습니다. 특히 구성 요소 수준이란 조직 인프라에 있는 개별 서버 하드웨어, 저장소 하드웨어 및 네트워킹 하드웨어를 말합니다. 효과적인 하드웨어 전략을 구현하면 시스템의 전체 가용성이 향상됩니다. 이러한 전략은 일반적인 방법 채택에서 비싼 내결함성 장비 사용에 이르기까지 광범위합니다.

Exchange 2003 조직의 하드웨어에는 서버 하드웨어와 네트워크 하드웨어가 있습니다. 하드웨어 전략을 채택할 때는 다음 사항을 고려하십시오.

  • 하드웨어가 중복되어야 합니다.
  • 서버급 하드웨어를 구현해야 합니다.
  • 표준화된 하드웨어를 선택해야 합니다.
  • 여분의 하드웨어가 있어야 합니다.

다음 섹션에서는 이러한 각 고려 사항에 대해 자세히 설명합니다. 대개 하드웨어를 제대로 선택하여 배포하면 SLA 요구 사항을 충족시킬 수 있습니다.

내결함성이 있는 하드웨어 전략과 가용성 수준이 높은 시스템 디자인에 대한 자세한 내용은 Microsoft Solutions Framework 웹 사이트를 참조하십시오.

중복 하드웨어

동일한 작업을 수행하는 데 한 개 이상의 하드웨어 구성 요소를 사용하는 것을 하드웨어 중복성이라고 합니다. Exchange 2003 조직의 단일 지점에서 발생하는 오류를 최소화하려면 중복 서버, 네트워크 및 저장소 하드웨어를 사용해야 합니다. 중복 하드웨어 구성을 통합하면 하나의 데이터 입/출력(I/O) 경로나 서버의 실제 하드웨어 구성 요소에 오류가 발생해도 서버 작동에 영향을 미치지 않습니다.

단일 지점에서 발생하는 오류를 최소화하기 위해 사용하는 하드웨어는 중복될 구성 요소에 따라 달라집니다. 여러 하드웨어 공급업체에서 서버나 저장소 솔루션 하드웨어에 중복성을 부여하는 제품을 제공합니다. 이 중에는 Exchange 2003과 함께 사용할 수 있는 고급 백업 및 복원 하드웨어를 비롯하여 전체 저장소 솔루션을 제공하는 공급업체도 있습니다.

서버급 하드웨어

서버급 하드웨어란 워크스테이션용 하드웨어보다 뛰어난 안정성을 제공하는 하드웨어입니다. Exchange 2003 서버, 저장소 하위 시스템 및 네트워크용 하드웨어를 선택할 때는 서버급 구성 요소를 선택해야 합니다.

참고

일반적으로 서버급 하드웨어가 포함된 서버는 특수한 하드웨어 또는 소프트웨어 모니터링 기능도 갖추고 있습니다. 그러나 구입한 하드웨어에 모니터링 기능이 없으면 디자인 및 배포 계획에 모니터링 솔루션을 포함하십시오. 조직의 내결함성 유지에서 모니터링이 갖는 중요성에 대한 자세한 내용은 시스템 수준 내결함성 조치의 "모니터링 전략 구현"을 참조하십시오.

서버급 서버 하드웨어

서버급 서버 하드웨어는 다음과 같습니다.

  • 예비 전원 공급 장치 주 전원 공급 장치에 오류가 발생하면 예비 서버 및 디스크 배열 UPS(무정전 전원 공급 장치)와 배터리 백업이 보조 전원을 공급합니다. UPS와 배터리 백업을 사용하면 전원이 불안정하거나 정전이 발생할 때 서버와 서버에 포함된 데이터를 보호할 수 있습니다.

  • 예비 팬 냉각 팬이 작동하지 않는 경우 예비 팬이 서버 내부를 충분히 냉각할 수 있습니다. 중복 팬이 없는 서버에서 팬에 오류가 발생하면 서버가 자동으로 종료됩니다.

    참고

    서버 내부 온도가 정해진 수치를 초과하면 예비 팬이 있어도 하드웨어가 제대로 작동하지 못할 수 있습니다. 온도 및 기타 안전 고려 사항에 대한 자세한 내용은 시스템 수준 내결함성 조치의 "서버의 실제 환경 보호"를 참조하십시오.

  • 예비 메모리 메모리 뱅크에 오류가 발생할 경우 예비 메모리가 있으면 계속 메모리를 사용할 수 있습니다. 예를 들어 실제 메모리를 복사하면(메모리 미러링) 메모리 복제를 통해 내결함성이 생깁니다. 메모리 미러링 기술을 사용하면 컴퓨터 한 대에 두 개의 RAM 집합을 포함하여 RAM 하나를 다른 RAM의 미러로 사용하거나 RAM, CPU, 어댑터 및 버스 상태를 포함하는 전체 시스템 상태를 미러링합니다. 메모리 미러링은 OEM과 함께 개발하여 구현해야 합니다.

  • ECC 메모리 이중 비트 오류가 발생하면 ECC(오류 수정 코드) 메모리가 단일 비트 오류를 찾아 수정하고 메모리를 오프라인 상태로 만듭니다.

  • 예비 네트워크 인터페이스 카드 NIC(네트워크 인터페이스 카드)나 네트워크 연결에 오류가 발생할 경우 예비 NIC가 있으면 서버의 네트워크 연결이 유지됩니다.

  • 전원이 켜진 상태의 모니터링 구성 요소 처음에 서버 전원이 켜져 있으면 서버에서 비정상적인 온도 조건이나 팬 고장과 같은 시작 오류 조건을 감지합니다.

  • 오류 전 모니터링 구성 요소 서버가 실행되는 동안 오류 전 조건을 모니터링합니다. 전원 공급 장치, 하드 디스크 또는 메모리와 같은 구성 요소에 오류가 발생하려고 하면 실제로 오류가 발생하기 전에 관리자에게 알립니다.
    예를 들어 ECC 메모리에서 발견한 오류가 ECC 메모리에 의해 수정되거나 중복 메모리로 라우팅되어 서버 오류를 방지합니다. 메모리 문제 해결을 위해 즉시 관리자에게 알립니다.

  • 전원 오류 하드웨어 모니터링 구성 요소 전원 오류가 발생하면 시스템 종료 소프트웨어에서는 필요할 경우 UPS와 함께 작동하여 시스템을 종료합니다.

서버급 저장소 하드웨어

  • 중복 저장소 하위 시스템은 단일 디스크 드라이브나 컨트롤러 오류에 대해 시스템을 보호합니다. 다음과 같은 중복 구성 요소 구현을 고려해야 합니다.
    • 외부 배열에 연결하기 위한 백 엔드 서버의 중복 하드웨어
    • 디스크 배열에 대한 중복 경로
    • 중복 저장소 컨트롤러
  • 또한 RAID를 사용하여 LUN(Logical Unit Number)의 중복성을 구현하십시오. 백 엔드 저장소 솔루션의 내결함성 구현에 대한 자세한 내용은 시스템 수준 내결함성 조치의 "안정적인 백 엔드 저장소 솔루션 구현"을 참조하십시오.

서버급 네트워크 하드웨어

서버급 네트워크 하드웨어는 다음과 같습니다.

  • 예비 허브, 스위치, 네트워크 어댑터 및 배선 네트워크에서 이 예비 하드웨어를 구현하는 방법에 대한 자세한 내용은 이러한 구성 요소를 제공하는 공급업체에 문의하십시오.
  • 예비 라우터 라우터 오류는 자주 발생하지 않지만 오류가 발생할 경우 전체 서버 구성이 종료될 수 있으므로 중복 라우팅 기능이 있어야 합니다. 라우터 오류 방지 방법에 대한 자세한 내용은 라우터 공급업체에 문의하십시오.

참고

최상의 가용성을 유지해야 하는 서버에는 고정 인터넷 프로토콜(IP) 주소를 사용하고 DHCP(Dynamic Host Configuration Protocol)는 사용하지 마십시오. 그러면 DHCP 서버 오류로 인한 중단을 방지하고 DHCP가 제공하는 동적 주소 할당을 처리하지 않는 DNS 서버를 통해 주소 확인을 향상시킬 수 있습니다.

표준화된 하드웨어

하드웨어가 Windows 운영 체제와 완전히 호환되게 하려면 Windows Server Catalog에 있는 하드웨어를 선택하십시오.

Windows 서버 카탈로그에서 하드웨어를 선택할 때는 하드웨어용 표준을 채택하여 최대한 표준화하십시오. 특히 특정 컴퓨터 종류를 선택하고 구입한 각 컴퓨터에 같은 네트워크 카드, 디스크 컨트롤러, 그래픽 카드 등 같은 구성 요소를 사용하십시오. 메모리 크기, CPU 개수 및 하드 디스크 구성과 같은 매개 변수만 수정해야 합니다.

하드웨어를 표준화하면 다음과 같은 이점이 있습니다.

  • 드라이버 업데이트나 응용 프로그램 소프트웨어 업데이트를 테스트할 때 모든 컴퓨터에 배포하기 전에 한 번만 테스트해도 됩니다.
  • 적절한 대체 하드웨어 집합을 유지 관리하는 데 필요한 여분의 부품이 적어집니다.
  • 지원 담당자가 제한된 하드웨어 구성 요소 집합에 쉽게 숙달될 수 있으므로 필요한 교육이 줄어듭니다.

여분의 구성 요소 및 대기 서버

하드웨어 예산을 계획할 때는 여분의 하드웨어 구성 요소, 여분의 서버 및 비상 대기 서버까지도 포함시키십시오. (여기서 비상이란 전원이 켜진 상태로 조직의 특정 서버 유형을 대신하기 위해 대기하는 서버를 말합니다. 이러한 여분의 하드웨어 구성 요소와 서버에 액세스할 수 있으면 손상된 하드웨어를 대체하고 하드웨어 오류를 복구할 수 있는 기능이 현저히 향상됩니다.

여분의 구성 요소

하드웨어 예산에 여분의 구성 요소를 포함하고 이러한 구성 요소를 언제든지 사용할 수 있도록 현장에 배치합니다. 표준화된 하드웨어를 사용하면 현장에 배치할 여분의 구성 요소 수를 줄일 수 있다는 이점이 있습니다. 예를 들어 모든 하드웨어 드라이버 유형과 제조업체가 동일하다면 여분의 드라이버를 여러 개 보관할 필요가 없습니다.

보유할 여분의 구성 요소 수는 조직이 감당할 수 있는 최대 가동 중지 시간과 관계가 있습니다. 또한 대체 구성 요소의 시장성과도 관계가 있습니다. 메모리, CPU 등 일부 구성 요소는 언제든지 쉽게 찾아 구입할 수 있지만 하드 드라이브와 같은 다른 구성 요소는 판매가 자주 중단되어 잠시동안 구매가 어려워지기도 합니다. 이러한 구성 요소의 경우 처음 하드웨어를 구입할 때 여유분을 구입해야 합니다. 또한 하드웨어 공급업체의 솔루션을 고려할 때 손상된 구성 요소나 전체 서버를 즉시 교체해 주는 서비스 회사나 공급업체를 이용해야 합니다.

대기 서버

데이터를 자동으로 복제하는 대기 서버 즉, 가능하면 전원이 켜진 상태로 대기하는 서버를 유지 관리할 수 있을지 고려해 보십시오. 가동 중지 시간 비용이 높고 클러스터링을 실행할 수 없을 경우 대기 서버를 사용하여 복구 시간을 줄일 수 있습니다. 또한 서버 가동 중지 시간으로 인한 매출 손실이 발생하거나 SLA 위반으로 인한 불이익을 감수하는 등 서버 오류 결과 많은 비용이 소모될 경우에도 대기 서버를 사용해야 합니다.

대기 서버는 오류가 발생한 서버를 신속하게 대신하거나 원래의 서버처럼 작동하는 경우도 있습니다. 또한 하드 드라이브와 관련되지 않은 오류가 서버에 발생할 경우 정상 작동하는 서버로 드라이브를 이동할 수 있습니다. 이때 백업 미디어의 데이터가 복원되기도 합니다.

참고

클러스터 환경에서는 이 데이터가 자동으로 전송됩니다.

대기 서버를 사용하여 중단을 복구하면 오류가 발생한 서버를 면밀히 진단할 수 있다는 이점이 있습니다. 같은 오류가 반복되지 않게 하려면 오류 원인을 진단하는 것이 중요합니다.

프로덕션 서버와 마찬가지로 대기 서버는 인증을 받아야 하며 하루 24시간, 일주일에 7일 동안 실행되어야 합니다.