Office SharePoint Server의 검색에 대한 최상의 방법

업데이트 날짜: 2008년 8월

적용 대상: Office SharePoint Server 2007

 

마지막으로 수정된 항목: 2009-12-02

이 문서는 Microsoft Office SharePoint Server 2007에 대한 최상의 방법 문서 시리즈 중 하나입니다. 이 문서에서는 엔터프라이즈 검색에 대한 최상의 방법을 설명합니다. 다른 설명이 없는 한 이 문서는 Office SharePoint Server 2007과 Microsoft Search Server 2008에 모두 적용됩니다. 이 시리즈의 다른 문서를 보려면 최상의 방법을 참조하십시오. Office SharePoint Server 2007에 대한 최상의 방법과 관련된 추가 정보 및 리소스는 최상의 방법 리소스 센터(영문)(https://go.microsoft.com/fwlink/?linkid=125981&clcid=0x412)를 참조하십시오.

1. 배포 계획

  • 검색 가능성 계획 최종 사용자가 검색 기술을 유용하게 사용할 수 있으려면 최소한의 노력으로 원하는 내용을 찾을 수 있어야 합니다. Ben Curry와 Bill English가 쓴 Microsoft Office SharePoint Server 2007 Best Practices(영문)(Microsoft Press, Redmond, WA, 2008)의 "Chapter 15: Implementing an Optimal Search and Findability Topology"에서 검색 가능성에 대한 논의 내용을 참조하십시오.

  • 관리 속성 사용 검색 관리자는 이 기능을 사용하여 관련 속성의 일대다 매핑을 만들 수 있습니다. 이 프로세스를 통해 사용자가 고급 쿼리를 수행할 때 사용해야 하는 속성 이름의 수를 줄일 수 있습니다. 예를 들어 검색 관리자가 "author"라는 속성을 "writer" 및 "author2" 속성에 매핑하면 사용자가 쿼리에 "author" 속성을 포함할 경우 "writer" 및 "author2"에 대한 검색 결과도 얻을 수 있습니다. 관리 속성에 대한 자세한 내용은 최종 사용자 검색 환경 계획(Office SharePoint Server)최종 사용자 검색 환경 계획(Search Server 2008)을 참조하십시오.

  • 서비스 수준 계약 만들기 배포 전에 콘텐츠 크롤링에 대한 SLA(서비스 수준 계약)에 동의했는지 확인합니다.

2. 제대로 구성된 인프라에서 시작

3. Windows 보안 그룹을 사용하여 액세스 관리

다음과 같은 이유로 SharePoint 그룹에 사용자를 추가하는 대신 Windows 보안 그룹에 사용자를 추가하는 것이 좋습니다.

  • Windows 보안 그룹을 변경해도 SharePoint 사이트의 ACE(액세스 제어 항목)에 직접적으로 영향이 미치지 않으므로 이러한 Windows 보안 그룹에 있는 사용자 계정이 변경될 때 다시 크롤링할 필요가 없습니다.

  • 인덱싱 프로세스를 수행하는 동안 시스템은 SharePoint 그룹 자체의 ACE 대신 SharePoint 그룹에 추가된 각 사용자의 ACE를 저장합니다. 이 프로세스는 ACL(액세스 제어 목록)당 약 1000명의 사용자를 지원하며 이 프로세스 후 "매개 변수가 잘못되었습니다." 오류가 발생하면 크롤링이 실패합니다.

4. 검색 데이터베이스 조각 모음

검색 데이터베이스에는 크롤링된 콘텐츠의 메타데이터와 ACL이 포함됩니다. 크롤링을 몇 차례 수행하면 검색 데이터베이스가 조각날 수 있습니다. 크롤링 및 쿼리 성능을 향상시키려면 검색 데이터베이스의 조각 모음을 정기적으로 수행합니다. 자세한 내용은 Office SharePoint Server 2007의 데이터베이스 유지 관리(백서)를 참조하십시오.

중요

SQL Server를 실행하는 컴퓨터를 미러링하고 있는 경우에는 검색 데이터베이스의 조각 모음을 수행하기 전에 미러링을 해제하고 조각 모음이 완료된 후 다시 설정합니다.

5. 시스템을 항상 최신 상태로 유지

테스트 환경에서 업데이트를 테스트한 후에는 가능한 한 빨리 Office SharePoint Server 2007, Search Server 2008 및 SQL Server의 최신 소프트웨어 업데이트를 설치합니다. 소프트웨어 업데이트를 배포하는 방법에 대한 일반적인 지침은 Office SharePoint Server 2007의 소프트웨어 업데이트 배포를 참조하십시오.

6. SQL Server 대기 시간 모니터링

검색은 SQL Server의 I/O 사용량이 많으며 임시 데이터베이스 및 검색 데이터베이스의 I/O 대기 시간에 큰 영향을 받습니다. 검색과 콘텐츠 호스팅은 모두 임시 데이터베이스를 많이 사용합니다. 검색 데이터베이스, SSP 데이터베이스, 임시 데이터베이스, 콘텐츠 베이스 및 해당 로그 파일을 모두 별개의 스핀들에 보관하는 것이 좋습니다. 이렇게 하면 특정 요구 사항에 따라 각 파일을 최적화할 수 있습니다. 대규모 서버 팜의 경우 SQL Server를 실행하고 있는 개별 컴퓨터에 콘텐츠 데이터베이스를 분산하는 것도 좋은 방법입니다. 이렇게 하면 검색 데이터베이스와 SSP 데이터베이스에 콘텐츠 데이터베이스와는 다른 임시 데이터베이스 및 SQL Server 인스턴스가 제공됩니다. 최상의 검색 성능을 위해서는 다음과 같은 대기 시간을 유지 관리하는 것이 좋습니다.

  • 임시 데이터베이스의 경우 10밀리초(ms) 이하

  • 검색 데이터베이스의 경우 10ms 이하

  • 데이터베이스 로그 파일의 경우 20ms 이하

Microsoft 엔터프라이즈 검색 블로그의 블로그 게시물 SQL 모니터링 및 I/O(영문)(https://go.microsoft.com/fwlink/?linkid=123950&clcid=0x412)에 나와 있는 다른 권장 사항을 따릅니다. SQL Server 성능 문제를 해결하는 방법에 대한 자세한 내용은 SQL Server 기술 문서 SQL Server 2005의 성능 문제 해결(영문)(https://go.microsoft.com/fwlink/?linkid=123952&clcid=0x412)의 I/O 병목 현상 섹션을 참조하십시오.

7. 검색 기아 상태를 방지하기 위해 모니터링

크롤러가 크롤링 큐에서 다음 문서를 가져오는 다른 스레드를 할당할 수 없는 경우 검색 기아 상태가 발생합니다. 다음과 같은 이유로 기아 상태가 발생할 수 있습니다.

  • SQL Server를 실행하고 있는 컴퓨터에서 리소스(I/O) 경합이 발생하는 경우

  • 너무 많은 호스트가 동시에 크롤링되고 있는 경우

  • 스레드를 신속하게 넘기지 않는 리소스 과다 점유 호스트인 경우. 리소스 과다 점유 호스트에는 다음이 포함됩니다.

    • 느린 호스트 크롤링되고 있는 호스트의 용량이 부족하여 크롤러가 해당 호스트로 보내고 있는 모든 요청에 대한 서비스를 제공할 수 없는 경우

    • 증분 크롤링을 위해 추가 작업이 필요한 호스트 기본 HTTP 크롤링은 각 문서가 서버에 대한 왕복을 필요로 하지만 문서를 다운로드하기 전에 수정된 날짜를 확인하므로 부분적으로 이 범주에 속합니다.

    • 속성이 많은 호스트 및 콘텐츠 비즈니스 데이터 카탈로그, 사용자 가져오기 및 사용자 크롤링과 같은 콘텐츠 저장소 유형에서 자주 볼 수 있습니다.

  • 백업을 수행 중인데 크롤링이 일시 중지된 경우

자세한 내용은 Microsoft 엔터프라이즈 검색 블로그의 블로그 게시물 크롤링 일정 만들기 및 기아 상태 - 기아 상태를 감지하고 최소화하는 방법(영문)(https://go.microsoft.com/fwlink/?linkid=123794&clcid=0x412)을 참조하십시오.

8. 쿼리 병목 현상을 파악하기 위해 시스템 모니터링

9. 크롤링된 각 사이트에 대한 검색 표시 설정 확인

검색 엔진에 대한 사이트 및 페이지 최적화를 위한 표준 최상의 방법은 SharePoint 배포에서의 WCM(웹 콘텐츠 관리) 사이트와도 마찬가지로 관련이 있습니다. 검색 엔진에 대해 보다 효과적으로 최적화된 사이트나 페이지는 검색 결과에서 더 위쪽에 나타나므로 사이트로 유입되는 트래픽 증가에 도움이 됩니다. 자세한 내용은 검색 엔진에 대해 SharePoint Server 2007 웹 콘텐츠 관리 사이트를 최적화하는 방법(영문)(https://go.microsoft.com/fwlink/?linkid=123956&clcid=0x412)을 참조하십시오.

10. 쿼리 서버를 초기화하거나 팜을 백업하기 전에 크롤링을 수동으로 일시 중지

검색에 사용되는 SSP를 백업하거나 쿼리 서버를 초기화하기 전에 모든 크롤링을 일시 중지하는 것이 좋습니다. 백업이 완료된 후 일시 중지된 크롤링을 수동으로 다시 시작해야 합니다. 자세한 내용은 크롤링 일시 중지 및 다시 시작(Office SharePoint Server 2007)을 참조하십시오.

11. 구성이 변경된 후 하위 시스템 크롤링 및 쿼리 테스트

구성을 변경한 후에는 서버 팜의 크롤링 및 쿼리 기능을 테스트하는 것이 좋습니다. 이 작업을 쉽게 수행하려면 이 용도로만 사용되는 임시 콘텐츠 원본을 만듭니다. 테스트를 위해 10개 항목, 예를 들어 파일 공유에 있는 .txt 파일을 크롤링한 다음 해당 항목에 대해 검색 쿼리를 수행해 보는 것이 좋습니다. 이러한 항목이 현재 인덱스에 없는지 확인합니다. 쿼리할 때 검색 결과 페이지의 맨 위에 표시되는 고유한 단어가 포함되어 있으면 유용합니다. 테스트가 완료되면 이 테스트를 위해 만든 콘텐츠 원본을 삭제하는 것이 좋습니다. 이렇게 하면 크롤링한 항목이 인덱스에서 제거됩니다. 따라서 이 테스트를 수행할 때 다시 크롤링될 수 있고 테스트를 마친 다음 검색 결과에 나타나지 않습니다. 콘텐츠를 크롤링하는 방법에 대한 자세한 내용은 콘텐츠 크롤링(Office SharePoint Server 2007) 또는 콘텐츠를 크롤링하는 방법(Search Server 2008)을 참조하십시오.

12. 크롤링된 개체에 대한 바이러스 검사 정책 검토

Windows SharePoint Services 3.0, Office SharePoint Server 2007 또는 UNRESOLVED_TOKEN_VAL(2nd_Search)에서 특정 파일 수준 바이러스 백신 소프트웨어 프로그램을 사용하는 경우 검사 대상에서 특정 폴더를 제외해야 합니다. 이러한 폴더를 제외하지 않으면 많은 예기치 않은 문제가 발생할 수 있습니다. 자세한 내용은 Microsoft 기술 자료 문서 952167: Windows SharePoint Services 3.0 또는 SharePoint Server 2007에서 파일 수준 바이러스 백신 프로그램을 사용할 때 바이러스 검사에서 폴더를 제외해야 할 수 있음(https://go.microsoft.com/fwlink/?linkid=123963&clcid=0x412)을 참조하십시오.

13. 사용자 지정 쿼리를 사용하는 경우 비용이 많이 드는 SQL 쿼리를 실행하지 않도록 크롤링된 속성 UI에서 적절한 속성을 "scope-able"로 표시

도움 주신 분

Office SharePoint Server 2007 콘텐츠 게시 팀에서는 다음과 같이 이 문서 작성에 도움을 주신 분들께 감사를 드립니다.

  • Luca Bandinelli, Microsoft SharePoint Customer Advisory Team

  • Dan Blood, Microsoft Search Server

  • Sid Shah, Microsoft Search Server

  • Richard Riley, Microsoft SharePoint Marketing

  • Mitch Prince, Microsoft Consulting Services

  • Larry Kuhn, Microsoft Consulting Services

참고 항목

개념

검색 성능을 위한 최상의 방법(Office SharePoint Server 2007)