크롤링 규칙 관리(Office SharePoint Server)

업데이트 날짜: 2009년 8월

적용 대상: Office SharePoint Server 2007

 

마지막으로 수정된 항목: 2009-08-10

크롤링 규칙을 추가하면 콘텐츠를 크롤링할 때 특정 경로를 포함하거나 제외할 수 있습니다. 특정 경로를 포함하는 경우에는 해당 경로를 크롤링할 대체 계정 자격 증명을 입력할 수 있습니다. 새 크롤링 규칙을 추가할 뿐 아니라 기존 크롤링 규칙을 테스트, 편집 또는 삭제하거나 순서를 변경할 수도 있습니다.

크롤링 규칙은 나열된 순서대로 적용됩니다.

크롤링 규칙을 관리하려면 먼저 크롤링 규칙 관리 페이지를 열어야 합니다.

  1. SSP(공유 서비스 공급자) 관리 페이지를 엽니다.

    SSP 관리 페이지를 열려면 다음을 수행합니다.

    1. 위쪽 탐색 모음에서 응용 프로그램 관리를 클릭합니다.

    2. 응용 프로그램 관리 페이지의 Office SharePoint Server 공유 서비스 섹션에서 이 팜의 공유 서비스 만들기 또는 구성을 클릭합니다.

    3. 이 팜의 공유 서비스 관리 페이지에서 관리 페이지를 열 SSP를 클릭합니다.

  2. 공유 서비스 관리 홈 페이지의 검색 섹션에서 검색 설정을 클릭합니다.

  3. 검색 설정 구성 페이지의 크롤링 설정 섹션에서 크롤링 규칙을 클릭합니다.

수행할 작업

  • 크롤링 규칙 추가

  • URL에 대해 크롤링 규칙 테스트

  • 크롤링 규칙 편집

  • 크롤링 규칙 삭제

  • 크롤링 규칙 순서 변경

크롤링 규칙 추가

  1. 크롤링 규칙 관리 페이지에서 새 크롤링 규칙을 클릭합니다.

  2. 크롤링 규칙 추가 페이지의 경로 섹션에 있는 경로 상자에 규칙을 적용할 경로를 입력합니다. 경로를 지정할 때 표준 와일드카드 문자를 사용할 수 있습니다. 예를 들면 다음과 같습니다.

    • **http://server1/folder***라고 입력하면 URL이 http://server1/folder로 시작되는 모든 웹 리소스가 포함됩니다.

    • *://*.txt라고 입력하면 확장명이 txt인 모든 문서가 포함됩니다.

  3. 크롤링 구성 섹션에서 다음 중 하나를 선택합니다.

    • 이 경로의 모든 항목 제외. 지정한 경로의 모든 항목을 크롤링에서 제외하려면 이 옵션을 선택합니다.

    • 이 경로의 모든 항목 포함. 지정한 경로의 모든 항목을 크롤링하려면 이 옵션을 선택합니다. 이 옵션을 선택하는 경우 다음 옵션을 함께 선택하여 포함할 항목을 보다 자세히 지정할 수 있습니다.

    • URL은 크롤링하지 않고 URL의 링크 포함. URL 자체는 크롤링하지 않고 해당 URL에 포함된 링크를 크롤링하려면 이 옵션을 선택합니다.

    • 복합 URL(물음표(?)가 포함된 URL) 크롤링. 물음표(?) 표기를 사용하는 매개 변수가 포함된 URL을 크롤링하려면 이 옵션을 선택합니다.

    • SharePoint 콘텐츠를 HTTP 페이지로 크롤링. 일반적으로 SharePoint 콘텐츠는 특수한 프로토콜을 사용하여 크롤링됩니다. SharePoint 콘텐츠를 HTTP 페이지로 크롤링하려면 이 옵션을 선택합니다. HTTP 프로토콜을 사용하여 콘텐츠를 크롤링하는 경우에는 항목 사용 권한이 저장되지 않습니다.

  4. 인증 지정 섹션에서 다음 중 하나를 수행합니다.

    • 기본 콘텐츠 액세스 계정을 사용하려면 기본 콘텐츠 액세스 계정(NT AUTHORITY\LOCAL SERVICE) 사용을 선택합니다.

    • 다른 계정을 사용하려면 다른 콘텐츠 액세스 계정 지정을 선택하고 다음을 실행합니다.

    1. 계정 상자에 크롤링 규칙에서 정의한 경로에 액세스할 수 있는 계정 이름(예: 사용자_이름도메인\사용자_이름 등)을 입력합니다.

    2. 암호암호 확인 상자에 계정의 암호를 입력합니다.

    3. 기본 인증을 사용하지 못하도록 하려면 기본 인증 허용 안 함 확인란을 선택합니다. 서버에서는 Windows NTLM 인증 사용을 시도하며, 기본 인증 허용 안 함 확인란을 선택하지 않은 경우 서버에서는 NTLM 인증에 실패하면 기본 인증 사용을 시도합니다.

    • 인증에 클라이언트 인증서를 사용하려면 클라이언트 인증서 지정을 선택한 다음 인증서 메뉴에서 인증서를 클릭합니다.
  5. 확인을 클릭합니다.

URL에 대해 크롤링 규칙 테스트

URL에 대해 크롤링 규칙을 테스트하여 해당 URL이 크롤링될 때 적용되는 규칙과 이러한 규칙이 적용된 결과 콘텐츠가 포함되거나 제외되는지 여부 등을 확인할 수 있습니다. URL에 대해 크롤링 규칙을 테스트할 때 해당 URL이 실제로 크롤링되지는 않습니다.

  1. 크롤링 규칙 관리 페이지의 URL을 입력하고 [테스트]를 클릭하여 규칙에 맞는지 확인하십시오. 상자에 테스트할 URL을 입력합니다.

  2. 테스트를 클릭합니다.

  3. 테스트 결과가 URL을 입력하고 [테스트]를 클릭하여 규칙에 맞는지 확인하십시오. 상자 아래에 표시됩니다.

크롤링 규칙 편집

크롤링 규칙을 편집하면 다음 번에 전체 크롤링이 시작된 후에 변경 내용이 적용됩니다.

  • 크롤링 규칙 관리 페이지의 크롤링 규칙 목록으로 이동하여 편집할 크롤링 규칙의 메뉴에서 편집을 클릭합니다.

    크롤링 규칙 설정에 대한 자세한 내용은 크롤링 규칙 추가 섹션을 참조하십시오.

크롤링 규칙 삭제

크롤링 규칙을 삭제하면 다음 번에 전체 크롤링이 시작된 후에 규칙이 실제로 삭제됩니다.

  1. 크롤링 규칙 관리 페이지의 크롤링 규칙 목록으로 이동하여 삭제할 크롤링 규칙의 메뉴에서 삭제를 클릭합니다.

  2. 크롤링 규칙을 삭제할지 묻는 메시지 상자에서 확인을 클릭합니다.

크롤링 규칙 순서 변경

  • 크롤링 규칙 관리 페이지의 크롤링 규칙 목록으로 이동하여 순서 열의 드롭다운 목록에서 규칙이 차지할 위치를 지정하는 값을 선택합니다. 선택한 값에 따라 다른 값이 바뀝니다.

    크롤링 규칙은 나열된 순서대로 적용되므로 동일 콘텐츠 또는 중복 콘텐츠에 두 가지 규칙이 연관되는 경우 먼저 나오는 규칙이 적용됩니다.

    표시된 순서에 관계없이 적용되는 전역 제외 규칙을 사용할 수도 있습니다. 크롤링 규칙을 관리하는 방법에 대한 자세한 내용은 Book Excerpt - Chapter 16 Enterprise search and indexing architecture and administration에서 크롤링 규칙 관리 섹션을 참조하십시오.