크롤러 영향 규칙 관리(Office SharePoint Server 중앙 관리 도움말)

적용 대상: Office SharePoint Server 2007

 

마지막으로 수정된 항목: 2015-03-09

크롤러 영향 규칙은 Windows SharePoint Services 도움말 검색 서비스에서 크롤링 중에 웹 사이트의 문서를 요청하는 횟수를 정의합니다. 이 횟수는 동시에 요청되는 문서 수나 요청 사이의 지연 시간으로 정의할 수 있습니다. 크롤러 영향 규칙이 없을 경우 요청되는 문서 수는 하드웨어 리소스에 따라 5-16 사이가 됩니다.

크롤러 영향 규칙을 사용하면 크롤링할 때 사이트에 가해지는 부하를 조정할 수 있습니다.

사이트 이름 식은 순서대로 평가됩니다. 첫 번째 일치하는 규칙이 적용되기 때문에 대개 가장 구체적인 이름에서 가장 일반적인 이름순으로 크롤러 영향 규칙을 나열하는 것이 좋습니다. 예를 들어 * 규칙은 항상 목록의 마지막 규칙이어야 합니다. 이 규칙이 마지막에 있지 않으면 이후의 모든 규칙이 적용되지 않습니다. 크롤링이 진행되는 동안 새 규칙을 만들 경우에는 이 규칙을 저장하는 즉시 적용되므로 크롤링이 끝날 때까지 기다릴 필요가 없습니다. 그러나 이미 크롤링된 콘텐츠에는 새 규칙이 적용되지 않습니다.

크롤러 영향 규칙을 추가, 편집, 삭제하거나 규칙 순서를 변경하려면 먼저 크롤러 영향 규칙 페이지를 열어야 합니다.

  1. 위쪽 탐색 모음에서 응용 프로그램 관리를 클릭합니다.

  2. 응용 프로그램 관리 페이지의 검색 섹션에서 검색 서비스 관리를 클릭합니다.

  3. 검색 서비스 관리 페이지의 팜 수준 검색 설정 섹션에서 크롤러 영향 규칙을 클릭합니다.

수행할 작업

  • 크롤러 영향 규칙 추가

  • 크롤러 영향 규칙 편집

  • 크롤러 영향 규칙 삭제

  • 크롤러 영향 규칙 순서 변경

크롤러 영향 규칙 추가

  1. 크롤러 영향 규칙 페이지에서 규칙 추가를 클릭합니다.

  2. 크롤러 영향 규칙 추가 페이지의 사이트 섹션에 있는 사이트 상자에 사이트 URL을 프로토콜을 제외하고 입력합니다. 예를 들어 http://는 제외합니다. 다음 표에서는 규칙을 추가할 때 사이트 이름에 사용할 수 있는 와일드카드 문자를 보여 줍니다.

    사용할 문자 수행할 작업

    사이트 이름 대신 * 사용

    모든 사이트에 규칙을 적용합니다.

    사이트 이름 대신 *.* 사용

    이름에 점이 포함된 사이트에 규칙을 적용합니다.

    *.사이트_이름.com 사이트 이름

    사이트_이름.com 도메인(예: *.*adventure-works.com*)의 모든 사이트에 규칙을 적용합니다.

    *.최상위_도메인_이름(예: *.com 또는 *.net) 사이트 이름

    지정한 최상위 도메인 이름(예: .com 또는 .net)으로 끝나는 모든 사이트에 규칙을 적용합니다.

    ?

    규칙에서 하나의 문자를 대체합니다. 예를 들어 *.*adventure-works*?.com은 adventure-works1.com, adventure-works2.com과 같은 도메인의 모든 사이트에 적용됩니다.

    주소가 .com으로 끝나는 모든 인터넷 사이트에 적용되는 *.com 크롤러 영향 규칙을 만들 수 있습니다. 예를 들어 포털 관리자가 samples.microsoft.com 콘텐츠 원본을 추가한 경우 특별히 samples.microsoft.com에 대해 크롤러 영향 규칙을 추가하지 않는 한 *.com 규칙이 이 사이트에 적용됩니다.

  3. 요청 빈도 섹션에서 다음 옵션 중 하나를 선택합니다.

    • 한 번에 지정된 문서 수까지 요청하고 요청 사이에 대기 안 함. Windows SharePoint Services 도움말 검색 서비스가 한 번에 사이트에 요청할 수 있는 최대 문서 수를 지정할 수 있습니다. 동시 요청 수 메뉴에서 실행할 동시 요청 수를 클릭합니다.

    • 한 번에 문서 하나를 요청하고 요청 사이에 지정된 시간 동안 대기. 요청 사이의 지연 시간을 지정할 수 있습니다. 검색 서비스가 한 번에 한 사이트에 문서 하나를 요청하고 다음 요청까지 지정된 시간 동안 대기합니다. 대기 시간(초) 상자에 요청 사이에 대기할 시간을 입력합니다. 요청 사이에 대기하는 최소 시간은 1초이며 최대 시간은 999초입니다.

    요청 횟수가 너무 높으면 요청으로 인해 일부 웹 사이트가 오버로드될 수 있습니다.

  4. 확인을 클릭합니다.

크롤러 영향 규칙 편집

  • 크롤러 영향 규칙 페이지의 규칙 목록으로 이동하여 편집할 규칙에 대한 메뉴에서 편집을 클릭합니다.

    편집할 수 있는 설정은 크롤러 영향 규칙 추가 섹션에 설명되어 있습니다.

크롤러 영향 규칙 삭제

  • 크롤러 영향 규칙 페이지의 규칙 목록으로 이동하여 삭제할 규칙에 대한 메뉴에서 삭제를 클릭합니다.

크롤러 영향 규칙 순서 변경

  • 크롤러 영향 규칙 페이지의 규칙 목록으로 이동하여 순서 열의 드롭다운 목록에서 규칙이 차지할 위치를 지정하는 값을 선택합니다.

    현재 해당 위치를 차지하는 규칙 및 그 아래에 있는 모든 규칙이 한 단계 아래로 내려갑니다.