콘텐츠를 크롤링하는 방법(Search Server 2008)

업데이트 날짜: 2009년 4월

적용 대상: Microsoft Search Server 2008

 

마지막으로 수정된 항목: 2009-04-13

참고

별도의 공지가 없는 한 이 문서의 정보는 Microsoft Search Server 2008과 Microsoft Search Server 2008 Express에 모두 적용됩니다.

최종 사용자가 Microsoft Search Server 2008의 엔터프라이즈 검색 기능을 사용하여 콘텐츠를 검색하기 전에 최종 사용자가 쿼리할 수 있도록 만들 콘텐츠를 크롤링해야 합니다. 이 문서에서 콘텐츠란 웹 페이지, Microsoft Office Word 문서, SharePoint 사이트 등 크롤링 가능한 모든 항목입니다.

이 문서에서는 콘텐츠 크롤링을 시작하는 데 필요한 기본 프로세스에 대해 설명하고 기타 정보 및 절차를 제공하는 문서에 대한 링크를 제공합니다.

  1. 콘텐츠 원본 만들기 콘텐츠 원본은 크롤링할 콘텐츠가 포함된 저장소 유형, 크롤링을 시작할 시작 주소, 크롤링할 때 사용할 동작 및 크롤링 일정을 정의합니다. 콘텐츠 원본을 만드는 방법에 대한 자세한 내용은 콘텐츠 원본 정보(Search Server 2008)SharePoint 사이트, 웹 사이트, 파일 공유 또는 Microsoft Exchange Server 공용 폴더를 크롤링할 콘텐츠 원본 추가(Search Server 2008)를 참조하십시오.

  2. 모든 URL 또는 특정 범위의 URL을 크롤링할 때 사용할 자격 증명 지정 기본적으로 기본 콘텐츠 액세스 계정은 Windows 도메인 사용자 자격 증명을 사용하여 콘텐츠 원본에서 정의한 콘텐츠 리포지토리를 크롤링합니다. 크롤링 규칙을 사용하여 클라이언트 인증서, 폼 자격 증명, 쿠키 등의 다른 콘텐츠 액세스 계정을 지정할 수 있습니다. 기본 콘텐츠 액세스 계정을 설정하는 방법에 대한 자세한 내용은 기본 콘텐츠 액세스 계정 변경(Search Server 2008)을 참조하십시오. 크롤링 규칙을 사용하는 방법에 대한 자세한 내용은 크롤링 규칙을 사용하여 크롤링할 콘텐츠 결정(Search Server 2008)을 참조하십시오.

  3. 검색을 위한 프록시 서버 설정 구성 네트워크 외부에서 호스팅되는 콘텐츠를 크롤링할 경우 호스트 서버에 도달하는 데 사용되는 프록시 서버를 설정해야 할 수 있습니다. 이 경우 프록시 서버의 설정을 확인하고 Search Server 2008에서 구성해야 합니다. 이렇게 하려면 검색 관리 페이지의 크롤링에서 프록시 및 제한 시간을 클릭합니다. 대개 이 옵션은 한 번만 설정하면 됩니다.

  4. 전체 크롤링 시작 먼저 특정 콘텐츠 원본에서 정의된 적은 양의 콘텐츠를 크롤링하여 설치 구성을 테스트할 수 있습니다. 적은 양의 콘텐츠가 작동하는지 확인한 후 조건을 확장하여 인덱스를 구축합니다. 전체 크롤링을 시작하는 방법에 대한 자세한 내용은 전체 크롤링 시작(Search Server 2008)을 참조하십시오.

  5. 크롤링 로그 보기 크롤링하는 동안 크롤링 로그를 확인하여 진행 상황을 확인하는 것이 좋습니다. 이렇게 하면 크롤링이 성공적으로 수행되었는지 확인하거나 문제를 발견할 수 있습니다. 일반적인 문제는 인증이 실패하거나 호스트에 도달할 수 없는 것입니다. 로그 파일에서 문제를 발견하면 크롤링을 중지하고 콘텐츠 원본 관리, 크롤링 규칙 관리 및 팜 수준 검색 설정 관리 페이지에서 설정을 조정한 다음 크롤링을 다시 시도할 수 있습니다. 연결된 위치에서 문제가 발생할 경우 연결된 위치 복구(Search Server 2008)를 참조하십시오.

참고 항목

개념

콘텐츠 크롤링 계획(Search Server 2008)
Search Server 2008 작업