콘텐츠 크롤링(Office SharePoint Server 2007)

업데이트 날짜: 2008년 9월

적용 대상: Office SharePoint Server 2007

 

마지막으로 수정된 항목: 2009-04-13

서버 팜이 배포되면 조직에서 검색 쿼리에 사용할 수 있도록 크롤링 계획을 세운 콘텐츠가 크롤링 및 인덱싱됩니다. 이 문서에서 콘텐츠란 웹 페이지, Microsoft Office Word 문서, SharePoint 사이트 등 크롤링 가능한 모든 항목입니다. 그러나 초기 배포에서만 콘텐츠가 크롤링되는 것은 아니며, 다음과 같은 이유로 인해 크롤링을 지속적으로 수행해야 합니다.

  • 배포 단계에서 만든 콘텐츠 원본을 계속 크롤링하여 새 콘텐츠를 검색 및 인덱싱하고 원본 서버에서 삭제된 콘텐츠에 대한 항목을 인덱스에서 제거해야 합니다.

  • 새 콘텐츠 원본을 크롤링할 필요성을 주기적으로 평가해야 합니다. 예를 들어 서버 팜의 최종 사용자가 파일 공유, 인터넷이나 인트라넷의 웹 사이트 또는 조직의 다른 SharePoint 제품 및 기술 서버 팜에 있는 콘텐츠를 검색하도록 허용해야 할 수 있습니다.

이 목표는 다음과 같은 하위 목표 및 작업으로 구성됩니다.

  • 콘텐츠 크롤링 준비(Office SharePoint Server 2007). 크롤링해야 하는 콘텐츠가 식별되었으면 해당 콘텐츠를 크롤링하는 데 필요한 준비 작업을 수행해야 합니다. 여기에는 크롤링할 콘텐츠를 지정하는 하나 이상의 콘텐츠 원본을 만들고, 해당 콘텐츠에 액세스하고 콘텐츠를 구문 분석하는 데 필요한 IFilter 및 프로토콜 처리기가 인덱스 서버에 설치되어 있는지 확인하고, 크롤링이 대상 서버에 주는 영향을 고려하는 등의 몇 가지 작업이 포함됩니다.

일반적으로 새 콘텐츠 원본 및 기존 콘텐츠 원본에 대해 다음 작업을 최소한 한 번 수행하고 이후에 지속적으로 몇 차례 수행합니다.

참고 항목

개념

콘텐츠 크롤링 계획(Office SharePoint Server)