Share via


콘텐츠 원본 정보(Search Server 2008)

업데이트 날짜: 2009년 4월

적용 대상: Microsoft Search Server 2008

 

마지막으로 수정된 항목: 2015-03-09

참고

별도의 공지가 없는 한 이 문서의 정보는 Microsoft Search Server 2008과 Microsoft Search Server 2008 Express에 모두 적용됩니다.

콘텐츠는 웹 페이지, Microsoft Office Word 문서, 비즈니스 데이터 또는 전자 메일 메시지와 같이 크롤링할 수 있는 모든 항목입니다. 콘텐츠는 웹 사이트, 파일 공유 또는 SharePoint 사이트와 같은 콘텐츠 리포지토리에 있습니다. 콘텐츠 원본은 콘텐츠가 크롤링되는 방법과 일정을 정의하는 설정을 지정합니다. 이러한 설정에는 크롤링을 시작할 콘텐츠 리포지토리의 주소(시작 주소라고도 함)가 하나 이상 포함됩니다. 이러한 설정은 전체 콘텐츠 원본 내의 모든 시작 주소에 적용됩니다.

기본 콘텐츠 원본

조직에서 SharePoint 사이트에 포함된 콘텐츠만 크롤링해야 하는 경우 추가 콘텐츠 원본을 만들지 않아도 될 수 있습니다. Search Server 2008에서는 초기 배포 중에 기본 콘텐츠 원본을 정의합니다. 기본 콘텐츠 원본을 로컬 Office SharePoint Server 사이트라고 합니다. 서버 팜에 있는 모든 웹 응용 프로그램의 시작 주소는 기본 콘텐츠 원본의 일부로 자동으로 포함됩니다. 이 콘텐츠 원본은 기본적으로 크롤링되지 않습니다. 기본 콘텐츠 원본의 콘텐츠를 인덱싱하려면 수동으로 크롤링을 시작하거나 예약해야 합니다.

새 콘텐츠 원본 만들기

콘텐츠 원본을 만들 때 크롤링하는 콘텐츠의 형식, 콘텐츠가 크롤링되는 시기 및 크롤링 동작(예: 시작 주소의 네임스페이스 내에서 크롤링할 수준 또는 허용할 서버 홉 수)을 정의하는 설정을 지정합니다. 크롤링할 콘텐츠 리포지토리의 유형이 여러 개이거나 일부 콘텐츠 리포지토리를 서로 다른 일정으로 크롤링하려면 추가 콘텐츠 원본을 만들어야 합니다. Search Server에는 최대 500개의 콘텐츠 원본을 지원하는 SSP(공유 서비스 공급자)가 하나 있습니다. 자세한 내용은 콘텐츠 크롤링 계획(Search Server 2008)의 "콘텐츠 원본 계획" 섹션을 참조하십시오. 크롤링 동작을 구성하는 방법에 대한 자세한 내용은 크롤링되는 콘텐츠의 양 제한 또는 증가(Search Server 2008)를 참조하십시오.

콘텐츠 리포지토리 유형

콘텐츠 원본당 한 가지 형식의 콘텐츠만 크롤링할 수 있습니다. 즉, SharePoint 사이트의 URL이 포함된 콘텐츠 원본과 파일 공유의 URL이 포함된 다른 콘텐츠 원본을 만들 수 있지만, SharePoint 사이트와 파일 공유의 URL이 모두 포함된 단일 콘텐츠 원본은 만들 수 없습니다.

다음 표에는 Search Server에서 크롤링하고 인덱싱할 수 있는 콘텐츠 형식이 나와 있습니다.

콘텐츠 원본 형식 포함하는 콘텐츠 형식

SharePoint 사이트

  • 같은 팜이나 다른 Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 또는 Search Server 2008 팜의 SharePoint 사이트

  • Microsoft Office SharePoint Portal Server 2003 또는 Microsoft Windows SharePoint Services 2.0 팜의 SharePoint 사이트

    참고

    Search Server 2008 크롤러는 모든 Office SharePoint Server 2007, Windows SharePoint Services 3.0 및 Search Server 2008 사이트와 하위 사이트를 자동으로 크롤링할 수 있습니다. 크롤러는 이전 버전의 SharePoint 제품 및 기술을 크롤링할 수 있습니다. 그러나 크롤링할 각 최상위 사이트(사이트 모음)와 각 하위 사이트의 URL을 지정해야 합니다.
    포털 사이트를 크롤링할 때는 Microsoft Office SharePoint Portal Server 2003 팜의 사이트 디렉터리에 표시된 사이트가 크롤링됩니다. 사이트 디렉터리에 대한 자세한 내용은 사이트 디렉터리 정보 (영문)(https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x412)를 참조하십시오.

웹 사이트

  • SharePoint 사이트에 없는 조직 내의 웹 콘텐츠

  • 인터넷 웹 사이트의 콘텐츠

    참고

    크롤러는 웹 사이트 콘텐츠 형식 또는 SharePoint 사이트 콘텐츠 형식을 사용할 때와 같은 방식으로 작동합니다. 이러한 콘텐츠 원본 형식에 대해 구성할 수 있는 크롤링 설정만 다릅니다.

파일 공유

  • 조직 내 파일 공유에 있는 콘텐츠

Exchange 공용 폴더

  • Microsoft Exchange Server 콘텐츠

Lotus Notes

  • Lotus Notes 데이터베이스에 저장된 콘텐츠

    참고

    Lotus Notes 콘텐츠 원본 옵션은 Lotus Notes와 작동하도록 인덱스 서버를 구성할 때까지 사용자 인터페이스에 표시되지 않습니다. 자세한 내용은 Lotus Notes 크롤링 준비(Search Server 2008)를 참조하십시오.

콘텐츠의 시작 주소

각 콘텐츠 원본은 크롤러가 콘텐츠의 리포지토리에 연결하는 데 사용하는 시작 주소의 목록을 유지 관리합니다. 각 콘텐츠 원본에는 최대 500개의 시작 주소가 포함될 수 있습니다. 여러 콘텐츠 원본을 사용하여 같은 주소를 크롤링할 수는 없습니다. 예를 들어 특정 콘텐츠 원본을 사용하여 사이트 모음과 해당 사이트 모음의 모든 하위 사이트를 크롤링하는 경우 별도의 콘텐츠 원본을 사용하여 해당 하위 사이트 중 하나를 다른 일정으로 크롤링할 수는 없습니다.

콘텐츠 크롤링

콘텐츠 원본을 사용하여 수동으로 크롤링을 시작하거나 선택된 콘텐츠 원본이 크롤링되는 시기와 빈도를 예약할 수 있습니다. 다른 일정으로 콘텐츠 원본의 일부인 콘텐츠를 크롤링하려면 해당 콘텐츠에 대한 별도의 콘텐츠 원본을 만들어야 합니다. 성능과 관리 효율성을 위해 가능한 한 적은 콘텐츠 원본을 사용하는 것이 좋습니다. 크롤링을 수동으로 시작하거나 크롤링을 예약하는 방법에 대한 자세한 내용은 콘텐츠 크롤링(Search Server 2008)을 참조하십시오.

인증

크롤러는 콘텐츠 원본에 표시된 시작 주소에 액세스할 때 해당 콘텐츠를 호스팅하는 서버의 인증을 받고 해당 서버에 대한 액세스 권한을 부여 받아야 합니다. 크롤러가 사용하는 사용자 계정은 콘텐츠를 크롤링하기 위해 최소한 읽기 권한을 갖고 있어야 합니다. 기본적으로 Search Server에서는 서버에 대해 인증할 때 기본 콘텐츠 액세스 계정과 NTLM을 사용합니다. 자세한 내용은 크롤러의 인증 방법 구성(Search Server 2008)를 참조하십시오.

참고 항목

개념

콘텐츠 크롤링 계획(Search Server 2008)
블로그 게시물 결과를 반환하도록 검색 구성(Search Server 2008)
SSL 사이트를 크롤링하기 위한 클라이언트 인증서 구성(Search Server 2008)
웹 파트 속성 구성(Search Server 2008)