콘텐츠 원본 정보(Office SharePoint Server 2007)

업데이트 날짜: 2009년 4월

적용 대상: Office SharePoint Server 2007

 

마지막으로 수정된 항목: 2015-03-09

콘텐츠는 웹 페이지, Microsoft Office Word 문서, 비즈니스 데이터 또는 전자 메일 메시지와 같이 크롤링할 수 있는 모든 항목입니다. 콘텐츠는 웹 사이트, 파일 공유 또는 SharePoint 사이트와 같은 콘텐츠 리포지토리에 있습니다. 콘텐츠 원본은 콘텐츠 크롤링 방법 및 주기를 정의하는 설정을 지정합니다. 콘텐츠 원본에는 크롤링이 시작되는 콘텐츠 리포지토리 주소(시작 주소)가 하나 이상 포함됩니다. 이 설정은 전체 콘텐츠 원본 내에 있는 모든 시작 주소에 적용됩니다.

기본 콘텐츠 원본

조직에서 SharePoint 사이트에 포함되어 있는 콘텐츠만 크롤링해야 하는 경우 추가 콘텐츠 원본을 작성하지 않아도 됩니다. Microsoft Office SharePoint Server 2007에서 최초 배포 시 기본 콘텐츠 원본을 지정합니다. 기본 콘텐츠 원본은 로컬 Office SharePoint Server sites 사이트라고 합니다. 서버 팜에 있는 모든 웹 응용 프로그램의 시작 주소는 자동으로 기본 콘텐츠 원본의 일부로 포함됩니다. 기본적으로 이 콘텐츠 원본은 크롤링되지 않습니다. 기본 콘텐츠 원본의 콘텐츠를 인덱싱하려면 콘텐츠를 직접 시작하거나 이에 대한 크롤링 일정을 직접 계획해야 합니다.

새 콘텐츠 원본 만들기

콘텐츠 원본을 만들 때 시작 주소의 네임스페이스 내에서 어느 정도로 크롤링할 것인지 또는 허용할 서버 홉 수 등과 같은 크롤링 동작, 콘텐츠를 크롤링하는 시기 및 크롤링하는 콘텐츠 종류를 정의하는 설정을 지정합니다. 크롤링하려는 콘텐츠 리포지토리의 종류가 여러 개인 경우 또는 다른 일정으로 콘텐츠 리포지토리를 크롤링하려는 경우 추가 콘텐츠 원본을 만들어야 합니다. Office SharePoint Server 2007에서는 SSP(공유 서비스 공급자)당 최대 500개의 콘텐츠 원본이 지원되며 각 콘텐츠 원본은 최대 500개의 시작 주소를 포함할 수 있습니다. 추가 콘텐츠 원본을 만드는 시기에 대한 자세한 내용은 콘텐츠 크롤링 계획(Office SharePoint Server)의 "콘텐츠 원본 계획" 섹션을 참조하십시오. 크롤링 동작을 구성하는 방법에 대한 자세한 내용은 크롤링되는 콘텐츠의 양 제한 또는 증대(Office SharePoint Server)를 참조하십시오.

콘텐츠 리포지토리 유형

콘텐츠 원본당 한 가지 종류의 콘텐츠 리포지토리만 크롤링할 수 있습니다. 즉, SharePoint 사이트의 URL이 포함된 콘텐츠 원본과 파일 공유의 URL이 포함된 다른 콘텐츠 원본을 만들 수 있지만, SharePoint 사이트와 파일 공유의 URL이 모두 포함된 단일 콘텐츠 원본은 만들 수는 없습니다.

다음 표에는 Office SharePoint Server 2007에서 크롤링할 수 있는 콘텐츠 리포지토리 종류가 나와 있습니다.

콘텐츠 원본 종류 다음 콘텐츠 종류 포함

SharePoint 사이트

  • 같은 팜이나 다른 Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 또는 Microsoft Search Server 2008 팜의 SharePoint 사이트

  • Microsoft Office SharePoint Portal Server 2003 또는 Microsoft Windows SharePoint Services 2.0 팜의 SharePoint 사이트

    참고

    Office SharePoint Server 2007 크롤러는 Office SharePoint Server 2007, Windows SharePoint Services 3.0 및 Search Server 2008 사이트 및 하위 사이트를 모두 자동으로 크롤링할 수 있습니다. 이전 버전의 SharePoint 제품 및 기술을 크롤링하려면 크롤링하려는 각 상위 수준 사이트(사이트 모음) 및 하위 사이트의 URL을 지정해야 합니다.
    포털 사이트를 크롤링할 때는 Microsoft Office SharePoint Portal Server 2003 팜의 사이트 디렉터리에 표시된 사이트가 크롤링됩니다. 사이트 디렉터리에 대한 자세한 내용은 사이트 디렉터리 정보 (영문)(https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x412)를 참조하십시오.

웹 사이트

  • SharePoint 사이트에서 발견되지 않는 조직의 웹 콘텐츠

  • 인터넷 웹 사이트의 콘텐츠

    참고

    크롤러는 웹 사이트 콘텐츠 형식 또는 SharePoint 사이트 콘텐츠 형식을 사용할 때와 같은 방식으로 작동합니다. 이러한 콘텐츠 원본 형식에 대해 구성할 수 있는 크롤링 설정만 다릅니다.

파일 공유

  • 조직 내 파일 공유에 있는 콘텐츠

Exchange 공용 폴더

  • Microsoft Exchange Server 콘텐츠

Lotus Notes

  • Lotus Notes 데이터베이스에 저장된 콘텐츠

    참고

    Lotus Notes 콘텐츠 원본 옵션은 Lotus Notes와 작업할 인덱스 서버를 구성할 때까지 사용자 인터페이스에 표시되지 않습니다. 자세한 내용은 Lotus Notes 크롤링 준비(Office SharePoint Server 2007)를 참조하십시오.

비즈니스 데이터(Enterprise Edition에만 해당)

  • 기간 업무(LOB) 애플리케이션에 저장된 비즈니스 데이터

    콘텐츠 원본 하나를 만들어 비즈니스 데이터 카탈로그에 등록된 모든 응용 프로그램을 크롤링할 수도 있고, 별도의 콘텐츠 원본을 만들어 비즈니스 데이터 카탈로그에 등록된 개별 응용 프로그램을 크롤링할 수도 있습니다.

    비즈니스 데이터의 콘텐츠 원본을 만들기 전에 비즈니스 데이터 카탈로그에서 데이터를 호스팅하는 응용 프로그램을 등록해야 합니다. 자세한 내용은 비즈니스 데이터 카탈로그에 비즈니스 응용 프로그램 등록을 참조하십시오.

콘텐츠의 시작 주소

각 콘텐츠 원본에는 크롤러가 콘텐츠 저장소에 연결하는 데 사용하는 시작 주소 목록이 포함되어 있습니다. 각 콘텐츠 원본은 시작 주소를 최대 500개 포함할 수 있습니다. 여러 콘텐츠 원본을 사용하여 같은 주소를 크롤링할 수는 없습니다. 예를 들어 특정 콘텐츠 원본을 사용하여 사이트 모음 및 해당 사이트 모음의 모든 하위 사이트를 크롤링하는 경우 별도의 콘텐츠 원본을 사용하여 해당 하위 사이트 중 하나를 다른 일정으로 크롤링할 수는 없습니다.

콘텐츠 크롤링

콘텐츠 원본을 사용하여 크롤링을 직접 시작하거나 선택한 콘텐츠 원본을 크롤링할 일정 및 방법을 직접 지정할 수 있습니다. 콘텐츠 원본 중 일부 콘텐츠를 다른 일정으로 크롤링하려면 해당 콘텐츠에 대한 별도의 콘텐츠 원본을 만들어야 합니다. 성능 및 관리상의 이유로 가능한 한 적은 수의 콘텐츠 원본을 사용하는 것이 좋습니다. 크롤링을 수동으로 시작하거나 일정을 계획하는 방법에 대한 자세한 내용은 콘텐츠 크롤링(Office SharePoint Server 2007)을 참조하십시오.

인증

크롤러가 콘텐츠 원본에 나열되어 있는 시작 주소에 액세스하는 경우 크롤러는 해당 콘텐츠를 호스트하는 서버에서 인증되고 액세스 권한을 부여 받아야 합니다. 크롤러에서 사용하는 사용자 계정으로 콘텐츠를 크롤링하려면 최소한 읽기 권한이 있어야 합니다. 기본적으로 Office SharePoint Server 2007에서는 서버를 인증할 때 기본 콘텐츠 액세스 계정 및 NTLM을 사용합니다. 자세한 내용은 크롤러 인증 방법 구성(Office SharePoint Server 2007)를 참조하십시오.

참고 항목

개념

콘텐츠 크롤링 계획(Office SharePoint Server)
블로그 포스트 결과를 반환하도록 검색 구성(Office SharePoint Server 2007)
SSL 사이트 크롤링에 사용할 클라이언트 인증서 구성(Office SharePoint Server 2007)