크롤링 및 연결 계획(FAST Search Server 2010 for SharePoint)

 

적용 대상: FAST Search Server 2010

마지막으로 수정된 항목: 2016-11-29

이 문서에서는 Microsoft FAST Search Server 2010 for SharePoint에서 콘텐츠를 연결, 크롤링 및 인덱싱하는 방법을 이해할 수 있도록 도와줌으로써 크롤링 및 연결을 계획하는 방법에 대해 설명합니다.

최종 사용자가 FAST Search Server 2010 for SharePoint의 엔터프라이즈 검색 기능을 사용하기 전에 쿼리할 수 있도록 만들 콘텐츠를 크롤링하거나 연결해야 합니다.

이 문서는 세 가지 인덱싱 커넥터 유형을 구분하여 설명합니다.

  1. Microsoft SharePoint Server 2010 인덱싱 커넥터 및 크롤링 프레임워크

    대부분의 콘텐츠 원본은 통합 인덱싱 커넥터 또는 Business Connectivity Services를 사용하여 이 프레임워크를 통해 크롤링할 수 있습니다. 대부분의 구성 및 실행 작업은 SharePoint Server 2010 중앙 관리를 사용하여 수행합니다.

  2. 연결된 검색 커넥터

    연결된 검색 커넥터를 사용하면 해당 콘텐츠를 실제로 크롤링하지 않고도 쿼리를 대상 시스템에 전달하고 시스템에서 반환된 결과를 표시할 수 있습니다. 대부분의 구성 및 실행 작업은 SharePoint Server 2010 중앙 관리를 사용하여 수행합니다.

  3. FAST Search Server 2010 for SharePoint 특정 인덱싱 커넥터

    FAST Search Server 2010 for SharePoint는 웹, 데이터베이스 및 Lotus Notes 콘텐츠를 크롤링하기 위한 세 가지 추가 인덱싱 커넥터를 제공합니다. 이러한 인덱싱 커넥터는 주로 명령줄을 사용하여 XML 파일과 Windows PowerShell cmdlet을 편집해 구성합니다.

이 문서의 내용:

  • 콘텐츠 원본 식별 및 사용할 인덱싱 커넥터 확인

    이 섹션에서는 사용할 인덱싱 커넥터를 확인할 수 있습니다.

  • SharePoint Server 2010에서 통합된 인덱싱 커넥터 사용 계획

    이 섹션에서는 SharePoint Server 2010 인덱싱 커넥터 프레임워크 및 FAST Search Content Search Service 응용 프로그램의 사용을 계획할 수 있습니다.

  • 연결 계획

    이 섹션에서는 SharePoint Server 2010 프레임워크 및 FAST Search Query Search Service 응용 프로그램을 사용하여 최종 사용자 쿼리에 대한 연결된 검색 결과를 포함하는 방법을 계획할 수 있습니다.

  • FAST Search Server 2010 for SharePoint 인덱싱 커넥터 사용 계획

    이 섹션에서는 FAST Search Server 2010 for SharePoint 특정 커넥터 사용을 계획할 수 있습니다.

    • FAST Search 웹 크롤러

    • FAST Search 데이터베이스 커넥터

    • FAST Search Lotus Notes 커넥터

    • 크롤링에서 콘텐츠 포함 또는 제외

    • 크롤링 일정 설정

콘텐츠 원본 식별 및 사용할 인덱싱 커넥터 확인

FAST Search Server 2010 for SharePoint에서는 다양한 콘텐츠 원본에 대해 서로 다른 인덱싱 커넥터를 사용합니다. 어떤 커넥터를 선택할지는 크롤링할 콘텐츠의 종류, 개인적인 선호도, 조직의 특정 요구 사항 등에 따라 달라집니다.

대부분의 콘텐츠 원본은 Microsoft SharePoint Server 2010에서 제공하는 다양한 인덱싱 커넥터를 사용하여 크롤링할 수 있습니다. 중앙 관리 사용자 인터페이스에서 이러한 인덱싱 커넥터의 모음을 FAST Search 커넥터라고 부릅니다. 이 커넥터는 별도의 한 가지 인덱싱 커넥터가 아니라 여러 인덱싱 커넥터의 모음입니다. FAST Search 커넥터에는 FAST Search Content SSA(Content Search Service 응용 프로그램)를 통해 하나 이상의 콘텐츠 원본과 인덱싱 커넥터가 연결됩니다. 또한 Content SSA는 Microsoft SharePoint Server 2010 프런트 엔드를 FAST Search Server 2010 for SharePoint 백 엔드와 연결합니다.

FAST Search Server 2010 for SharePoint을 설치하면 세 가지 FAST Search Server 2010 for SharePoint 인덱싱 커넥터에 액세스할 수도 있습니다. 이 세 커넥터는 웹, 데이터베이스 및 Lotus Notes 콘텐츠를 인덱스에 공급할 수 있습니다. 다음 표에는 사용 가능한 인덱싱 커넥터 및 권장 사용 사례가 요약되어 있습니다.

콘텐츠 형식 인덱싱 커넥터 권장 사용 사례

SharePoint

SharePoint 인덱싱 커넥터

모든 사용 사례에서 사용합니다.

파일 공유

파일 공유 인덱싱 커넥터

모든 사용 사례에서 사용합니다.

Exchange 공용 폴더

Exchange 인덱싱 커넥터

모든 사용 사례에서 사용합니다.

사용자 프로필

사용자 프로필 인덱싱 커넥터

모든 사용 사례에서 사용합니다.

이 콘텐츠 종류는 FAST Search Query Search Service 응용 프로그램을 통해 크롤링됩니다.

웹 사이트

웹 사이트 인덱싱 커넥터

크롤링할 웹 사이트의 양이 제한적이며 동적 콘텐츠가 없는 경우에 사용합니다.

FAST Search 웹 크롤러

크롤링할 웹 사이트가 많은 경우에 사용합니다.

웹 사이트 콘텐츠에 JavaScript 등의 동적 데이터가 포함된 경우에 사용합니다.

조직에서 고급 웹 크롤링, 구성 및 일정 옵션에 액세스해야 하는 경우에 사용합니다.

RSS 웹 콘텐츠를 크롤링하려는 경우에 사용합니다.

웹 사이트 콘텐츠에서 고급 로그온 옵션을 사용하는 경우에 사용합니다.

데이터베이스

비즈니스 데이터 카탈로그 기반 인덱싱 커넥터

기본 구성 방법이 Microsoft SharePoint Designer 2010을 사용하는 방법인 경우에 사용합니다.

증분 데이터베이스 크롤링에 타임스탬프 기반 변경 검색을 사용하려는 경우에 사용합니다.

기본 실행 방법이 Microsoft SharePoint Server 2010 중앙 관리를 사용하는 방법인 경우에 사용합니다.

변경 로그에 기반을 둔 크롤링을 사용하려는 경우에 사용합니다. 이렇게 하려면 커넥터 모델 파일을 직접 수정하고 데이터베이스에 저장 프로시저를 만들면 됩니다.

FAST Search 데이터베이스 커넥터

기본 구성 방법이 SQL 쿼리를 사용하는 방법인 경우에 사용합니다.

SQL 쿼리를 통한 고급 데이터 조인 작업 옵션이 필요한 경우에 사용합니다.

고급 증분 업데이트 기능을 사용하려는 경우에 사용합니다. 사용할 수 있는 업데이트 정보가 없는 경우 FAST Search 데이터베이스 커넥터는 증분 크롤링에 체크섬 기반 변경 검색을 사용합니다. 이 커넥터는 타임스탬프 기반 변경 검색과 업데이트 및 삭제 플래그 기반 변경 검색도 지원합니다.

Lotus Notes

Lotus Notes 인덱싱 커넥터

기본 실행 방법이 Microsoft SharePoint Server 2010 중앙 관리를 사용하는 방법인 경우에 사용합니다.

FAST Search Lotus Notes 커넥터

Lotus Notes 역할에 대한 지원을 포함하여 전체 Lotus Notes 보안 지원이 필요한 경우에 사용합니다.

Lotus Notes 데이터베이스를 첨부 파일로 크롤링하려는 경우에 사용합니다.

기간 업무(LOB) 데이터

비즈니스 데이터 카탈로그 기반 인덱싱 커넥터

콘텐츠 원본의 데이터에 기간 업무(LOB) 응용 프로그램의 데이터가 포함된 경우에 사용합니다.

변경 로그에 기반을 둔 크롤링을 사용하려는 경우에 사용합니다. 이렇게 하려면 커넥터 모델 파일을 직접 수정하고 데이터베이스에 저장 프로시저를 만들면 됩니다.

콘텐츠 크롤링 및 인덱싱

콘텐츠를 크롤링하면 개별 파일이나 콘텐츠 조각으로 그 결과가 제공되는데 이러한 파일이나 콘텐츠 조각을 검색 쿼리에서 사용하도록 설정할 수 있습니다. 인덱싱 커넥터는 이러한 파일이나 콘텐츠 조각에 액세스하여 읽을 수 있습니다. 콘텐츠를 크롤링하여 해당 항목에 대한 크롤링 속성을 만듭니다. 이러한 크롤링 속성은 검색 인덱스 또는 인덱스에 저장된 관리 속성에 매핑됩니다.

참고

인덱싱 커넥터는 호스트 서버에 있는 파일을 변경하지 않습니다. 인덱싱 커넥터는 호스트 서버에 있는 파일에 액세스하여 읽기만 하고 수정하지는 않습니다. 인덱싱 커넥터가 호스트 서버의 콘텐츠를 읽기 때문에 경우에 따라 크롤링한 파일을 마지막으로 액세스한 날짜가 업데이트될 수도 있습니다. 이 사항은 특정 콘텐츠 원본을 호스팅하는 일부 서버에만 적용됩니다.

SharePoint Server 2010에서 통합된 인덱싱 커넥터 사용 계획

대부분의 콘텐츠 원본은 SharePoint Server 2010의 통합 인덱싱 커넥터를 사용하여 크롤링할 수 있습니다. 대부분의 구성 및 실행 작업은 SharePoint Server 2010 중앙 관리를 사용하여 수행합니다.

이러한 인덱싱 커넥터는 FAST Search Content SSA(Content Search Service 응용 프로그램)를 구성하여 설정합니다. 무엇보다 Content SSA는 FAST Search Server 2010 for SharePoint 백 엔드와의 통신을 가능하게 합니다. Content SSA 내에서 콘텐츠 원본의 위치, 크롤링 일정 및 기타 정보를 지정합니다. Content SSA는 이름이 sp인 (기본) 콘텐츠 모음에 공급합니다.

FAST Search 커넥터가 크롤링하는 대상은 다음과 같습니다.

  • SharePoint 사이트

  • 웹 사이트

  • Microsoft Office 문서 같은 콘텐츠를 포함하는 파일 공유

  • Exchange 공용 폴더

  • 기간 업무(LOB) 데이터(예: 데이터베이스의 콘텐츠)

  • 직접 만든 커넥터를 사용하여 액세스하는 사용자 지정 저장소

콘텐츠 원본 계획

FAST Search Content SSA(Content Search Service 응용 프로그램)에서 콘텐츠 원본은 크롤링할 콘텐츠 종류 및 URL 그리고 크롤링 수준과 시기를 지정하는 데 사용할 수 있는 옵션 집합입니다. 기본 콘텐츠 원본은 로컬 SharePoint 사이트입니다. 이 콘텐츠 원본을 사용하여 특정 Content SSA와 연결된 모든 웹 응용 프로그램에서 모든 콘텐츠를 크롤링하는 방법을 지정할 수 있습니다. 기본적으로 특정 Content SSA를 사용하는 각 웹 응용 프로그램의 경우 FAST Search Server 2010 for SharePoint에서는 각 사이트 모음에 있는 최상위 사이트의 시작 주소를 기본 콘텐츠 원본에 추가합니다.

일부 조직에서는 기본 콘텐츠 원본을 사용하여 해당 검색 요구 사항을 충족합니다. 그러나 많은 조직에는 추가 콘텐츠 원본이 있어야 합니다. 다음을 수행해야 하는 경우 추가 콘텐츠 원본을 계획하십시오.

  • 서로 다른 종류의 콘텐츠 크롤링(예: SharePoint 사이트, 파일 공유 및 비즈니스 데이터)

  • 다른 콘텐츠와 다른 일정에 따라 일부 콘텐츠 크롤링

  • 크롤링되는 콘텐츠의 양 제한 또는 증대

  • 서로 다른 사이트의 크롤링에 각기 다른 우선 순위 설정

Content SSA에는 최대 500개의 콘텐츠 원본을 만들 수 있으며 각 콘텐츠 원본에는 500개나 되는 시작 주소가 포함될 수 있습니다. 관리 업무를 최대한 단순화하려면 만드는 콘텐츠 원본의 수를 제한하는 것이 좋습니다.

서로 다른 종류의 콘텐츠 크롤링 계획

콘텐츠 원본당 한 가지 형식의 콘텐츠만 크롤링할 수 있습니다. 즉, SharePoint 사이트의 시작 주소가 포함된 콘텐츠 원본과 파일 공유의 시작 주소가 포함된 콘텐츠 원본을 별도로 만들 수는 있지만, SharePoint 사이트의 시작 주소와 파일 공유의 시작 주소가 모두 포함된 단일 콘텐츠 원본은 만들 수 없습니다. 다음 표에는 구성 가능한 콘텐츠 원본 형식이 나와 있습니다.

콘텐츠 원본 종류 콘텐츠

SharePoint 사이트

동일하거나 서로 다른 Microsoft SharePoint Server 2010, Microsoft SharePoint Foundation 2010 또는 Microsoft Search Server 2010 팜의 SharePoint 사이트

동일하거나 서로 다른 Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 또는 Microsoft Search Server 2008 팜의 SharePoint 사이트

Microsoft Office SharePoint Portal Server 2003 또는 Windows SharePoint Services 2.0 팜의 SharePoint 사이트

참고

SharePoint Server 2010, SharePoint Foundation 2010 또는 Search Server 2010에서 SharePoint 사이트를 크롤링할 때와 달리 이전 버전의 SharePoint 제품 및 기술에서는 SharePoint Server 2010 크롤러가 사이트 모음의 모든 하위 사이트를 자동으로 크롤링할 수 없습니다. 따라서 이전 버전에서 SharePoint 사이트를 크롤링하는 경우에는 크롤링할 각 최상위 수준 사이트의 시작 주소와 각 하위 사이트의 URL을 지정해야 합니다.

웹 사이트

SharePoint 사이트에 없는 조직의 기타 웹 콘텐츠

인터넷 웹 사이트의 콘텐츠

파일 공유

조직 내 파일 공유에 있는 콘텐츠

Exchange 공용 폴더

Microsoft Exchange Server 콘텐츠

Lotus Notes

Lotus Notes 데이터베이스에 저장된 전자 메일 메시지

참고

다른 모든 콘텐츠 원본 형식과 달리 Lotus Notes 콘텐츠 원본 옵션은 적절한 필수 구성 요소 소프트웨어를 설치하고 구성할 때까지 사용자 인터페이스에 표시되지 않습니다. 자세한 내용은 Lotus Notes 커넥터 구성 및 사용(FAST Search Server 2010 for SharePoint)를 참조하십시오.

비즈니스 데이터

기간 업무(LOB) 응용 프로그램에 저장된 비즈니스 데이터

비즈니스 데이터에 대한 콘텐츠 원본 계획

비즈니스 데이터 콘텐츠 원본을 사용하려면 데이터를 호스팅하는 응용 프로그램을 Business Data Connectivity 서비스 응용 프로그램의 응용 프로그램 모델에 지정해야 합니다. 콘텐츠 원본 하나를 만들어 Business Data Connectivity 서비스에 등록된 모든 응용 프로그램을 크롤링할 수도 있고 서로 다른 콘텐츠 원본을 만들어 개별 응용 프로그램을 크롤링할 수도 있습니다.

비즈니스 데이터를 사이트 모음으로 통합하려는 사용자가 전체 콘텐츠 계획 프로세스에 관여하지 않는 경우가 종종 있습니다. 따라서 비즈니스 응용 프로그램 데이터를 콘텐츠에 통합하는 방법 및 사이트 모음에 이를 효과적으로 표시하는 방법과 관련하여 도움을 얻을 수 있도록 비즈니스 응용 프로그램 관리자를 콘텐츠 계획 팀에 포함하십시오.

Business Connectivity Services 모델 정보

데이터베이스 또는 웹 서비스와 같은 특정 리포지토리를 크롤링하려면 SharePoint Server 2010 검색 커넥터 프레임워크가 필요합니다. 이 프레임워크를 사용하면 BCS(Business Connectivity Service) 모델을 사용하여 외부 데이터 원본을 크롤링할 수 있습니다. 이러한 모델 파일은 연결 정보와 크롤링하려는 외부 콘텐츠 원본의 구조를 정의합니다. BCS 모델은 Business Connectivity Service로 가져옵니다. 그런 다음 기간 업무(LOB) 데이터 또는 사용자 지정 저장소 유형의 콘텐츠 원본을 설정할 때 이 모델과 서비스를 가리킵니다.

데이터베이스 콘텐츠 및 웹 서비스(WCF)에 사용할 수 있는 몇 가지 미리 정의된 BCS 모델이 있습니다. 또한 커넥터 프레임워크 및 BCS 모델을 사용하여 고유의 사용자 지정 BCS 모델 및 사용자 지정 커넥터를 만들 수도 있습니다.

SharePoint Server 2010 검색 커넥터 프레임워크를 기반으로 작성하려면 특정 요구 사항 및 목표에 따라 SharePoint Designer 또는 Microsoft Visual Studio 2010을 사용해야 합니다.

SharePoint Designer를 사용하는 경우 다음 작업을 수행합니다.

  • 데이터베이스 및 웹 서비스 같은 지원되는 기본 외부 콘텐츠 원본을 크롤링하는 데 필요한 BCS 모델을 만듭니다.

  • BCS 응용 프로그램 간에 모델을 가져오고 내보냅니다.

Microsoft Visual Studio를 사용하는 경우 다음 작업을 수행합니다.

  • .NET BCS 커넥터의 메서드를 구현합니다.

  • 저장소에 사용할 사용자 지정 커넥터를 작성합니다.

동일한 BCS(Business Connectivity Service)에서 여러 콘텐츠 원본을 모두 가져올 수 있으며 서로 다른 Search Service 응용 프로그램이 공유 BCS의 동일한 모델을 가리키도록 설정할 수 있습니다.

SharePoint Server 2010 커넥터 프레임워크, Business Connectivity Services 및 사용자 지정 커넥터 만들기에 대한 자세한 내용은 SharePoint Server 검색 커넥터 프레임워크(영문일 수 있음)(MSDN)를 참조하십시오.

인덱싱 커넥터 프로토콜 계획

크롤링되는 모든 콘텐츠에 대해서는 해당 콘텐츠에 대한 액세스 권한을 얻기 위해 커넥터를 사용해야 합니다. FAST Search Server 2010 for SharePoint은 SharePoint Server 2010 커넥터 프레임워크를 통해 모든 공통 인터넷 프로토콜에 대한 커넥터를 제공합니다. 하지만 SharePoint Server 2010과 함께 설치되지 않는 커넥터가 필요한 콘텐츠를 크롤링하는 경우 해당 콘텐츠를 크롤링하기 전에 타사 또는 사용자 지정 커넥터를 설치해야 합니다. 기본적으로 설치되는 인덱싱 커넥터 프로토콜의 목록을 확인하려면 기본 인덱싱 커넥터 프로토콜(FAST Search Server 2010 for SharePoint)을 참조하십시오. 다른 Microsoft 제품 또는 타사 소프트웨어에서 만든 콘텐츠를 크롤링하기 위해 추가 인덱싱 커넥터 및 프로토콜을 설치할 수 있습니다. 자세한 내용은 Content sources that require additional configuration (FAST Search Server 2010 for SharePoint)를 참조하십시오.

파일 형식 포함 및 IFilter 계획

FAST Search Server 2010 for SharePoint는 가장 일반적인 파일 형식으로부터 메타데이터 및 콘텐츠를 크롤링하고 추출합니다. 초기 설치 중에 여러 파일 형식 및 IFilter가 자동으로 포함됩니다. 초기 배포에서 콘텐츠 원본을 계획할 때 크롤링할 콘텐츠가 포함되지 않은 파일 형식을 사용하는지 여부를 결정하십시오. 파일 형식이 포함되지 않은 경우 Advanced Filter Pack을 사용하거나 해당 파일 형식을 지원하는 타사 IFilter를 설치 및 등록하여 파일 형식을 추가해야 합니다.

특정 파일 형식이 크롤링되지 않도록 제외하려면 파일 형식 제외 목록에 해당 파일 형식의 파일 이름 확장명을 추가하면 됩니다. 그러면 해당 확장명을 가진 파일 이름이 크롤링 대상에서 제외됩니다. 기본적으로 지원되거나 제외되는 파일 형식 및 IFilter 목록을 확인하려면 IFilter 및 파일 형식 참조(FAST Search Server 2010 for SharePoint)를 참조하십시오.

크롤링 일정과 크롤링 규칙 계획 및 크롤링 영향 관리

크롤링 일정 및 크롤링 규칙을 계획할지 여부 및 그러한 항목의 개수와 콘텐츠 크롤링을 위해 Content SSA 및 SharePoint 크롤러를 사용할 때 크롤링이 미치는 영향을 관리하려는 정도는 일부 요소에 따라 결정됩니다.

참고

하나 이상의 콘텐츠 원본에 대한 증분적 크롤링을 시작하려면 먼저 시스템에서 전체 크롤링을 완료해야 합니다.

크롤링 일정과 크롤링 계획을 구성하거나 크롤링 영향을 관리해야 하는 이유는 다음과 같습니다.

  • 가동 중지 시간 및 사용률 최대 시간을 조정하기 위해

  • 자주 업데이트되는 콘텐츠 크롤링 빈도를 높이기 위해

  • 속도가 느린 서버에 있는 콘텐츠를 다른 서버에 있는 콘텐츠와 별도로 크롤링하기 위해

  • 관련이 적은 크롤링에서 콘텐츠를 제외하기 위해

  • 특정(외부) 웹 사이트 또는 콘텐츠 서버에 대한 요청 빈도를 줄이거나 늘리기 위해

  • 기본 콘텐츠 액세스 계정 이외의 다른 계정을 사용하여 콘텐츠를 크롤링하기 위해

자세한 정보 및 추가 고려 사항을 보려면 SharePoint Server 2010 항목 크롤링 및 연결 계획(SharePoint Server 2010)에서 관련 섹션을 참조하십시오. 다른 일정으로 콘텐츠를 크롤링하는 방법에 대한 자세한 내용은 크롤링 일정 계획 고려 사항전체 크롤링을 수행해야 하는 이유 섹션을 참조하십시오. 크롤러 영향 규칙에 대한 자세한 내용을 보려면 크롤링 영향 관리 계획 섹션을 참조하십시오.

인증 계획

SharePoint Server 2010 크롤러가 콘텐츠 원본에 표시된 시작 주소에 액세스할 때 SharePoint Server 2010 크롤러가 해당 콘텐츠를 호스팅하는 서버의 인증을 받고 해당 서버에 대한 액세스 권한을 부여받아야 합니다. 즉, SharePoint Server 2010 크롤러가 사용하는 도메인 계정에 해당 콘텐츠에 대한 읽기 권한 이상이 있어야 합니다.

기본적으로 시스템에서는 기본 콘텐츠 액세스 계정을 사용합니다. 또는 FAST Search Content SSA에서 크롤링 규칙을 사용하여 특정 콘텐츠를 크롤링할 때 사용할 다른 콘텐츠 액세스 계정을 지정할 수 있습니다. 기본 콘텐츠 액세스 계정을 사용하든 아니면 크롤링 규칙에 따라 지정되는 다른 콘텐츠 액세스 계정을 사용하든 사용하는 콘텐츠 액세스 계정에는 크롤링되는 모든 콘텐츠에 대한 읽기 권한이 있어야 합니다. 콘텐츠 액세스 계정에 읽기 권한이 없는 경우에는 콘텐츠가 크롤링 및 인덱싱되지 않으므로 쿼리에 사용할 수 없습니다.

자세한 내용은 SharePoint Server 2010의 크롤링 및 연결 계획 항목에서 인증 계획 섹션을 참조하십시오.

연결 계획

연결된 검색은 여러 웹 리소스 또는 데이터베이스를 동시에 쿼리하여 최종 사용자에게 단일 검색 결과를 생성하는 기능입니다. FAST Search Server 2010 for SharePoint에서는 로컬 시스템의 서버에서 크롤링되지 않은 콘텐츠를 최종 사용자가 검색할 수 있도록 FAST Search Query Search Service 응용 프로그램에서 연결된 위치를 구성합니다. 연결된 위치를 사용하면 쿼리를 원격 검색 엔진 및 피드로 보낼 수 있습니다. 그에 따라 시스템에서는 연결된 콘텐츠가 크롤링된 콘텐츠의 일부인 것처럼 최종 사용자에게 결과를 렌더링합니다.

FAST Search Server 2010 for SharePoint에서는 SharePoint Server 2010을 통해 다음과 같은 종류의 연결된 위치를 지원합니다.

  • **이 서버의 검색 인덱스.**SharePoint Server 2010을 실행하는 서버가 있는 조직에서 로컬 인덱스를 연결된 위치로 사용할 수 있습니다. 예를 들어 회사의 인사부 서버에 있는 SharePoint 사이트가 직원 연락처 정보를 얻을 수 있는 유일한 출처라고 가정해보십시오. 이 경우에는 이 사이트가 크롤링 범위에 속하지 않더라도 검색 센터 사이트에서 검색을 시작하는 사용자가 자신이 볼 수 있도록 승인된 직원 연락처 정보 결과를 검색할 수 있도록 해당 사이트에 대한 연결된 위치를 구성할 수 있습니다. 이때 다음과 같은 조건이 적용됩니다.

    1. 위치가 이 서버의 검색 인덱스로 설정됩니다.

    2. 쿼리 서식 파일이 필요하지 않습니다. SharePoint Server 2010에서는 개체 모델을 사용하여 위치를 쿼리합니다.

    3. 기본 서버 인증이 사용됩니다.

    4. 고급 검색 쿼리가 지원되지 않습니다.

  • FAST 검색 인덱스

    이 옵션은 로컬 FAST Search Server 2010 for SharePoint 인덱스의 결과를 검색 센터 또는 FAST Search Center로 연결하려는 경우에만 사용합니다.

  • OpenSearch 1.0 또는 1.1. OpenSearch 표준을 지원하는 모든 공용 웹 사이트를 연결된 위치로 사용할 수 있습니다. 이러한 위치의 예로는 Bing과 같은 인터넷 검색 엔진 또는 RSS 또는 Atom 프로토콜을 지원하는 검색 결과 페이지를 들 수 있습니다. 예를 들어 비공개 기술 연구를 위한 내부 사이트를 검색하는 사용자가 공용 웹 사이트에서 관련 연구 정보도 확인할 수 있게 한다고 가정해 보십시오. 이 경우 Bing 검색 쿼리에 대한 연결된 위치를 구성하면 웹 검색 결과가 자동으로 포함됩니다. 이때 다음과 같은 조건이 적용됩니다.

    1. 검색 엔진에 쿼리를 URL(예: http://www.example.com/search.aspx?q=TEST)로 보낼 수 있습니다.

    2. 검색 결과가 RSS, Atom 또는 다른 구조화된 XML 형식으로 반환됩니다.

    3. 위치 기능, 쿼리 서식 파일 및 응답 요소가 위치와 연결된 OpenSearch 설명 파일(.osdx)의 일부입니다.

    4. FAST Search Server 2010 for SharePoint 특유의 OpenSearch 확장을 통해 트리거를 포함하고 XSL 코드를 검색 결과와 연결할 수 있습니다.

    5. 검색 결과에 표시할 메타데이터 선택은 OpenSearch 위치에 따라 결정됩니다.

    OpenSearch에 대한 자세한 내용은 https://www.opensearch.org/home(영문일 수 있음)를 참조하십시오.

연결에 대한 자세한 내용과 연결에 대한 인증 유형을 계획하는 방법은 SharePoint Server 2010의 크롤링 및 연결 계획 항목에서 연결 계획 섹션을 참조하십시오.

연결된 위치를 가져오기 위해 사용할 수 있는 연결된 검색 커넥터에 대한 개요는 엔터프라이즈 검색 센터의 연결된 검색 커넥터 갤러리(영문일 수 있음)에서 찾아 볼 수 있습니다.

FAST Search Server 2010 for SharePoint 인덱싱 커넥터 사용 계획

Microsoft SharePoint Server 2010에 통합된 인덱싱 커넥터 외에도 FAST Search Server 2010 for SharePoint는 웹, Lotus Notes 및 데이터베이스 콘텐츠에 사용할 수 있는 추가 콘텐츠 인덱싱 커넥터를 제공합니다.

이러한 인덱싱 커넥터는 주로 명령줄을 사용하여 XML 파일과 Windows PowerShell cmdlet을 편집해 구성합니다.

FAST Search 웹 크롤러

FAST Search 웹 크롤러는 웹 사이트 콘텐츠를 크롤링하는 데 사용되는 사용자 지정이 가능한 인덱싱 커넥터입니다. 다수의 외부 웹 사이트를 크롤링하는 조직 같은 대규모 환경에 맞게 FAST Search 웹 크롤러를 확장할 수 있습니다. 또한 FAST Search 웹 크롤러는 JavaScript가 포함된 웹 사이트 같은 동적 웹 콘텐츠를 크롤링할 수 있습니다.

FAST Search 웹 크롤러는 정의된 웹 사이트 집합(내부 또는 외부 웹 사이트 집합)에서 콘텐츠를 수집합니다. FAST Search 웹 크롤러를 구성하는 작업은 XML 파일의 복사본을 편집하여 수행합니다. 몇 가지 명령줄 도구를 사용하여 FAST Search 웹 크롤러를 실행할 수 있습니다.

FAST Search 웹 크롤러는 일반적으로 FAST Search Server 2010 for SharePoint 설치 내에 포함된 구성 요소입니다. 내부적으로 FAST Search 웹 크롤러는 프로세스 및 논리 엔터티의 모음으로 구성되며 이들은 대부분의 경우 단일 서버에서 실행됩니다. 크롤링할 웹 사이트의 수나 페이지의 총 수가 많은 경우 이러한 프로세스를 여러 호스트로 분산하여 FAST Search 웹 크롤러를 확장할 수 있으며 이를 위해서는 추가 구성이 필요합니다.

FAST Search 웹 크롤러는 HTTP, HTTPS 및 FTP 콘텐츠를 크롤링할 수 있으며 NTLM 버전 1(제한된 확장 버전 2), 다이제스트, 기본 인증 및 양식 기반 로그온 인증을 지원합니다. RSS 스케줄링이 지원되며 피드에서 연결된 문서에 태그를 지정할 수 있습니다.

FAST Search 데이터베이스 커넥터

FAST Search 데이터베이스 커넥터는 데이터베이스 콘텐츠 원본에서 콘텐츠를 수집하는 특수한 인덱싱 커넥터입니다.

이 인덱싱 커넥터는 XML 서식 파일을 사용하여 구성하고 jdbcconnector.bat 파일의 명령줄 옵션을 사용하여 실행합니다. 구성한 커넥터를 실행한 후에 SharePoint Server 2010 중앙 관리에서 크롤링 속성을 관리 속성에 매핑하여 커넥터가 수집한 콘텐츠를 검색할 수 있도록 하고 검색을 사용자 지정할 수 있습니다.

이 커넥터는 SQL 문을 사용하여 크롤링 데이터베이스에 대해 실행합니다. 이 SQL 문은 원하는 대로 사용자 지정할 수 있습니다. 사용할 수 있는 업데이트 정보가 없는 경우 FAST Search 데이터베이스 커넥터는 증분 크롤링에 체크섬 기반 변경 검색을 사용합니다. 이 커넥터는 타임스탬프 기반 변경 검색과 업데이트 및 삭제 플래그 기반 변경 검색도 지원합니다. 데이터베이스를 크롤링하기 전에 데이터베이스에 대해 수행되어야 하는 사전 및 사후 작업 절차를 지정할 수도 있는데 이렇게 하면 몇몇 사용 사례에서 매우 유용합니다.

FAST Search Lotus Notes 커넥터

FAST Search Lotus Notes 커넥터는 사용자 디렉터리 커넥터와 콘텐츠 커넥터의 두 요소로 이루어진 특수한 인덱싱 커넥터입니다. 콘텐츠 커넥터는 Lotus Notes 콘텐츠 원본에서 콘텐츠를 수집하고, 사용자 디렉터리 커넥터는 최종 사용자가 액세스 권한을 가지고 있는 Lotus Notes 콘텐츠만 검색할 수 있도록 합니다. 사용자 디렉터리 커넥터는 Active Directory 사용자 디렉터리에 Lotus Notes 사용자 계정을 매핑하며 FAST Search Authorization과 밀접하게 통합되어 있습니다.

이 커넥터는 두 개의 XML 서식 파일을 사용하여 구성합니다. 하나는 사용자 디렉터리 커넥터용 서식 파일이고 다른 하나는 콘텐츠 커넥터용 서식 파일입니다. 구성한 콘텐츠 커넥터를 실행한 후에 SharePoint Server 2010 중앙 관리에서 크롤링 속성을 관리 속성에 매핑하여 콘텐츠 커넥터가 수집한 콘텐츠를 검색할 수 있도록 하고 검색을 사용자 지정할 수 있습니다.

FAST Search Lotus Notes 커넥터는 Lotus Notes 버전 6.5.6, 7.x, 8.x와 Lotus Domino 버전 6.5, 7.x, 8.x를 지원합니다.

이 커넥터는 역할을 포함하여 Lotus Notes 보안을 완전하게 지원하며 Lotus Notes 데이터베이스를 첨부 파일로 인덱싱할 수 있습니다.

크롤링에서 콘텐츠 포함 또는 제외

FAST Search Server 2010 for SharePoint 커넥터의 각 커넥터 구성 파일에는 포함 및 제외 규칙을 지정하는 데 사용할 수 있는 매개 변수가 있습니다.

중요

크롤링할 콘텐츠 원본을 너무 많이 지정하지 마십시오.

조직의 다른 관리자가 크롤링하는 콘텐츠의 경우 해당 관리자에게 문의하여 서버의 성능 및 용량을 기반으로 영향 규칙을 설정할 수 있습니다. 대부분의 외부 사이트에는 이러한 조정 옵션을 사용할 수 없습니다. 외부 서버에서 너무 많은 콘텐츠를 요청하거나 자주 요청할 경우 크롤링으로 인해 리소스나 대역폭이 너무 많이 사용되면 해당 사이트의 관리자가 향후 액세스를 제한할 수 있습니다. 따라서 가장 좋은 방법은 크롤링을 느리게 수행하는 것입니다. 이렇게 하면 관련 콘텐츠를 크롤링하는 데 필요한 액세스 권한을 잃을 위험을 줄일 수 있습니다.

FAST Search 웹 크롤러를 사용하면 요청 지연을 설정하여 크롤링 속도를 제어하고, 동일한 웹 사이트로 동시에 전송되는 동시 요청의 최대 수를 설정하고, 여러 사이트가 호스팅되는 IP 주소에 대해 동시 크롤링을 설정하거나 해제할 수 있습니다. 동시에 크롤링할 동시 웹 사이트의 수를 제한하여 FAST Search 웹 크롤러의 대역폭을 제한할 수도 있습니다.

크롤링 일정 설정

FAST Search Lotus Notes 커넥터와 FAST Search 데이터베이스 커넥터는 Windows 작업 스케줄러를 사용하여 크롤링 일정을 예약합니다. FAST Search 웹 크롤러에 대한 크롤링 일정을 예약하려면 XML 구성 파일에서 매개 변수를 설정하면 됩니다.

추가 크롤링 일정을 예약하기 전에 수동으로 시작한 전체 크롤링을 완료하는 것이 좋습니다. 이렇게 해야 전체 크롤링을 수행하는 데 걸린 시간을 파악하여 초기 크롤링이 끝나기 전에 새 크롤링이나 증분 크롤링이 시작되지 않도록 할 수 있습니다.

See Also

Concepts

Plan to deploy FAST Search specific connectors (FAST Search Server 2010 for SharePoint)