검색에 대한 메타데이터 속성 계획(SharePoint Server 2010)

 

적용 대상: SharePoint Server 2010

마지막으로 수정된 항목: 2012-01-30

이 문서에서는 Microsoft SharePoint Server 2010에서 검색용으로 메타데이터 속성을 계획하는 방법을 설명합니다. 콘텐츠를 크롤링할 때 크롤러는 해당 콘텐츠와 연결된 메타데이터, 즉 작성자, 제목, 전자 메일 주소 등의 정보도 크롤링합니다. 검색 시스템은 이 정보를 크롤링 속성관리 속성으로 저장합니다. 크롤링 속성은 모두 크롤링 중에 문서에서 추출되는 작성자, 제목, 주제 등의 속성입니다. 관리 속성은 구체화된 검색이나 고급 검색에서 표시될 수 있는 크롤링 속성입니다. 사용자가 일반 검색을 수행하면 결과에는 크롤링 속성이 있는 항목이 포함됩니다. 그러나 사용자에게 구체화된 검색 기능을 제공하려면 관리 속성을 계획해야 합니다. 관리 속성은 구체화된 검색에 표시될 수 있으므로 사용자가 보다 성공적으로 관련성이 높은 쿼리를 수행할 수 있도록 합니다. SharePoint Server 2010에서는 기본 관리 속성 집합을 제공하지만, 새 관리 속성을 만들고 크롤링 속성을 검색 결과에 표시할 관리 속성에 매핑할 수 있습니다.

구체화된 검색은 관리 속성에 대해서만 수행할 수 있으며 크롤링 속성에 대해서는 수행할 수 없습니다. 구체화된 검색 쿼리에 크롤링 속성을 사용할 수 있도록 하려면 크롤링 속성을 관리 속성에 매핑해야 합니다. 여러 크롤링 속성을 단일 관리 속성에 매핑하거나, 단일 크롤링 속성을 여러 관리 속성에 매핑할 수 있습니다. 관리 속성 하나에 크롤링 속성 여러 개가 매핑되어 있으며 한 문서에 여러 크롤링 속성의 값이 포함된 경우, 속성이 매핑되는 순서와 해당 우선 순위에 따라 관리 속성의 값이 결정됩니다.

예를 들어 서로 다른 세 문서에서 작성자를 식별하는 속성의 이름이 각기 다를 수 있습니다. 한 문서 종류에는 이 속성이 Author일 수 있으며, 다른 문서에는 각각 Writer와 Property3일 수 있습니다. 이들 세 속성은 모두 크롤링 속성이지만 사용자가 작성자를 기준으로 쿼리하면 Author 속성의 문서만 검색 결과에 나타납니다(예: 검색 상자에 author:John Smith 입력). 다른 속성 이름을 포함하는 문서가 구체화된 검색 결과에 나타나도록 하려면 이러한 크롤링 속성을 각각 Author 관리 속성에 매핑해야 합니다.

이 문서의 내용:

  • 관리 속성

  • 중복되는 관리 속성의 수 줄이기

  • 정보 아키텍처에서 주요 개념에 대해 속성 추가

  • 시나리오

관리 속성

유용한 관리 속성 집합을 만들려면 가장 중요한 콘텐츠를 분석하여 해당 콘텐츠에서 관리 속성에 매핑할 수 있는 메타데이터를 찾습니다.

콘텐츠를 먼저 크롤링하지 않으면 콘텐츠의 속성을 검색하기 어렵습니다. 따라서 각 사이트 모음에 포함될 콘텐츠가 무엇인지 확인하기 전까지는 관리 속성 계획을 기다리는 것이 좋습니다. 그런 다음 테스트 서버를 사용하여 모든 콘텐츠를 크롤링할 수 있습니다. 크롤링 후에는 관리 속성을 만들 때 정보 아키텍처에 대해 비교할 크롤링 속성 목록이 준비됩니다. 시스템 크롤링 후에도 속성을 매핑하기는 어려울 수 있습니다. 왜냐하면 속성을 사용하는 콘텐츠 형식 또는 응용 프로그램을 식별하기가 어렵기 때문입니다. 특정 속성이 확실하지 않으면 테스트 환경에서 매핑을 설정하고 이 속성에 대한 검색을 통해 속성을 실험해볼 수 있습니다.

가장 유용한 관리 속성은 대부분 SharePoint Server 2010 설치 시 자동으로 만들어집니다. 이러한 관리 속성을 기반으로 하여 다른 관리 속성을 계획할 수 있습니다. 자동으로 만들어지는 속성은 다음과 같습니다.

  • 작성자

  • 설명

  • 사이트 이름

  • 형식

  • 파일 크기

  • 마지막 수정 날짜

  • URL

  • 제목

속성을 사용하여 효율적으로 검색하려면 크롤링 속성에 먼저 값을 할당해야 합니다. 예를 들어 Microsoft Word 2010 문서에 Author 속성(Author 관리 속성에 매핑됨)이 있는데 해당 문서에서 Author 속성에 대해 값이 할당되지 않은 경우에는 사용자가 Author 속성을 사용하여 쿼리할 때 검색 결과에 해당 문서가 표시되지 않습니다. 구체화된 검색에 대해 최상의 결과를 보장하려면 문서 메타데이터 계획을 포함하는 엔터프라이즈 콘텐츠 관리 솔루션을 구현할 수 있습니다. 문서 메타데이터 계획에 대한 자세한 내용은 관리되는 메타데이터 계획(SharePoint Server 2010)콘텐츠 형식 및 워크플로 계획(SharePoint Server 2010)을 참조하십시오. 엔터프라이즈 콘텐츠 관리 솔루션 계획에 대한 자세한 내용은 엔터프라이즈 콘텐츠 관리 계획(SharePoint Server 2010)을 참조하십시오.

메타데이터 속성 관리에 대한 자세한 내용은 검색에 대한 메타데이터 속성 관리(SharePoint Server 2010)를 참조하십시오.

중복되는 관리 속성의 수 줄이기

일부 기본 속성은 다른 형식의 콘텐츠에서는 다른 크롤링 속성으로 표시될 수 있습니다. 예를 들어 Owner, Writer, Created By 크롤링 속성은 모두 Author의 동의어입니다. 이러한 속성에 대해 수행할 수 있는 가장 중요한 작업은 중복 항목을 줄이는 것입니다. 즉, 관리 속성 집합 하나를 만든 다음 관리 속성과 의미가 동일한 크롤링 속성을 매핑하도록 계획합니다. 이 경우 Owner, Writer 및 Created By 속성을 Author 관리 속성에 매핑합니다.

크롤링 중에 여러 속성이 발견되면 우선 순위가 가장 높은 속성 값만 관리 속성을 사용하는 쿼리에 사용되도록 여러 크롤링 속성의 우선 순위를 지정할 수 있습니다. 크롤링 속성의 우선 순위를 지정하지 않으면 관리 속성에 매핑되는 모든 크롤링 속성의 값이 쿼리에 사용됩니다. 이 경우 관리 속성이 다중값을 포함하게 됩니다. 즉, 쿼리와 일치하는 매핑된 속성의 값을 포함하는 모든 콘텐츠에 대해 결과가 반환됩니다. 단일 값 속성의 경우 가장 일반적인 크롤링 속성을 관리 속성으로 선택하고, 등장 빈도를 기준으로 관리 속성 우선 순위를 지정하는 것이 적절합니다. 가장 자주 크롤링되는 속성을 확인하기가 항상 쉬운 것은 아니지만, 이미 알고 있는 속성이 자주 사용되는 응용 프로그램에 연결되도록 우선 순위를 지정하는 전략을 사용할 수 있습니다. 예를 들어 Microsoft Office 2010 문서는 Author, Title, Company, Type 등의 기본 속성 집합을 포함합니다. 대부분의 사용자가 Microsoft Office 2010을 사용하고 콘텐츠 집합에 다른 응용 프로그램에서 만든 문서도 포함되어 있는 경우, 다른 응용 프로그램에서 만든 문서의 속성을 Office 2010 문서의 속성에 매핑할 수 있습니다. 다른 응용 프로그램에서 만든 문서에 Writer라는 속성이 포함된 경우 이 속성을 Author라는 관리 속성에 매핑할 수 있습니다.

속성을 매핑할 때는 정확히 일치하지 않거나 관련성이 떨어지는 속성을 매핑하지 않도록 주의해야 합니다. 매핑이 부정확하면 검색 결과의 관련성이 낮아지기 때문입니다. 예를 들어 Last saved by 속성을 Author 관리 속성에 매핑하는 경우 검색 결과의 관련성이 낮아질 수 있습니다. 가능하면 초기 배포 전에 관리 속성에 대해 검색을 테스트하고, 일반 작업 중에 검색 쿼리의 사용 현황 데이터를 검토하여 매핑한 속성을 미세 조정하도록 계획하십시오. 검색 쿼리의 사용 현황 데이터 검토에 대한 자세한 내용은 Web Analytics 보고서 보기(SharePoint Server 2010)를 참조하십시오.

정보 아키텍처에서 주요 개념에 대해 속성 추가

기본적으로 관리 속성에 매핑되는 크롤링 속성 이외에, 다른 크롤링 속성도 기존 관리 속성에 의해 캡처되는 정보 아키텍처의 개념에 명확하게 매핑될 수 있습니다. 예를 들어 조직에서 고객 서비스를 정보 아키텍처의 주요 비즈니스 프로세스로 지정할 수 있습니다. 정보 아키텍처에서 고객 서비스와 연관된 주요 개념으로는 고객, 고객 서비스 담당자, 고객 서비스 지역 등이 있습니다.

정보 아키텍처의 각 개념에 대해, 관리 속성에 매핑 가능한 해당 개념을 나타내는 크롤링 속성이 있는지를 파악하십시오. 이러한 속성이 있는 경우 해당 속성을 관리 속성으로 만듭니다.

시나리오

기간 업무(LOB) 응용 프로그램은 고객 및 직원 데이터를 추적하고, 해당 데이터의 속성은 비즈니스 데이터 카탈로그에 등록되어 비즈니스 데이터 콘텐츠 원본의 일부로 크롤링된 후 관리 속성에 대한 후보가 될 수 있습니다. 또한 이러한 관리 속성에 매핑할 응용 프로그램에 대한 크롤링 속성을 찾을 수도 있습니다. 개별 데이터 응용 프로그램의 고객 서비스 담당자 ID 속성이나 고객 서비스 담당자에 의해서만 사용되는 응용 프로그램 유형에 대한 작성자 속성을 예로 들 수 있습니다. 해당 속성 또는 해당 속성과 연관된 용어를 사용하는 검색 쿼리는 고객 서비스 담당자 ID 관리 속성에 매핑된 크롤링 속성이 포함되는 모든 항목에 대한 검색 결과를 포함합니다.

정보 아키텍처에서 확인되는 각 주요 비즈니스 프로세스에는 관리 속성이 될 가능성이 높은 속성을 검색하는 데 사용할 수 있는 비즈니스 데이터 응용 프로그램 또는 연관 파일 형식 집합이 포함됩니다.

정보 아키텍처의 개념 대부분은 속성을 통해 표시되지 않지만, 이러한 개념은 사이트 구조 계획 및 기타 검색 기능을 구현할 때 유용합니다. 정보 아키텍처에서는 사용자가 간과한 관리 속성을 찾아낼 수 있습니다. 그러나 정보 아키텍처에 개념이 나와 있다고 해서 해당 개념에 대한 관리 속성이 있는 것은 아닙니다.

See Also

Concepts

현재 검색 환경 정보 수집(SharePoint Server 2010)
엔터프라이즈 검색 팀 및 이해 관계자 결정(SharePoint Server 2010)
크롤링 및 연결 계획(SharePoint Server 2010)
엔터프라이즈 검색용 토폴로지 계획(SharePoint Server 2010)
Plan people search (SharePoint Server 2010)
검색 범위 계획(SharePoint Server 2010)