동의어 사전 파일 관리(SharePoint Server 2010)

 

적용 대상: SharePoint Server 2010

마지막으로 수정된 항목: 2015-03-09

검색 관리자는 동의어 사전 파일을 사용하여 검색 쿼리에 나오는 단어나 구에 대해 대체 단어 또는 동의어를 지정할 수 있습니다.

  • 쿼리 단어 또는 구의 대체 단어 지정   검색 관리자는 사용자가 검색 상자에 입력할 수 있는 특정 단어나 구에 대해 대체 단어로 사용할 단어나 구를 하나 이상 지정할 수 있습니다. 예를 들어 관리자는 "Longhorn"이라는 용어가 쿼리에 나올 때마다 검색 시스템에서 해당 용어를 "Windows Vista" 또는 "Vista"로 바꾸도록 지정할 수 있습니다. 마찬가지로, 관리자는 "NT5" 또는 "W2K"라는 용어가 쿼리에 나올 때마다 검색 시스템에서 해당 용어를 "Windows 2000"으로 바꾸도록 지정할 수 있습니다.

    쿼리 단어나 구의 대체 단어를 지정하려는 검색 관리자는 동의어 사전 파일에 대체 단어 집합을 삽입합니다. 자세한 내용은 이 문서 뒷부분의 대체 단어 집합 사용을 참조하십시오.

  • 쿼리 단어 또는 구의 동의어 지정   검색 관리자는 사용자가 검색 상자에 입력할 수 있는 특정 단어나 구에 대해 동의어로 사용할 단어나 구를 하나 이상 지정할 수 있습니다. 예를 들어 관리자는 "IE", "IE8" 및 "Internet Explorer"를 모두 동의어로 지정할 수 있습니다. 이러한 용어 중 하나가 쿼리에 나타나면 시스템에서는 다른 용어도 검색합니다. 따라서 이 세 용어 중 하나를 쿼리하면 "IE", "IE8" 또는 "Internet Explorer"가 포함된 검색 결과가 반환됩니다.

    쿼리 단어나 구의 동의어를 지정하려는 검색 관리자는 동의어 사전 파일에 확장 집합을 삽입합니다. 자세한 내용은 이 문서 뒷부분의 확장 집합 사용을 참조하십시오.

이 문서의 내용

  • 동의어 사전 파일 이해

  • 대체 단어 집합 사용

  • 확장 집합 사용

  • 동의어 사전 파일이 포함된 사용자 지정 사전 사용

  • 동의어 사전 파일 편집

  • 언어별 동의어 사전 파일

동의어 사전 파일 이해

Microsoft SharePoint Server 2010 설치 프로그램은 제품이 지원하는 각 언어에 대해 동의어 사전 파일을 설치합니다. 또한 설치 시에는 언어 중립 동의어 사전 파일(tsnew.xml)도 제공됩니다. 이 파일은 쿼리 언어에 해당하는 동의어 사전 파일이 있는지 여부에 관계없이 쿼리 처리 중에 모든 쿼리에 적용됩니다. 자세한 내용은 이 문서 뒷부분의 언어별 동의어 사전 파일을 참조하십시오.

기본적으로 SharePoint Server 2010을 설치하면 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Config에 지원되는 모든 언어에 대한 동의어 사전 파일이 설치됩니다. 검색 관리자가 Search Service 응용 프로그램을 만들면 검색 시스템에서는 동의어 사전 파일(관리자가 편집한 동의어 사전 파일 포함)을 설치 위치에서 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Applications\GUID-query-0\Config로 복사합니다. 여기서 GUID는 새 Search Service 응용 프로그램의 GUID입니다. 검색 시스템에서는 새 Search Service 응용 프로그램을 실행하는 모든 쿼리 서버에서 같은 작업을 수행합니다. 따라서 해당 Search Service 응용 프로그램을 실행하는 각 쿼리 서버에는 각 동의어 사전 파일의 복사본이 하나씩 저장됩니다.

설치된 각 동의어 사전 파일에는 주석 처리된 비활성 예제 콘텐츠만 포함되어 있습니다. 따라서 동의어 사전 파일을 편집해야 검색 시스템에서 해당 파일을 사용할 수 있습니다. 대체 단어 집합과 확장 집합 외에, 동의어 사전 파일에는 악센트 등의 분음 부호를 검색 시스템에서 무시하는지 적용하는지를 지정하는 "diacritics_sensitive" 태그가 포함됩니다. 기본적으로 diacritics_sensitive는 0으로 설정되므로 분음 부호가 무시됩니다. 검색 시스템에서 분음 부호를 적용하도록 하려면 diacritics_sensitive의 값을 1로 변경합니다.

아래 예제에는 동의어 사전 파일의 기본 XML이 나와 있습니다.

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE8</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>run</sub>
            <sub>jog</sub>
        </expansion>
    </thesaurus>
-->
</XML>

대체 단어 집합 사용

검색 관리자는 사용자가 검색 상자에 입력할 수 있는 특정 단어나 구에 대해 대체 단어로 사용할 하나 이상의 단어나 구를 지정하기 위해 대체 단어 집합을 동의어 사전 파일에 삽입합니다. 동의어 사전 파일의 각 대체 단어 집합은 <replacement> 태그로 묶여 있습니다. 관리자는 대체 단어 집합에서 하나 이상의 대체 원본 단어나 구를 각각 <pat>(패턴) 태그로 묶어 지정하며, 하나 이상의 대체 대상 단어를 각각 <sub>(대체) 태그로 묶어 지정합니다. 예를 들어 다음 대체 단어 집합은 "Longhorn"이라는 쿼리 용어를 "Windows Vista" 또는 "Vista"로 바꿉니다.

<replacement>
    <pat>Longhorn</pat>
    <sub>Windows Vista</sub>
    <sub>Vista</sub>
</replacement>

마찬가지로, 다음 예제에서는 쿼리 용어 "NT5" 및 "W2K"를 "Windows 2000"으로 바꾸도록 지정하는 대체 단어 집합을 보여 줍니다.

<replacement>
    <pat>W2K</pat>
    <pat>NT5</pat>  
    <sub>Windows 2000</sub>
</replacement>

검색 관리자는 패턴을 지정할 때 대체 단어를 비워 두는 방법으로 특정 용어에 대한 쿼리에서 결과가 반환되지 않도록 지정할 수 있습니다. 아래 예제에서는 "bugs"라는 용어를 쿼리하면 아무런 결과도 반환되지 않습니다.

<replacement>
    <pat>bugs</pat>    
    <sub></sub>
</replacement>

확장 집합 사용

검색 관리자는 동의어 사전 파일에서 확장 집합을 사용하여 하나 이상의 단어나 구를 서로 동의어로 지정할 수 있습니다. 확장 집합에 있는 단어나 구가 포함된 검색 쿼리는 해당 확장 집합의 모든 동의어를 포함하도록 확장됩니다. 따라서 확장 집합에 있는 단어나 구가 포함된 검색 쿼리는 해당 집합의 동의어도 포함된 검색 결과를 반환합니다.

각 확장 집합은 <expansion> 태그로 묶습니다. 관리자는 확장 집합에서 하나 이상의 동의어를 각각 <sub> 태그로 묶어 지정합니다. 예를 들어 검색 관리자가 writer, author, blogger의 세 용어를 동의어로 지정하는 확장 집합을 지정할 수 있습니다. 이 확장 집합을 지정하려면 검색 관리자는 동의어 사전 파일에 다음 줄을 추가합니다.

<expansion>
    <sub>writer</sub>
    <sub>author</sub>
    <sub>blogger</sub>
</expansion>

이 확장 집합은 세 용어 중 하나가 포함된 쿼리를 실행하면 나머지 두 용어 중 하나 또는 두 개도 포함된 검색 결과가 반환되도록 지정합니다.

동의어 사전 파일이 포함된 사용자 지정 사전 사용

지정된 언어의 단어 분리기는 해당 언어의 어휘 규칙에 따라 단어의 경계를 결정하여 검색 쿼리의 개별 단어를 식별합니다. 단어 분리기가 단일 단어로 인식할 수 없는 단어를 동의어 사전 파일에 포함하는 경우에는 단어 분리기가 해당 단어를 더 작은 토큰 여러 개로 분리하지 않도록 사용자 지정 사전에도 해당 단어를 포함해야 합니다. 예를 들어 확장 집합에서 "IT&T"라는 용어를 사용하는데 사용자 지정 사전에는 해당 용어를 포함하지 않으면 단어 분리기가 이 용어를 개별 용어 3개, 즉 "IT", "&", "T"로 분리할 수 있습니다. 이로 인해 사용자가 "IT&T"에 대한 검색 쿼리를 실행할 때 동의어 사전 파일의 확장 집합이 예상대로 작동하지 않을 수 있습니다. 사용자 지정 사전을 만들고 사용하는 방법에 대한 자세한 내용은 사용자 지정 사전 만들기(SharePoint Server 2010)를 참조하십시오.

동의어 사전 파일 편집

설치 위치에서 동의어 사전 파일을 편집하면 검색 시스템에서 편집된 동의어 사전 파일을 편집 이후에 만드는 Search Service 응용 프로그램에 자동으로 전파합니다. 그러나 기존 Search Service 응용 프로그램에는 편집된 동의어 사전 파일이 자동 전파되지는 않습니다. 변경 내용을 적용할 각 기존 Search Service 응용 프로그램에 대해, 해당 Search Service 응용 프로그램을 실행하는 각 쿼리 서버에서 편집한 파일을 Search Service 응용 프로그램 폴더에 수동으로 복사해야 합니다.

참고

  • 이름이 tsschema.xml인 파일이 동의어 사전 파일과 같은 디렉터리에 설치됩니다. tsschema.xml 파일은 다른 모든 동의어 사전 파일에 사용되므로 수정하지 마십시오. 이 파일을 변경하면 예상치 못한 결과가 발생할 수 있습니다.

  • <pat> 또는 <sub> 태그는 동의어 사전 파일에서 한 항목으로 계산됩니다. 일반적인 동의어 사전 파일에는 약 1,000개의 항목이 포함됩니다. 성능상의 이유로, 동의어 사전 파일 하나의 항목 수는 10,000개를 초과하지 않아야 합니다.

  • 중지 단어 파일에 지정된 단어를 동의어 사전 파일에 사용하는 경우 검색 시스템에서 해당 단어를 동의어 사전 파일에서 걸러냅니다. 자세한 내용은 중지 단어 파일 관리(SharePoint Server 2010)를 참조하십시오.

  • 동의어 사전 파일 항목에 특수 문자만 포함할 수는 없습니다.

다음 절차에 따라 동의어 사전 파일을 편집합니다.

참고

파일을 편집할 때는 파일의 각 항목 앞뒤에 일치하는 여는 태그와 닫는 태그 쌍을 사용해야 합니다. 동의어 사전 파일의 XML 태그가 정확하게 일치하지 않으면 응용 프로그램 이벤트 로그에 오류가 기록됩니다.

동의어 사전 파일을 편집하려면

  1. 이 절차를 수행하는 사용자 계정이 로컬 컴퓨터에서 Administrators 그룹의 구성원인지 확인합니다.

  2. 텍스트 편집기에서 동의어 사전 파일을 엽니다. 해당하는 동의어 사전 파일을 찾고 식별하는 방법에 대한 자세한 내용은 이 문서 앞부분의 동의어 사전 파일 이해를 참조하십시오.

  3. 동의어 사전 파일을 처음으로 변경하는 경우 파일 첫부분의 <!-- Commented out 주석 줄과 끝부분의 --> 주석 줄을 제거합니다.

  4. 동의어 사전 파일을 필요한 대로 편집합니다.

  5. 동의어 사전 파일을 저장합니다.

    참고

    동의어 사전 파일을 저장할 때는 항상 기본 인코딩 값(유니코드)을 사용하십시오.

SharePoint Server Search 14 서비스 다시 시작

동의어 사전 파일을 편집한 후에는 SharePoint Server Search 14 서비스를 다시 시작해야 변경 내용이 적용됩니다. SharePoint Server Search 14 서비스를 다시 시작하고 나면 동의어 사전 파일 변경 내용이 적용됩니다. 변경 내용을 적용하기 위해 크롤링을 수행할 필요는 없습니다.

SharePoint Server Search 14 서비스를 다시 시작하려면

  1. 이 절차를 수행하는 사용자 계정이 로컬 컴퓨터에서 Administrators 그룹의 구성원인지 확인합니다.

  2. 시작을 클릭하고 관리 도구를 가리킨 다음 서비스를 클릭합니다.

  3. SharePoint Server Search 14를 마우스 오른쪽 단추로 클릭하고 다시 시작을 클릭합니다.

    SharePoint Server Search 14 서비스를 다시 시작하고 나면 동의어 사전 파일 변경 내용이 적용됩니다.

언어별 동의어 사전 파일

아래의 동의어 사전 파일이 자동으로 설치되며 바로 사용 가능합니다.

언어 파일 이름

언어 중립

tsneu.xml

아랍어

tsara.xml

벵골어

tsben.xml

불가리아어

tsbul.xml

카탈로니아어

tscat.xml

중국어(간체)

tschs.xml

중국어(번체)

tscht.xml

크로아티아어

tscro.xml

체코어

tsces.xml

덴마크어

tsdan

네덜란드어(네덜란드)

tsnld.xml

영어(영국)

tseng.xml

영어(미국)

tsenu.xml

핀란드어

tsfin.xml

프랑스어(표준)

tsfra.xml

독일어(표준)

tsdeu.xml

구자라트어

tsguj.xml

헝가리어

tshun.xml

아이슬란드어

tsice.xml

인도네시아어

tsind.xml

이탈리아어

tsita.xml

일본어

tsjpn.xml

카나다어

tskan.xml

한국어

tskor.xml

리투아니아어

tslit.xml

말레이어(말레이시아)

tsmal.xml

말라얄람어

tsmly.xml

마라티어

tsmar.xml

노르웨이어(복말)

tsnor.xml

폴란드어

tsplk.xml

포르투갈어(브라질)

tsptb.xml

포르투갈어(포르투갈)

tspor.xml

펀잡어

tspun.xml

루마니아어

tsrom.xml

러시아어

tsrus.xml

세르비아어(키릴 자모)

tssbc.xml

세르비아어(라틴 문자)

tssbl.xml

슬로바키아어

tssvk.xml

슬로베니아어

tsslo.xml

스페인어

tsesn.xml

스웨덴어

tssve.xml

타밀어

tstam.xml

텔루구어

tstel.xml

태국어

tstha.xml

터키어

tstur.xml

우크라이나어

tsukr.xml

우르두어(파키스탄)

tsurd.xml

베트남어

tsvie.xml

See Also

Concepts

사용자 지정 사전 만들기(SharePoint Server 2010)
중지 단어 파일 관리(SharePoint Server 2010)