동의어 사전 파일 편집(Office SharePoint Server)

업데이트 날짜: 2008년 12월

적용 대상: Office SharePoint Server 2007

 

마지막으로 수정된 항목: 2015-03-09

동의어 사전 파일은 Microsoft Office SharePoint Server 2007의 쿼리 확장 검색 기능으로서 사용자가 검색 상자에 구를 입력하면 입력된 구와 관련된 단어의 결과를 반환합니다. 예를 들어 동의어 사전 파일에서 "뛰다"와 "달리다"가 서로 연관되어 있는 경우 "뛰다"라는 단어를 검색하면 "뛰다"와 "달리다", 두 단어 중 하나라도 포함하고 있는 결과가 반환됩니다. 동의어 사전 파일 내에서는 대체 집합을 사용하여 다른 값으로 대체되는 패턴을 지정하고, 확장 집합을 사용하여 지정된 패턴과 같은 의미의 추가 값이 반환되도록 합니다.

이 문서의 내용

  • 동의어 사전 파일 이해

  • 대체 집합 사용

  • 확장 집합 사용

  • 동의어 사전 파일 편집

  • 언어별 동의어 사전 파일 목록

동의어 사전 파일 이해

Microsoft Office SharePoint Server 2007이 설치될 때 Office SharePoint Server 2007에서 지원하는 각 언어에 대한 동의어 사전 파일이 중립 동의어 사전 파일 tsneu.xml과 함께 자동으로 포함됩니다. 중립 tsneu.xml 동의어 사전 파일은 쿼리 언어와 연결된 동의어 사전 파일이 없는 쿼리에 적용됩니다. 중립 동의어 사전 파일은 쿼리에 항상 적용됩니다. 쿼리 언어와 연결된 특정 동의어 사전 파일이 있는 경우에도 마찬가지입니다. 자세한 내용은 "언어별 동의어 사전 파일 목록" 섹션을 참조하십시오.

기본적으로 동의어 사전 파일은 쿼리 서버의 드라이브:\Program Files\Microsoft Office Servers\12.0\Data\Config에 생성 및 저장됩니다. 이 기본 위치에 있는 동의어 사전 파일이 쿼리 서버에 있는 각 Microsoft Search 서비스 인스턴스의 드라이브:\Program Files\Microsoft Office Servers\12.0\Data\Office Server\Applications\<응용 프로그램 UID>\Config 폴더로 복사됩니다. 여기서 *<응용 프로그램 UID>*는 특정 공유 서비스 공급자와 연관된 GUID입니다.

참고

기본 위치에서 동의어 사전 파일을 수정하면 새 SSP(공유 서비스 공급자)가 생성될 때마다 수정된 버전의 파일이 자동으로 복사됩니다. SSP가 생성된 후에 기본 위치에서 동의어 사전 파일을 수정하는 경우에는 기본 위치에 있는 파일을 이미 존재하는 각 SSP의 지정된 디렉터리로 복사해야 합니다.

중요

tsschema.xml이라는 파일이 동의어 사전 파일과 같은 디렉터리에 설치됩니다. tsschema.xml 파일을 수정하지 마십시오. 이 파일은 다른 모든 동의어 사전 파일에서 참조합니다. 따라서 이 파일을 변경하면 검색이 제대로 작동하지 않게 됩니다.

기본적으로 각 동의어 사전 파일은 비활성 예제 콘텐츠를 포함하고 있습니다. 동의어 사전 파일을 검색에서 사용하려면 먼저 편집해야 합니다. 동의어 사전 파일에는 대체 집합과 확장 집합이라는 두 가지 기본적인 항목 유형이 있습니다. 이러한 항목에 대해서는 이 도움말의 뒷부분에 있는 섹션에서 자세히 설명할 예정입니다. 세 번째 항목 유형인 diacritics_sensitive는 악센트와 같은 분음 부호를 검색 중에 무시해야 하는지 또는 적용해야 하는지를 지정합니다. 기본적으로 분음 부호는 무시되므로 이 값은 0으로 설정되어 있습니다. 검색 시 분음 부호를 적용하려면 이 값을 1로 변경하십시오.

다음은 동의어 사전 파일에 있는 기본 XML의 예입니다.

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE5</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>뛰다</sub>
            <sub>달리다</sub>
        </expansion>
    </thesaurus>
-->
</XML>

중요

성능 측면을 고려할 때는 동의어 사전 파일에 몇 개의 항목이 정의되어 있는지를 파악하고 있고 항목 수가 1,000/10,000(일반/최대)을 초과하지 않도록 하는 것이 중요합니다. 항목 개수를 파악할 때 각 <pat> 또는 <sub> 태그도 하나의 정의된 항목으로 계산된다는 점에 유의해야 합니다.

동의어 사전 파일에 추가하는 항목에 특수 문자만 포함할 수는 없습니다. 하지만 빈 항목은 가능합니다. 예를 들어 특정 단어에 대한 쿼리가 아무런 결과도 반환하지 않도록 하려면 항목을 변경하십시오. 다음 예제에서는 “windows”라는 단어에 대한 쿼리가 아무런 결과도 반환하지 않습니다.

<replacement>
    <pat>windows</pat>
    <sub></sub>
</replacement>

동의어 사전 파일에 의미 없는 단어가 포함될 수 있습니다. 하지만 의미 없는 단어 파일도 사용하는 경우에는 이후 단계에서 필터링됩니다. 자세한 내용은 의미 없는 단어 파일 편집(Office SharePoint Server)을 참조하십시오.

대체 집합 사용

대체 집합은 검색 쿼리에서 하나 이상의 대체 항목으로 교체되는 패턴을 지정합니다. 예를 들어 “W2K”가 패턴이고 “Windows 2000”이 대체 항목인 대체 집합을 추가할 수 있습니다. “W2K” 용어에 대해 쿼리할 경우 Office SharePoint Server 2007에서는 “Windows 2000” 용어가 포함된 검색 결과만 반환합니다. 검색 결과에서 “W2K” 단어가 포함된 항목은 반환되지 않습니다.

각 대체 집합은 <replacement> 태그로 둘러싸여 있습니다. 대체 태그 안에서 패턴 앞뒤에 <pat> 태그를 넣어 하나 이상의 패턴을 지정하고, 대체 항목 앞뒤에 <sub> 태그를 넣어 하나 이상의 대체 항목을 지정합니다. 패턴 및 대체 항목은 한 단어 또는 일련의 단어를 포함할 수 있습니다. 예를 들어 “W2K”가 패턴이고 “Windows 2000”이 대체 항목인 대체 집합을 추가하려면 다음을 사용하십시오.

<replacement>
    <pat>W2K</pat>
    <sub>Windows 2000</sub>
</replacement>

지정하는 각 패턴에 대해 여러 개의 대체 항목이 있을 수 있습니다.

참고

이상적으로는 모든 사람이 같은 의미라는 것을 알고 있는 용어로 대체 집합을 사용해야 합니다. 예를 들어 내부에서 사용한 제품 이름과 같이 더 이상 사용되지 않는 용어를 출시되는 제품 이름과 같은 다른 용어로 쿼리에서 바꿔야 하는 경우를 생각해 보십시오.

확장 집합 사용

확장 집합은 서로 동의어 관계인 대체 항목의 그룹입니다. 한 대체 항목과 일치하는 항목이 포함되어 있는 쿼리는 확장 집합 내에 있는 다른 모든 대체 항목을 포함하도록 확장됩니다. 예를 들어 다음 대체 항목이 동의어인 확장 집합을 추가할 수 있습니다.

  • 작성자

  • 저자

  • 기록자

“저자”라는 단어를 쿼리하는 경우 Office SharePoint Server 2007에서는 “작성자” 및 “기록자”를 포함하고 있는 검색 결과도 반환합니다.

각 확장 집합은 <expansion> 태그로 둘러싸여 있습니다. <expansion> 태그 안에서 앞뒤에 <sub> 태그를 넣어 하나 이상의 대체 항목을 지정합니다. 예를 들어 이전 예제에서 다음 줄을 추가합니다.

<expansion>
    <sub>작성자</sub>
    <sub>저자</sub>
    <sub>기록자</sub>
</expansion>

동의어 사전 파일에 개별 단어 또는 구를 포함할 수 있습니다. 해당 언어의 단어 분리기는 언어의 사전 규칙을 기준으로 단어 경계를 결정하여 개별 단어를 식별합니다. 단어 분리기가 한 단어로 인식하지 않는 단어를 동의어 사전 파일에 포함하는 경우에는 단어 분리기가 해당 단어를 보다 작은 토큰으로 분할하지 않도록 사용자 지정 사전에도 단어를 넣어야 합니다. 예를 들어 확장 집합에서 “IT&T”라는 단어를 사용하지만 이 단어를 사용자 지정 사전에 넣지 않는 경우에는 단어 분리기가 해당 단어를 “IT”와 “T”라는 두 개의 개별 단어로 분할할 수 있습니다. 이로 인해 검색 쿼리를 수행할 때 확장 집합이 예상대로 작동하지 않을 수 있습니다. 사용자 지정 사전을 만들고 사용하는 방법에 대한 자세한 내용은 사용자 지정 사전 만들기(Office SharePoint Server 2007)를 참조하십시오.

동의어 사전 파일 편집

다음 절차에 따라 동의어 사전 파일을 편집합니다.

중요

파일을 편집할 때는 파일에 있는 각 항목의 앞뒤에 여는 태그와 닫는 태그 쌍을 올바르게 사용해야 합니다. 동의어 사전 파일에서 XML 태그의 쌍이 맞지 않으면 응용 프로그램 이벤트 로그에 오류가 로깅됩니다.

동의어 사전 파일 편집

  1. 메모장을 시작한 다음 동의어 사전 파일을 엽니다. 해당하는 동의어 사전 파일을 찾고 식별하는 방법에 대한 자세한 내용은 "동의어 사전 파일 이해" 섹션을 참조하십시오.

  2. 동의어 사전 파일을 처음 변경하는 경우에는 파일 시작 부분에 있는 <!-- Commented out 주석 줄과 파일 끝에 있는 --> 주석 줄을 제거합니다.

  3. 동의어 사전 파일을 변경합니다. 대체 집합 또는 확장 집합을 추가, 수정 또는 삭제합니다.

  4. 동의어 사전 파일을 저장한 다음 메모장을 닫습니다.

언어별 동의어 사전 파일 목록

언어 파일 이름

아랍어

tsara.xml

벵골어

tsben.xml

불가리아어

tsbul.xml

카탈로니아어

tscat.xml

중국어(간체)

tschs.xml

중국어(번체)

tscht.xml

크로아티아어

tscro.xml

네덜란드어(네덜란드)

tsnld.xml

영어(영국)

tseng.xml

영어(미국)

tsenu.xml

핀란드어

tsfin.xml

프랑스어

tsfra.xml

독일어

tsdeu.xml

구자라트어

tsguj.xml

히브리어

tsheb.xml

힌디어

tshin.xml

아이슬란드어

tsice.xml

인도네시아어

tsind.xml

이탈리아어

tsita.xml

일본어

tsjpn.xml

카나다어

tskan.xml

한국어

tskor.xml

라트비아어

tslat.xml

리투아니아어

tslit.xml

말레이어

tsmal.xml

말라얄람어

tsmly.xml

마라티어

tsma.xml

언어 중립

tsneu.xml

노르웨이어(복말)

tsnor.xml

폴란드어

tsplk.xml

폴란드어

tspol.xml

포르투갈어(브라질)

tsptb.xml

포르투갈어(포르투갈)

tspor.xml

펀자브어

tspun.xml

루마니아어

tsrom.xml

러시아어

tsrus.xml

세르비아어(키릴 자모)

tssbc.xml

세르비아어(라틴 문자)

tssbl.xml

슬로바키아어

tssvk.xml

슬로베니아어

tsslo.xml

스페인어

tsesn.xml

스웨덴어

tssve.xml

타밀어

tstam.xml

텔루구어

tstel.xml

태국어

tstha.xml

터키어

tstur.xml

우크라이나어

tsukr.xml

우르두어(파키스탄)

tsurd.xml