중지 단어 파일 관리(SharePoint Server 2010)

 

적용 대상: SharePoint Server 2010

마지막으로 수정된 항목: 2015-03-09

중지 단어(의미 없는 단어)는 검색 시스템이 최종 사용자 검색 쿼리에서 무시하는 단어입니다. 특정 언어에서 너무 많이 나와서 검색 결과를 식별하거나 범위를 좁히는 데 도움이 되지 않는 단어는 중지 단어로 지정할 수 있습니다. 영어에서는 보통 "an", "the" 등의 관사가 중지 단어로 지정됩니다. 예를 들어 사용자가 영어 쿼리 "the highest mountain"을 입력하는 경우 "the"가 중지 단어이면 쿼리에서 "the"가 제거되어 쿼리는 "the highest mountain"이 됩니다. 비속어도 중지 단어로 지정될 수 있습니다.

이 문서의 내용

중지 단어 파일 이해

지정된 언어의 중지 단어는 해당 언어의 중지 단어 파일에 나열됩니다. Microsoft SharePoint Server 2010 설치 프로그램은 제품이 지원하는 각 언어에 대해 중지 단어 파일을 하나씩 자동으로 설치합니다. 설치 후 대부분의 중지 단어 파일에는 연결된 언어의 일반적인 몇 가지 중지 단어가 포함되어 있습니다. 예를 들어 기본적으로 영어(미국) 중지 단어 파일(noiseenu.txt)에는 a, and, is, in, it, of, the, to가 포함되어 있습니다. 제품 설치 후에 검색 관리자는 언제든지 검색 결과의 관련성을 높이거나 조직의 표준을 충족하기 위해 중지 단어 파일에 단어를 추가하거나 파일에서 단어를 제거할 수 있습니다. 중지 단어 파일에 단어를 추가하거나 파일에서 단어를 제거하는 방법에 대한 자세한 내용은 이 문서 뒷부분의 중지 단어 파일 편집을 참조하십시오. 지원되는 언어에 대한 자세한 내용은 이 문서 뒷부분의 언어별 중지 단어 파일을 참조하십시오.

쿼리 시에는 쿼리 언어의 단어 분리기가 해당 언어의 어휘 규칙을 기반으로 단어 경계를 확인하여 검색 쿼리의 개별 단어를 식별합니다. 그런 후에 단어 분리기는 중지 단어 파일에 나와 있는 단어를 쿼리에서 제거합니다.

기본적으로 지원되는 모든 언어의 중지 단어 파일은 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config에 설치됩니다. 팜 관리자가 Search Service 응용 프로그램을 만들면 검색 시스템에서는 중지 단어 파일을 설치 위치(검색 관리자가 편집한 중지 단어 포함)에서 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config로 자동 복사합니다. 여기서 GUID는 새 Search Service 응용 프로그램의 GUID입니다. 검색 시스템에서는 새 Search Service 응용 프로그램을 실행하는 모든 쿼리 서버에서 동일한 작업을 수행합니다. 따라서 해당 Search Service 응용 프로그램을 실행하는 각 쿼리 서버에는 각 중지 단어 파일의 복사본이 하나씩 저장됩니다.

중지 단어 파일 편집

설치 위치에서 중지 단어 파일을 편집하면 시스템에서 편집된 중지 단어 파일을 편집 이후에 만드는 Search Service 응용 프로그램에 자동으로 전파합니다. 그러나 기존 Search Service 응용 프로그램에는 편집된 중지 단어 파일이 자동 전파되지는 않습니다. 변경 내용을 적용할 각 기존 Search Service 응용 프로그램에 대해, 해당 Search Service 응용 프로그램을 실행하는 각 쿼리 서버에서 편집한 파일을 Search Service 응용 프로그램 폴더에 수동으로 복사해야 합니다.

참고

  • 중지 단어 파일을 삭제하면 검색 시스템에서 모든 단일 문자를 중지 단어로 간주하여 검색 결과에서 제거할 수 있습니다. 중지 단어 파일에는 항목이 하나 이상 포함되어야 하며, 마침표(.) 문자라도 포함해야 합니다.

  • 중지 단어 파일을 삭제한 후에 SharePoint Server Search 14 서비스를 다시 시작하면 검색 시스템에서는 동일한 이름의 파일을 %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config에서 파일을 삭제한 폴더에 복사하여 파일을 자동으로 바꿉니다.

다음 절차에 따라 중지 단어 파일을 편집합니다.

중지 단어 파일을 편집하려면

  1. 이 절차를 수행하는 사용자 계정이 로컬 서버 Administrators 그룹의 구성원인지 확인합니다.

  2. 텍스트 편집기에서 중지 단어 파일을 엽니다. 적절한 중지 단어 파일을 찾고 확인하는 방법에 대한 자세한 내용은 이 문서 앞부분의 중지 단어 파일 이해를 참조하십시오.

  3. 검색 시스템이 검색 쿼리에서 무시하도록 하려는 단어만 포함하도록 파일을 편집합니다.

  4. 중지 단어 파일을 저장합니다.

    참고

    중지 단어 파일을 저장할 때는 항상 기본 인코딩(유니코드)을 사용하십시오.

  5. 다음 단계를 실행하여 SharePoint Server Search 14 서비스를 다시 시작합니다.

    1. 시작을 클릭하고 관리 도구를 가리킨 다음 서비스를 클릭합니다.

    2. SharePoint Server Search 14를 마우스 오른쪽 단추로 클릭하고 다시 시작을 클릭합니다.

      SharePoint Server Search 14 서비스를 다시 시작하고 나면 중지 단어 변경 내용이 적용됩니다.

      참고

      Microsoft Office SharePoint Server 2007에서는 검색 시스템이 쿼리와 인덱스에서 중지 단어를 제외했습니다. 따라서 관리자가 중지 단어 파일에서 단어를 제거한 후에 전체 크롤링을 수행하여 크롤러에서 발견할 수 있는 해당 중지 단어 인스턴스를 인덱싱해야 했습니다. 반면, SharePoint Server 2010에서는 검색 시스템이 쿼리에서는 중지 단어를 제외하지만 인덱스에서는 제외하지 않습니다. 따라서 SharePoint Server 2010에서는 중지 단어 파일에서 단어를 제거한 후에 새 크롤링을 수행할 필요가 없습니다. 제거된 중지 단어는 크롤링 중에 발견된 경우 이미 인덱스에 포함되어 있기 때문입니다. 중지 단어 파일에 단어를 추가하는 경우에도 검색 시스템이 인덱스에서 중지 단어를 찾지 않기 때문에 새 크롤링을 수행할 필요가 없습니다.

언어별 중지 단어 파일

SharePoint Server 2010을 설치하면 다음 언어에 대해 중지 단어 파일이 설치됩니다. 특정 언어에 대한 중지 단어 파일이 없는 경우 검색 시스템은 중립 중지 단어 파일 noiseneu.txt를 사용합니다.

언어 중지 단어 파일 이름

아랍어

noiseara.txt

벵골어

noiseben.txt

불가리아어

noisebul.txt

카탈로니아어

noisecat.txt

체코어

noiseces.txt

중국어(간체)

noisechs.txt

중국어(번체)

noisecht.txt

크로아티아어

noisecro.txt

덴마크어

noisedan.txt

네덜란드어(네덜란드)

noisenld.txt

영어(영국)

noiseeng.txt

영어(미국)

noiseenu.txt

핀란드어

noisefin.txt

프랑스어

noisefra.txt

독일어

noisedeu.txt

그리스어

noisegrc.txt

구자라트어

noiseguj.txt

히브리어

noiseheb.txt

힌디어

noisehin.txt

헝가리어

noisehun.txt

아이슬란드어

noiseice.txt

인도네시아어

noiseind.txt

이탈리아어

noiseita.txt

일본어

noisejpn.txt

카나다어

noisekan.txt

한국어

noisekor.txt

언어 중립

noiseneu.txt

라트비아어

noiselav.txt

리투아니아어

noiselit.txt

말레이어

noisemal.txt

말라얄람어

noisemly.txt

마라티어

noisemar.txt

노르웨이어(복말)

noisenor.txt

폴란드어

noiseplk.txt

포르투갈어(포르투갈)

noisepor.txt

포르투갈어(브라질)

noiseptb.txt

펀잡어

noisepun.txt

루마니아어

noiserom.txt

러시아어

noiserus.txt

세르비아어(키릴 자모)

noisesbc.txt

세르비아어(라틴 문자)

noisesbl.txt

슬로바키아어

noisesvk.txt

슬로베니아어

noiseslo.txt

스페인어

noiseesn.txt

스웨덴어

noisesve.txt

타밀어

noisetam.txt

텔루구어

noisetel.txt

태국어

noisetha.txt

터키어

noisetur.txt

우크라이나어

noiseurk.txt

우르두어(파키스탄)

noiseurd.txt

베트남어

noisevie.txt