중지 단어 파일 관리(SharePoint Server 2010)
적용 대상: SharePoint Server 2010
마지막으로 수정된 항목: 2015-03-09
중지 단어(의미 없는 단어)는 검색 시스템이 최종 사용자 검색 쿼리에서 무시하는 단어입니다. 특정 언어에서 너무 많이 나와서 검색 결과를 식별하거나 범위를 좁히는 데 도움이 되지 않는 단어는 중지 단어로 지정할 수 있습니다. 영어에서는 보통 "an", "the" 등의 관사가 중지 단어로 지정됩니다. 예를 들어 사용자가 영어 쿼리 "the highest mountain"을 입력하는 경우 "the"가 중지 단어이면 쿼리에서 "the"가 제거되어 쿼리는 "the highest mountain"이 됩니다. 비속어도 중지 단어로 지정될 수 있습니다.
이 문서의 내용
중지 단어 파일 이해
지정된 언어의 중지 단어는 해당 언어의 중지 단어 파일에 나열됩니다. Microsoft SharePoint Server 2010 설치 프로그램은 제품이 지원하는 각 언어에 대해 중지 단어 파일을 하나씩 자동으로 설치합니다. 설치 후 대부분의 중지 단어 파일에는 연결된 언어의 일반적인 몇 가지 중지 단어가 포함되어 있습니다. 예를 들어 기본적으로 영어(미국) 중지 단어 파일(noiseenu.txt)에는 a, and, is, in, it, of, the, to가 포함되어 있습니다. 제품 설치 후에 검색 관리자는 언제든지 검색 결과의 관련성을 높이거나 조직의 표준을 충족하기 위해 중지 단어 파일에 단어를 추가하거나 파일에서 단어를 제거할 수 있습니다. 중지 단어 파일에 단어를 추가하거나 파일에서 단어를 제거하는 방법에 대한 자세한 내용은 이 문서 뒷부분의 중지 단어 파일 편집을 참조하십시오. 지원되는 언어에 대한 자세한 내용은 이 문서 뒷부분의 언어별 중지 단어 파일을 참조하십시오.
쿼리 시에는 쿼리 언어의 단어 분리기가 해당 언어의 어휘 규칙을 기반으로 단어 경계를 확인하여 검색 쿼리의 개별 단어를 식별합니다. 그런 후에 단어 분리기는 중지 단어 파일에 나와 있는 단어를 쿼리에서 제거합니다.
기본적으로 지원되는 모든 언어의 중지 단어 파일은 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config에 설치됩니다. 팜 관리자가 Search Service 응용 프로그램을 만들면 검색 시스템에서는 중지 단어 파일을 설치 위치(검색 관리자가 편집한 중지 단어 포함)에서 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config로 자동 복사합니다. 여기서 GUID는 새 Search Service 응용 프로그램의 GUID입니다. 검색 시스템에서는 새 Search Service 응용 프로그램을 실행하는 모든 쿼리 서버에서 동일한 작업을 수행합니다. 따라서 해당 Search Service 응용 프로그램을 실행하는 각 쿼리 서버에는 각 중지 단어 파일의 복사본이 하나씩 저장됩니다.
중지 단어 파일 편집
설치 위치에서 중지 단어 파일을 편집하면 시스템에서 편집된 중지 단어 파일을 편집 이후에 만드는 Search Service 응용 프로그램에 자동으로 전파합니다. 그러나 기존 Search Service 응용 프로그램에는 편집된 중지 단어 파일이 자동 전파되지는 않습니다. 변경 내용을 적용할 각 기존 Search Service 응용 프로그램에 대해, 해당 Search Service 응용 프로그램을 실행하는 각 쿼리 서버에서 편집한 파일을 Search Service 응용 프로그램 폴더에 수동으로 복사해야 합니다.
참고
-
중지 단어 파일을 삭제하면 검색 시스템에서 모든 단일 문자를 중지 단어로 간주하여 검색 결과에서 제거할 수 있습니다. 중지 단어 파일에는 항목이 하나 이상 포함되어야 하며, 마침표(.) 문자라도 포함해야 합니다.
-
중지 단어 파일을 삭제한 후에 SharePoint Server Search 14 서비스를 다시 시작하면 검색 시스템에서는 동일한 이름의 파일을 %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config에서 파일을 삭제한 폴더에 복사하여 파일을 자동으로 바꿉니다.
다음 절차에 따라 중지 단어 파일을 편집합니다.
중지 단어 파일을 편집하려면
이 절차를 수행하는 사용자 계정이 로컬 서버 Administrators 그룹의 구성원인지 확인합니다.
텍스트 편집기에서 중지 단어 파일을 엽니다. 적절한 중지 단어 파일을 찾고 확인하는 방법에 대한 자세한 내용은 이 문서 앞부분의 중지 단어 파일 이해를 참조하십시오.
검색 시스템이 검색 쿼리에서 무시하도록 하려는 단어만 포함하도록 파일을 편집합니다.
중지 단어 파일을 저장합니다.
참고
중지 단어 파일을 저장할 때는 항상 기본 인코딩(유니코드)을 사용하십시오.
다음 단계를 실행하여 SharePoint Server Search 14 서비스를 다시 시작합니다.
시작을 클릭하고 관리 도구를 가리킨 다음 서비스를 클릭합니다.
SharePoint Server Search 14를 마우스 오른쪽 단추로 클릭하고 다시 시작을 클릭합니다.
SharePoint Server Search 14 서비스를 다시 시작하고 나면 중지 단어 변경 내용이 적용됩니다.
참고
Microsoft Office SharePoint Server 2007에서는 검색 시스템이 쿼리와 인덱스에서 중지 단어를 제외했습니다. 따라서 관리자가 중지 단어 파일에서 단어를 제거한 후에 전체 크롤링을 수행하여 크롤러에서 발견할 수 있는 해당 중지 단어 인스턴스를 인덱싱해야 했습니다. 반면, SharePoint Server 2010에서는 검색 시스템이 쿼리에서는 중지 단어를 제외하지만 인덱스에서는 제외하지 않습니다. 따라서 SharePoint Server 2010에서는 중지 단어 파일에서 단어를 제거한 후에 새 크롤링을 수행할 필요가 없습니다. 제거된 중지 단어는 크롤링 중에 발견된 경우 이미 인덱스에 포함되어 있기 때문입니다. 중지 단어 파일에 단어를 추가하는 경우에도 검색 시스템이 인덱스에서 중지 단어를 찾지 않기 때문에 새 크롤링을 수행할 필요가 없습니다.
언어별 중지 단어 파일
SharePoint Server 2010을 설치하면 다음 언어에 대해 중지 단어 파일이 설치됩니다. 특정 언어에 대한 중지 단어 파일이 없는 경우 검색 시스템은 중립 중지 단어 파일 noiseneu.txt를 사용합니다.
언어 | 중지 단어 파일 이름 |
---|---|
아랍어 |
noiseara.txt |
벵골어 |
noiseben.txt |
불가리아어 |
noisebul.txt |
카탈로니아어 |
noisecat.txt |
체코어 |
noiseces.txt |
중국어(간체) |
noisechs.txt |
중국어(번체) |
noisecht.txt |
크로아티아어 |
noisecro.txt |
덴마크어 |
noisedan.txt |
네덜란드어(네덜란드) |
noisenld.txt |
영어(영국) |
noiseeng.txt |
영어(미국) |
noiseenu.txt |
핀란드어 |
noisefin.txt |
프랑스어 |
noisefra.txt |
독일어 |
noisedeu.txt |
그리스어 |
noisegrc.txt |
구자라트어 |
noiseguj.txt |
히브리어 |
noiseheb.txt |
힌디어 |
noisehin.txt |
헝가리어 |
noisehun.txt |
아이슬란드어 |
noiseice.txt |
인도네시아어 |
noiseind.txt |
이탈리아어 |
noiseita.txt |
일본어 |
noisejpn.txt |
카나다어 |
noisekan.txt |
한국어 |
noisekor.txt |
언어 중립 |
noiseneu.txt |
라트비아어 |
noiselav.txt |
리투아니아어 |
noiselit.txt |
말레이어 |
noisemal.txt |
말라얄람어 |
noisemly.txt |
마라티어 |
noisemar.txt |
노르웨이어(복말) |
noisenor.txt |
폴란드어 |
noiseplk.txt |
포르투갈어(포르투갈) |
noisepor.txt |
포르투갈어(브라질) |
noiseptb.txt |
펀잡어 |
noisepun.txt |
루마니아어 |
noiserom.txt |
러시아어 |
noiserus.txt |
세르비아어(키릴 자모) |
noisesbc.txt |
세르비아어(라틴 문자) |
noisesbl.txt |
슬로바키아어 |
noisesvk.txt |
슬로베니아어 |
noiseslo.txt |
스페인어 |
noiseesn.txt |
스웨덴어 |
noisesve.txt |
타밀어 |
noisetam.txt |
텔루구어 |
noisetel.txt |
태국어 |
noisetha.txt |
터키어 |
noisetur.txt |
우크라이나어 |
noiseurk.txt |
우르두어(파키스탄) |
noiseurd.txt |
베트남어 |
noisevie.txt |