Microsoft SharePoint

Wykorzystanie słów ignorowanych („noise words”) w usłudze wykorzystania Udostępnij na: Facebook

Autor: Sebastian Wilczewski

Opublikowano: 14 stycznia 2008

Zawartość strony
 Wstęp   Wstęp
 Kilka słów o liście słów ignorowanych   Kilka słów o liście słów ignorowanych
 Edycja listy słów ignorowanych   Edycja listy słów ignorowanych
 Podsumowanie   Podsumowanie

Wstęp

Korzystając z usługi wyszukiwania w Microsoft Office SharePoint Server 2007 zapewne zauważyłeś, że niektóre słowa, wpisane w wyszukiwarce nie wpływają na wyniki wyszukiwania. Dzieje się tak dlatego, gdyż w Microsoft Office SharePoint Server 2007 wraz z tym rozwiązaniem instalowana jest definicja noise words, czyli słów ignorowanych podczas wyszukiwania. W tym artykule dowiesz się, jak zarządzać listą słów typu noise words, czyli jak dodawać własne słowo do listy słów ignorowanych.

 Do początku strony Do początku strony

Kilka słów o liście słów ignorowanych

Domyślnie po zainstalowaniu Microsoft Office SharePoint Server 2007 tworzona jest lista słów ignorowanych. Zakładając, że MOSS 2007 został zainstalowany z domyślnymi ustawieniami, to lista słów ignorowanych znajduje się w lokalizacji C:\Program Files\Microsoft Office Servers\12.0\Data\Config. W katalogu tym zainstalowane są pliki z listą słów ignorowanych dla wszystkich języków, w których MOSS 2007 jest dostępny, niezależnie od tego jaką wersję językową produktu instalujemy.

Pliki słownika mają postać nazwy noise[symbol kraju].txt. Czyli, na przykład, plik noiseplk.txt zawiera listę słów ignorowanych dla języka polskiego, a plik noisejpn.txt listę słów ignorowanych dla języka japońskiego.

Przykładowy wygląd pliku słów ignorowanych przedstawia rysunek 1.

Rys. 1. Pliki z listą słów ignorowanych.

Po zainstalowaniu Microsoft Office Sharepoint Server 2007 tworzony jest również Dostawca usług udostępnionych. Dla każdego z dostawców usług udostępnionych tworzona jest osobna lista słów ignorowanych. Jednak lista ta znajduje się w innej lokalizacji niż lokalizacja podana wcześniej, czyli w lokalizacji c:\Program Files\Microsoft Office Servers\12.0\Data\Applications\[application GUID]\Config (gdzie application GUID to identyfikator usługi udostępnionej). Dzieje się to dlatego, że dla każdej usługi udostępnionej możemy indywidualnie zdefiniować usługę wyszukiwania, więc również dla każdej usługi udostępnionej tworzone są osobne listy słów ignorowanych.

Po stworzeniu przez administratora nowej usługi udostępnionej, kopiowany jest plik z pierwotnej lokalizacji – w naszym przypadku C:\Program Files\Microsoft Office Servers\12.0\Data\Config) do lokalizacji c:\Program Files\Microsoft Office Servers\12.0\Data\Applications\[application GUID]\Config (lub innej w przypadku zmiany lokalizacji podczas instalacji), a następnie może on być modyfikowany dla tej właśnie usługi udostępnionej.

 Do początku strony Do początku strony

Edycja listy słów ignorowanych

Aby zmienić listę słów ignorowanych należy:

  1. Uruchomić Notatnik.

  2. Otworzyć właściwy plik z odpowiedniej lokalizacji (domyślnie c:\Program Files\Microsoft Office Servers\12.0\Data\Config) dla Microsoft Office SharePoint Server 2007 lub c:\Program Files\Microsoft Office Servers\12.0\Data\Applications\[application GUID]\Config dla konkretnej usługi udostępnianej).

  3. Dopisać ignorowane słowo lub do listy (należy dopisywać jedno słowo w jednym wierszu).

  4. Zapisać plik słów ignorowanych.

  5. Zamknąć Notatnik.

  6. Zrestartować usługę Windows SharePoint Services Search:

    1. Wybrać z menu Start polecenie Uruchom, a następnie wpisać services.msc;
    2. W konsoli MMC o nazwie Usługi odnaleźć usługę Windows SharePoint Services Search, kliknąć prawy przycisk na niej i wybrać polecenie Uruchom ponownie.
  7. Usunąć indeks:

    1. Wybrać z menu Start polecenie Wszystkie programy, a następnie Microsoft Office Server oraz Administracja Centralna Programu SharePoint.
    2. W lewej części ekranu wybrać nazwę usługi udostępnionej.
    3. W sekcji Wyszukiwanie wybrać Ustawienia wyszukiwanie.
    4. Na stronie Konfigurowanie ustawień wyszukiwania wybrać Resetuj całą przeszukaną zawartość, a następnie Resetuj teraz i potwierdzić decyzję przyciskiem OK.
  8. Ponownie wykonać pełne indeksowanie:

    1. Wybrać z menu Start polecenie Wszystkie programy , następnie Microsoft Office Server a później Administracja Centralna Programu SharePoint.
    2. W lewej części ekranu wybrać nazwę usługi udostępnionej.
    3. W sekcji Wyszukiwanie wybrać Ustawienia wyszukiwanie.
    4. Na stronie Konfigurowanie ustawień wyszukiwania wybrać Źródła zawartości i Harmonogramy przeszukiwania, a następnie Resetuj teraz i potwierdzić decyzję przyciskiem OK.
    5. Wskazać źródło zawartości.
    6. W sekcji Rozpoczynanie przeszukiwania pełnego zaznaczyć pole Rozpocznij przeszukiwanie pełne tego źródła zawartości i wybrać przycisk OK.

Po wykonaniu tych czynności wpisane słowa ingnorowane nie będą uwzględniane podczas wykonania (ich waga nie będzie wpływała na położenie danej treści w wynikach wyszukiwania).

 Do początku strony Do początku strony

Podsumowanie

Konfigurując słowa ignorowane, można uniknąć wyższego pozycjonowania stron zawierających popularne, występujące często w wielu dokumentach słowa. Aby dodać słowo do listy słów ignorowanych:

  1. Dopisz słowo do właściwej dla twojej wersji językowej listy słów ignorowanych, przechowywanej domyślnie w lokalizacji c:\Program Files\Microsoft Office Servers\12.0\Data\Config) dla Microsoft Office SharePoint Server 2007.
  2. Dopisz słowo do właściwej dla twojej wersji językowej listy słów ignorowanych dla danej usługi udostępnionej, przechowywanej domyślnie w lokalizacji c:\Program Files\Microsoft Office Servers\12.0\Data\Applications\[application GUID]\Config.
  3. Zrestartuj usługę Windows SharePoint Services Search.
  4. Usuń Indeks.
  5. Ponownie wykonaj pełne indeksowanie.

Sebastian Wilczewski
Od 2001 roku pracuje jako autoryzowanym instruktor MCT oraz Inżynier systemowy. Od września 2008 pracuje jako inzynier systemowy w Betacom SA.
Został wyróżniony tytułem MVP w kategorii Microsoft Office SharePoint Server. Prowadzi projekty i szkolenia z zakresu rozwiązań serwerowych firmy Microsoft w tym Project Server, technologii SharePoint. Występuje na konferencjach i dotyczących rozwiązań firmy Microsoft. Współautor kilkunastu webcastów. Aktywnie udziela się na portalu społeczności Windows Server System (www.wss.pl). Jest autorem kilku książek wydanych przez wydawnictwo Helion S.A. (między innymi dotyczących Microsoft Office Project Server, Microsoft Office Project czy Resource Kit Tools). Autor kilkunastu artykułów opublikowanych na stronach Technet. Z pasją zgłębia również tajniki licencjonowania produktów firmy Microsoft, a swoje dociekanie w tej dziedzinie planuje uwieńczyć poważną pracą naukową. Doradza firmom posiadającym do kilku tysięcy komputerów w zakresie optymalizacji licencjonowania produktów firmy Microsoft i nie tylko. Autor bloga http://swilczew.spaces.live.com/.
 Do początku strony Do początku strony

Microsoft SharePoint