Administración de archivos de palabras no significativas (SharePoint Server 2010)

 

Se aplica a: SharePoint Server 2010

Última modificación del tema: 2015-03-09

Una palabra no significativa, o palabra irrelevante, es una palabra que el sistema de búsqueda omite en las consultas de búsqueda del usuario final. Una palabra puede designarse como palabra no significativa porque se produce tan frecuentemente en el idioma que es poco probable que sea útil para identificar o limitar los resultados de la búsqueda. En español, por ejemplo, los artículos "un" y "el" se suelen especificar como palabras no significativas. Si un usuario escribe la consulta "el pico más alto" en español, "el" se quita de la consulta si es una palabra no significativa, por lo que la consulta se convierte en "pico más alto". Las palabras que pueden resultar ofensivas también se especifican en ocasiones como palabras no significativas.

En este artículo:

  • Descripción de los archivos de palabras no significativas

  • Edición de archivos de palabras no significativas

  • Archivos de palabras no significativas por idioma

Descripción de los archivos de palabras no significativas

Las palabras no significativas de un idioma determinado se enumeran en el archivo de palabras no significativas correspondiente a ese idioma. El programa de instalación de Microsoft SharePoint Server 2010 instala automáticamente un archivo de palabras no significativas para cada idioma que admite el producto. Después de la instalación, muchos de los archivos de palabras no significativas contienen algunas palabras no significativas típicas para el idioma asociado. Por ejemplo, de forma predeterminada, el archivo de palabras no significativas de inglés estadounidense (noiseenu.txt) contiene las palabras a, and, is, in, it, of, the, to. En cualquier momento después de la instalación del producto, el administrador de la búsqueda puede agregar o quitar palabras en un archivo de palabras no significativas para mejorar la relevancia de los resultados de búsqueda o para satisfacer los estándares de la organización. Para obtener información acerca de cómo agregar o quitar palabras en un archivo de palabras no significativas, vea el tema sobre cómo Edición de archivos de palabras no significativas más adelante en este artículo. Para obtener información sobre los idiomas admitidos, vea el tema sobre Archivos de palabras no significativas por idioma más adelante en este artículo.

En el momento de la consulta, el separador de palabras del idioma de la consulta identifica palabras individuales en la consulta de búsqueda mediante la determinación de los límites de palabra según las reglas léxicas del idioma. El separador de palabras, a continuación, quita todas las palabras de consulta que se enumeran en el archivo de palabras no significativas.

De forma predeterminada, los archivos de palabras no significativas de todos los idiomas admitidos se instalan en %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config. Cuando un administrador de la granja crea una aplicación de servicio de búsqueda, el sistema de búsqueda copia automáticamente los archivos de palabras no significativas desde la ubicación de instalación (incluidos todos los archivos de palabras no significativas que un administrador de búsqueda ha editado) en %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config, donde GUID es el GUID de la nueva aplicación de servicio de búsqueda. El sistema de búsqueda realiza la misma operación en cada servidor de consultas que esté ejecutando la nueva aplicación de servicio de búsqueda. De esta forma, hay una copia de cada archivo de palabras no significativas en cada servidor de consultas que esté ejecutando dicha aplicación de servicio de búsqueda.

Edición de archivos de palabras no significativas

Si se edita un archivo de palabras no significativas en la ubicación de instalación, el sistema propagará automáticamente el archivo de palabras no significativas editado a las aplicaciones de servicio de búsqueda que se creen más adelante. Sin embargo, el archivo de palabras no significativas no se propaga automáticamente a las aplicaciones de servicio de búsqueda existentes. Para cada aplicación de servicio de búsqueda existente a la que desee aplicar los cambios, debe copiar manualmente el archivo editado a la carpeta de la aplicación de servicio de búsqueda en cada servidor de consultas que esté ejecutando dicha aplicación de servicio de búsqueda.

Nota

  • Si elimina un archivo de palabras no significativas, el sistema de búsqueda podría considerar que todos los caracteres individuales son palabras no significativas y los quitará de los resultados de búsqueda. Un archivo de palabras no significativas debe contener al menos una entrada, incluso si la entrada es simplemente un carácter de punto (.).

  • Si elimina un archivo de palabras no significativas y, a continuación, reinicia el servicio de búsqueda de SharePoint Server 14, el sistema de búsqueda reemplaza automáticamente el archivo copiando el archivo del mismo nombre desde %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config a la carpeta donde se eliminó el archivo.

Realice el siguiente procedimiento para editar un archivo de palabras no significativas.

Para editar un archivo de palabras no significativas

  1. Compruebe si la cuenta de usuario que va a realizar este procedimiento pertenece al grupo Administradores del servidor local.

  2. Abra el archivo de palabras no significativas en un editor de texto. Para obtener información sobre cómo localizar e identificar el archivo de palabras no significativas adecuado, vea el tema de descripción de archivos de palabras no significativas anteriormente en este artículo.

  3. Edite el archivo para que incluya solo las palabras que desee que el sistema de búsqueda omita en las consultas de búsqueda.

  4. Guarde el archivo de palabras no significativas.

    Nota

    Al guardar un archivo de palabras no significativas, use siempre el valor de codificación predeterminado, que es Unicode.

  5. Reinicie el servicio de búsqueda de SharePoint Server 14 siguiendo estos pasos:

    1. Haga clic en Inicio, elija Herramientas administrativas y, a continuación, haga clic en Servicios.

    2. Haga clic con el botón secundario en SharePoint Server Search 14 y, a continuación, haga clic en Reiniciar.

      Los cambios en las palabras no significativas tendrán efecto después de reiniciar el servicio SharePoint Server 14.

      Nota

      En Microsoft Office SharePoint Server 2007, el sistema de búsqueda excluía las palabras no significativas de las consultas y del índice. Por lo tanto, después de que un administrador quitara una palabra de un archivo de palabras no significativas, era necesario realizar un rastreo completo para indizar todas las instancias de esa palabra no significativa que el rastreador (crawler) pudiera encontrar. En cambio, en SharePoint Server 2010, el sistema de búsqueda excluye las palabras no significativas de las consultas pero, por su diseño, no las excluye del índice. Por lo tanto, en SharePoint Server 2010, si quita una palabra de un archivo de palabras no significativas, no es necesario realizar un nuevo rastreo porque la palabra no significativa ya se encuentra en el índice si se encontró durante un rastreo. (Si agrega una palabra a un archivo de palabras no significativas, no es necesario realizar un nuevo rastreo tampoco, ya que el sistema de búsqueda no busca palabras no significativas en el índice).

Archivos de palabras no significativas por idioma

Al instalar SharePoint Server 2010, se instalan archivos de palabras no significativas para los siguientes idiomas. Si no existe un archivo de palabras no significativas para un determinado idioma, el sistema de búsqueda usa el archivo de palabras no significativas neutro noiseneu.txt.

Idioma Nombre del archivo de palabras no significativas

Árabe

noiseara.txt

Bengalí

noiseben.txt

Búlgaro

noisebul.txt

Catalán

noisecat.txt

Checo

noiseces.txt

Chino (simplificado)

noisechs.txt

Chino (tradicional)

noisecht.txt

Croata

noisecro.txt

Danés

noisedan.txt

Neerlandés (Países Bajos)

noisenld.txt

Inglés (Reino Unido)

noiseeng.txt

Inglés (Estados Unidos)

noiseenu.txt

Finés

noisefin.txt

Francés

noisefra.txt

Alemán

noisedeu.txt

Griego

noisegrc.txt

Gujarati

noiseguj.txt

Hebreo

noiseheb.txt

Hindi

noisehin.txt

Húngaro

noisehun.txt

Islandés

noiseice.txt

Indonesio

noiseind.txt

Italiano

noiseita.txt

Japonés

noisejpn.txt

Canarés

noisekan.txt

Coreano

noisekor.txt

Idioma neutro

noiseneu.txt

Letón

noiselav.txt

Lituano

noiselit.txt

Malayo

noisemal.txt

Malayalam

noisemly.txt

Marathi

noisemar.txt

Noruego (Bokmål)

noisenor.txt

Polaco

noiseplk.txt

Portugués (Portugal)

noisepor.txt

Portugués (Brasil)

noiseptb.txt

Punyabí

noisepun.txt

Rumano

noiserom.txt

Ruso

noiserus.txt

Serbio (cirílico)

noisesbc.txt

Serbio (latino)

noisesbl.txt

Eslovaco

noisesvk.txt

Esloveno

noiseslo.txt

Español

noiseesn.txt

Sueco

noisesve.txt

Tamil

noisetam.txt

Telugu

noisetel.txt

Tailandés

noisetha.txt

Turco

noisetur.txt

Ucraniano

noiseurk.txt

Urdu (Pakistán)

noiseurd.txt

Vietnamita

noisevie.txt