Administración de archivos de palabras no significativas (SharePoint Server 2010)
Se aplica a: SharePoint Server 2010
Última modificación del tema: 2015-03-09
Una palabra no significativa, o palabra irrelevante, es una palabra que el sistema de búsqueda omite en las consultas de búsqueda del usuario final. Una palabra puede designarse como palabra no significativa porque se produce tan frecuentemente en el idioma que es poco probable que sea útil para identificar o limitar los resultados de la búsqueda. En español, por ejemplo, los artículos "un" y "el" se suelen especificar como palabras no significativas. Si un usuario escribe la consulta "el pico más alto" en español, "el" se quita de la consulta si es una palabra no significativa, por lo que la consulta se convierte en "pico más alto". Las palabras que pueden resultar ofensivas también se especifican en ocasiones como palabras no significativas.
En este artículo:
Descripción de los archivos de palabras no significativas
Edición de archivos de palabras no significativas
Archivos de palabras no significativas por idioma
Descripción de los archivos de palabras no significativas
Las palabras no significativas de un idioma determinado se enumeran en el archivo de palabras no significativas correspondiente a ese idioma. El programa de instalación de Microsoft SharePoint Server 2010 instala automáticamente un archivo de palabras no significativas para cada idioma que admite el producto. Después de la instalación, muchos de los archivos de palabras no significativas contienen algunas palabras no significativas típicas para el idioma asociado. Por ejemplo, de forma predeterminada, el archivo de palabras no significativas de inglés estadounidense (noiseenu.txt) contiene las palabras a, and, is, in, it, of, the, to. En cualquier momento después de la instalación del producto, el administrador de la búsqueda puede agregar o quitar palabras en un archivo de palabras no significativas para mejorar la relevancia de los resultados de búsqueda o para satisfacer los estándares de la organización. Para obtener información acerca de cómo agregar o quitar palabras en un archivo de palabras no significativas, vea el tema sobre cómo Edición de archivos de palabras no significativas más adelante en este artículo. Para obtener información sobre los idiomas admitidos, vea el tema sobre Archivos de palabras no significativas por idioma más adelante en este artículo.
En el momento de la consulta, el separador de palabras del idioma de la consulta identifica palabras individuales en la consulta de búsqueda mediante la determinación de los límites de palabra según las reglas léxicas del idioma. El separador de palabras, a continuación, quita todas las palabras de consulta que se enumeran en el archivo de palabras no significativas.
De forma predeterminada, los archivos de palabras no significativas de todos los idiomas admitidos se instalan en %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config. Cuando un administrador de la granja crea una aplicación de servicio de búsqueda, el sistema de búsqueda copia automáticamente los archivos de palabras no significativas desde la ubicación de instalación (incluidos todos los archivos de palabras no significativas que un administrador de búsqueda ha editado) en %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config, donde GUID es el GUID de la nueva aplicación de servicio de búsqueda. El sistema de búsqueda realiza la misma operación en cada servidor de consultas que esté ejecutando la nueva aplicación de servicio de búsqueda. De esta forma, hay una copia de cada archivo de palabras no significativas en cada servidor de consultas que esté ejecutando dicha aplicación de servicio de búsqueda.
Edición de archivos de palabras no significativas
Si se edita un archivo de palabras no significativas en la ubicación de instalación, el sistema propagará automáticamente el archivo de palabras no significativas editado a las aplicaciones de servicio de búsqueda que se creen más adelante. Sin embargo, el archivo de palabras no significativas no se propaga automáticamente a las aplicaciones de servicio de búsqueda existentes. Para cada aplicación de servicio de búsqueda existente a la que desee aplicar los cambios, debe copiar manualmente el archivo editado a la carpeta de la aplicación de servicio de búsqueda en cada servidor de consultas que esté ejecutando dicha aplicación de servicio de búsqueda.
Nota
-
Si elimina un archivo de palabras no significativas, el sistema de búsqueda podría considerar que todos los caracteres individuales son palabras no significativas y los quitará de los resultados de búsqueda. Un archivo de palabras no significativas debe contener al menos una entrada, incluso si la entrada es simplemente un carácter de punto (.).
-
Si elimina un archivo de palabras no significativas y, a continuación, reinicia el servicio de búsqueda de SharePoint Server 14, el sistema de búsqueda reemplaza automáticamente el archivo copiando el archivo del mismo nombre desde %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config a la carpeta donde se eliminó el archivo.
Realice el siguiente procedimiento para editar un archivo de palabras no significativas.
Para editar un archivo de palabras no significativas
Compruebe si la cuenta de usuario que va a realizar este procedimiento pertenece al grupo Administradores del servidor local.
Abra el archivo de palabras no significativas en un editor de texto. Para obtener información sobre cómo localizar e identificar el archivo de palabras no significativas adecuado, vea el tema de descripción de archivos de palabras no significativas anteriormente en este artículo.
Edite el archivo para que incluya solo las palabras que desee que el sistema de búsqueda omita en las consultas de búsqueda.
Guarde el archivo de palabras no significativas.
Nota
Al guardar un archivo de palabras no significativas, use siempre el valor de codificación predeterminado, que es Unicode.
Reinicie el servicio de búsqueda de SharePoint Server 14 siguiendo estos pasos:
Haga clic en Inicio, elija Herramientas administrativas y, a continuación, haga clic en Servicios.
Haga clic con el botón secundario en SharePoint Server Search 14 y, a continuación, haga clic en Reiniciar.
Los cambios en las palabras no significativas tendrán efecto después de reiniciar el servicio SharePoint Server 14.
Nota
En Microsoft Office SharePoint Server 2007, el sistema de búsqueda excluía las palabras no significativas de las consultas y del índice. Por lo tanto, después de que un administrador quitara una palabra de un archivo de palabras no significativas, era necesario realizar un rastreo completo para indizar todas las instancias de esa palabra no significativa que el rastreador (crawler) pudiera encontrar. En cambio, en SharePoint Server 2010, el sistema de búsqueda excluye las palabras no significativas de las consultas pero, por su diseño, no las excluye del índice. Por lo tanto, en SharePoint Server 2010, si quita una palabra de un archivo de palabras no significativas, no es necesario realizar un nuevo rastreo porque la palabra no significativa ya se encuentra en el índice si se encontró durante un rastreo. (Si agrega una palabra a un archivo de palabras no significativas, no es necesario realizar un nuevo rastreo tampoco, ya que el sistema de búsqueda no busca palabras no significativas en el índice).
Archivos de palabras no significativas por idioma
Al instalar SharePoint Server 2010, se instalan archivos de palabras no significativas para los siguientes idiomas. Si no existe un archivo de palabras no significativas para un determinado idioma, el sistema de búsqueda usa el archivo de palabras no significativas neutro noiseneu.txt.
Idioma | Nombre del archivo de palabras no significativas |
---|---|
Árabe |
noiseara.txt |
Bengalí |
noiseben.txt |
Búlgaro |
noisebul.txt |
Catalán |
noisecat.txt |
Checo |
noiseces.txt |
Chino (simplificado) |
noisechs.txt |
Chino (tradicional) |
noisecht.txt |
Croata |
noisecro.txt |
Danés |
noisedan.txt |
Neerlandés (Países Bajos) |
noisenld.txt |
Inglés (Reino Unido) |
noiseeng.txt |
Inglés (Estados Unidos) |
noiseenu.txt |
Finés |
noisefin.txt |
Francés |
noisefra.txt |
Alemán |
noisedeu.txt |
Griego |
noisegrc.txt |
Gujarati |
noiseguj.txt |
Hebreo |
noiseheb.txt |
Hindi |
noisehin.txt |
Húngaro |
noisehun.txt |
Islandés |
noiseice.txt |
Indonesio |
noiseind.txt |
Italiano |
noiseita.txt |
Japonés |
noisejpn.txt |
Canarés |
noisekan.txt |
Coreano |
noisekor.txt |
Idioma neutro |
noiseneu.txt |
Letón |
noiselav.txt |
Lituano |
noiselit.txt |
Malayo |
noisemal.txt |
Malayalam |
noisemly.txt |
Marathi |
noisemar.txt |
Noruego (Bokmål) |
noisenor.txt |
Polaco |
noiseplk.txt |
Portugués (Portugal) |
noisepor.txt |
Portugués (Brasil) |
noiseptb.txt |
Punyabí |
noisepun.txt |
Rumano |
noiserom.txt |
Ruso |
noiserus.txt |
Serbio (cirílico) |
noisesbc.txt |
Serbio (latino) |
noisesbl.txt |
Eslovaco |
noisesvk.txt |
Esloveno |
noiseslo.txt |
Español |
noiseesn.txt |
Sueco |
noisesve.txt |
Tamil |
noisetam.txt |
Telugu |
noisetel.txt |
Tailandés |
noisetha.txt |
Turco |
noisetur.txt |
Ucraniano |
noiseurk.txt |
Urdu (Pakistán) |
noiseurd.txt |
Vietnamita |
noisevie.txt |