Referencia de beconfig.xml

 

Se aplica a: FAST Search Server 2010

Última modificación del tema: 2015-03-09

Importante

Este artículo se ha traducido con traducción automática; vea la declinación de responsabilidades. Para su referencia, puede encontrar la versión en inglés de este artículo aquí.

Uso beconfig.XmlPara configurar las opciones para el componente del motor de explorador en Microsoft FAST Search Server 2010 for SharePoint. Por ejemplo, utilizarbeconfig.XmlPara cambiar los tamaños de caché del motor de explorador o la configuración de tiempo de espera.

El motor de explorador lee elbeconfig.Xmlarchivo de%FASTSEARCH%\Etcen el inicio.

Personalizar beconfig.xml

Nota

Para modificar un archivo de configuración, compruebe que cumple los requisitos mínimos siguientes: es un miembro del grupo local de FASTSearchAdministrators en el equipo donde está instalado FAST Search Server 2010 for SharePoint.

Utilice un editor de texto (por ejemplo, el Bloc de notas), no un editor de XML de propósito general, para cambiarbeconfig.Xml.

Para modificar este archivo:

  1. Editarbeconfig.Xmlin a text editor to specify settings. Utilice el archivo existente en%FASTSEARCH%\etc\como punto de partida. Do not remove any attribute sections from the file.

  2. Ejecute nctrl.exe restart browserengine para reiniciar el proceso del motor de explorador, con las nuevas opciones.

referencia rápida de beconfig.Xml

En la tabla siguiente contiene una lista de los elementos debeconfig.Xml. Estos elementos pueden aparecer en cualquier orden, pero deben tener lugar dentro de otros elementos tal como se especifica en esta tabla.

Elemento Descripción

< elemento browserengine >

Lo identifica como un archivo de configuración del motor de explorador.

< elemento de explorador >

Especifica las opciones de la ventana del explorador Web virtual. Sólo puede aparecer dentro de un elemento browserengine.

< elemento de proxy >

Especifica las opciones del servidor proxy interna. Sólo puede aparecer dentro de un elemento browserengine.

< elemento de proceso >

Especifica las opciones que afectan a la transformación de los elementos individuales. Sólo puede aparecer dentro de un elemento browserengine.

< excluye el elemento >

Contiene uno o varios elementos regexp, que especifican las reglas normales de la excepción que se utilizan para excluir a los URI específico de transformación. Sólo puede aparecer dentro de un elemento browserengine.

< elemento RegExp >

Especifica una regla de exclusión normal. Sólo puede aparecer dentro de un atributo excludes.

< canalización >

Especifica las opciones de la canalización de procesamiento y los pasos de la canalización que se realizará en cada elemento que se procesa. Contiene uno o varios elementos de extractor de datos en. Sólo puede aparecer dentro de un elemento browserengine.

< Extractor de elemento >

Especifica un extractor de datos en. Debe contener tanto un type como un elemento assembly y puede contener un elemento parameters. Sólo puede aparecer dentro de un elemento pipeline.

Nota

La lista de extractores y sus subelementos, como en%FASTSEARCH%\etc\beconfig.Xml, debe no pueden modificarse.

formato de archivo beconfig.Xml

Los elementos XML de beconfig.xml comienzan con < y terminan con />.

El formato de elemento básico es el siguiente:

<element_name [attribute_name=" valor "] [attribute_name=" valor "] … />

Por ejemplo:

<process maxOperations="1000" maxMemoryMB="1024" timeout="300" />

Los elementos y atributos están entre mayúsculas y minúsculas. Los valores de atributo deben ir entre comillas ("") y no se distinguen mayúsculas y minúsculas.

Una definición de elemento puede ocupar varias líneas. En un elemento de ejemplo definition.For se omiten los espacios, retornos de carro, avances de línea y caracteres de tabulación:

<process
    maxOperations="1000"
    maxMemoryMB="1024"
    timeout="300"
/>

Las definiciones de elemento largo, coloque los atributos en líneas independientes y utilice la sangría para facilitar la lectura de archivo.

La estructura básica del archivo beconfig.xml es como sigue:

<?xml version="1.0"?>
<browserengine>
    <browser ... />
    <proxy ... />
    <process ... />
    <excludes>
        ...
    </excludes>
    <pipeline>
        ...
    </pipeline>
</browserengine>

Comentarios se pueden agregar en cualquier lugar y están delimitados por <!-- y -->.

elemento browserengine

Elemento de nivel superior.

Atributos

Ninguno

elemento de explorador

Este elemento especifica opciones para el componente de explorador Web incrustado en el motor de exploración. Este elemento se utiliza para ajustar el período de tiempo de espera de la carga del elemento de página Web. Por ejemplo, puede aumentar el valor de tiempo de espera si las páginas Web con frecuencia el tiempo de espera durante la carga del elemento.

Atributos

Atributo Valor Descripción

width

<pixels>

Las páginas Web se procesan en una ventana del explorador de Web invisible. Esta opción especifica el ancho de esta ventana en píxeles.

De forma predeterminada: 1280

height

<pixels>

Especifica el alto de la ventana del explorador Web invisible en píxeles.

De forma predeterminada: 1024

visible

true|false

Makes the Web browser window visible during processing. Se utiliza para la depuración sólo.

Oculta la ventana del explorador de Web durante el proceso.

Valor predeterminado: false

images

true|false

Specifies that the browser engine should load the images contained on Web pages. Se utiliza para la depuración sólo.

Especifica que el motor de exploración no debe cargar las imágenes incluidas en las páginas Web.

Valor predeterminado: false

timeout

<seconds>

Especifica el período de tiempo de espera, en segundos, el motor de explorador a cargar la página Web que se está procesada. Si una página Web tarda más en cargarse, se descartarán.

Esta opción no tiene en cuenta el tiempo necesario para ejecutar la canalización de procesamiento de una vez completada la carga.

De forma predeterminada: 60

Ejemplo

<browser width="1280" height="1024" visible="false" images="false" timeout="60"/>

elemento de proxy

Este elemento especifica opciones para el proxy de Web interna y la memoria caché se utiliza en el explorador. Utilice este elemento para ajustar el tamaño de caché y la edad máxima de los archivos JavaScript en la caché.

Atributos

Atributo Valor Descripción

maxsize

<bytes>

Especifica el tamaño máximo de un único código de JavaScript que se descargarán desde el Web o en el Explorador de Web. Los elementos que superen este umbral, se descartarán.

De forma predeterminada: 10485760

timeout

<timeout>

Especifica el período de tiempo de espera, en segundos, para cualquier JavaScript o una página Web se descarga desde el Web o en el Explorador de Web. Si una descarga supera este tiempo de espera, se descartarán.

De forma predeterminada: 60

cacheSize

<megabytes>

Especifica el tamaño máximo de la caché de JavaScript en el motor de exploración. Se utiliza para mantener utilizados con frecuencia archivos JavaScript disponible sin re-downloading a ellos.

De forma predeterminada: 25

cacheTTL

<seconds>

Especifica la antigüedad máxima, en segundos, de los archivos JavaScript en la caché antes de que se elimina. JavaScript se puede expulsar anteriormente, si la caché se llena.

De forma predeterminada: 3600

Ejemplo

<proxy maxsize="10485760" timeout="60" cacheSize="25" cacheTTL="3600"/>

elemento de proceso

Este elemento especifica las opciones relacionadas con el procesamiento de los elementos de la Web en el motor de exploración. Utilice este elemento para ajustar el uso de la cantidad máxima de memoria y el tiempo de espera de la canalización.

Atributos

Atributo Valor Descripción

maxOperations

<operations>

Especifica el número máximo de páginas Web se procesen antes de que se reinicia automáticamente el motor de exploración. Esto es útil para controlar posibles pérdidas de memoria y bloquea el procesamiento que puede ser debido a algunas páginas Web.

Valor predeterminado: 1000

maxMemoryMB

<megabytes>

Especifica el uso de memoria máximo, en MB, antes de que se reinicia automáticamente el motor de exploración. Esto es útil para controlar posibles pérdidas de memoria y bloquea el procesamiento que puede ser debido a las páginas Web.

De forma predeterminada: 1024

timeout

<timeout>

Especifica el período de tiempo de espera, en segundos, para extraer los hipervínculos desde cualquier página Web específica. Este tiempo de espera es necesario para el identificador de los casos en que, por ejemplo, un JavaScript impide la canalización de proceso de completar el procesamiento de una página Web.

De forma predeterminada: 300

Ejemplo

<process maxOperations="1000" maxMemoryMB="1024" timeout="300"/>

excluye el elemento

Este elemento especifica una o varias reglas de expresión regular que impide la descarga del JavaScript específico y la hoja de estilos en cascada los identificadores URI. Un uso común excluye las secuencias de comandos de publicidad conocidos para aumentar la velocidad de procesamiento de páginas Web y para evitar que las secuencias de comandos que aparecen en el índice de contenido.

Atributos

Ninguno

Ejemplo

<excludes>
    <regexp value="http://ads\."/>
</excludes>

elemento RegExp

Este elemento especifica una regla de exclusión de la expresión regular única y sólo puede aparecer dentro de un elemento excludes. Este elemento puede aparecer varias veces.

Atributos

Atributo Valor Descripción

value

<regexp>

Especifica una expresión regular que se compara con todo externo JavaScript y los identificadores URI que se descubren durante el procesamiento del elemento Web Hoja de estilo en cascada. Identificadores URI que coincida con la expresión regular no van a descargar o incluyen durante el procesamiento de la página Web.

De forma predeterminada: Véase%FASTSEARCH%\etc\beconfig.XmlSi el valor predeterminado.

Ejemplo

Vea el ejemplo se excluye el elemento.

elemento de la canalización

Este elemento especifica el conjunto de extractores de datos en que se ejecutan en cada página Web durante el procesamiento en el motor de exploración. Un extractor lleva a cabo un conjunto de operaciones, por ejemplo, para extraer un cierto tipo de hipervínculo o las cookies HTTP, genera la suma de comprobación y el código HTML utilizado para indizar el contenido del elemento final.

Atributos

Atributo Valor Descripción

Nombre

Default

Especifica el nombre de la canalización. Se admite sólo una única canalización y el nombre debe ser "default".

maxFrameLevels

<levels>

Especifica el número de niveles de marco HTML para procesar. Normalmente, esta opción se establece en 1, lo que significa que sólo el marco de nivel superior y sus marcos secundarios inmediatos (el conjunto de marcos) se procesan.

Al aumentar este número de forma recursiva procesará varios conjuntos de marcos.

De forma predeterminada: 1

timeout

<seconds>

Especifica el tiempo máximo que puede ejecutar la canalización de proceso en una página Web antes de que se ha detenido.

Al aumentar este valor se reduce el rendimiento del motor de explorador, pero puede ayudar a reducir los tiempos de espera de procesamiento de página Web. Al disminuir el valor puede mejorar el rendimiento a expensas de tiempos de espera de posiblemente más.

De forma predeterminada: 300

iterations

1

Especifica el número de repeticiones para ejecutar la canalización en cada página Web. Se admite sólo una iteración.

abortOnFailure

true|false

Especifica que se debe detener el procesamiento de una página Web si se produce un error en cualquier extractor único.

Especifica que el procesamiento de una página Web debe continuar aunque algunos extractores de datos en un error. Esto puede mejorar la extracción de vínculo, pero puede (en el peor de los casos) de cliente potencial para que se envían en el índice de contenido de elementos parciales.

Default

true

Especifica que esta canalización la canalización predeterminada. Debido a que se admite una única canalización, este valor siempre debe establecerse en "true".

Ejemplo

<pipeline name="default" maxFrameLevels="1" timeout="180" iterations="1" abortOnFailure="true" default="true">
..
</pipeline>

Extractor de elemento

Este elemento especifica un extractor de datos único en la canalización. La lista de los extractores de datos en lo dispuesto en el%FASTSEARCH%\etc\beconfig.XmlNo se puede modificar.

Nota

Declinación de responsabilidades de traducción automática: Este artículo se ha traducido con un sistema informático sin intervención humana. Microsoft ofrece estas traducciones automáticas para que los hablantes de otros idiomas distintos del inglés puedan disfrutar del contenido sobre los productos, los servicios y las tecnologías de Microsoft. Puesto que este artículo se ha traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.