Consideraciones internacionales para Integration Services

Microsoft SQL Server 2005 Integration Services permite el análisis y la manipulación de datos en varios idiomas, admite todas las configuraciones regionales de Windows y proporciona opciones de comparación especiales para ordenar y comparar datos de cadena.

Es posible que las transformaciones de Integration Services para la minería de texto y la coincidencia aproximada no funcionen tan bien en otros idiomas como en inglés. Sin embargo, las transformaciones de minería de texto y coincidencia aproximada pueden proporcionar resultados útiles cuando se utilizan con idiomas distintos del inglés, dependiendo del idioma.

Análisis sin distinción de la configuración regional

Integration Services incluye rutinas de análisis que no distinguen la configuración regional y que puede utilizar para datos que están en determinados formatos. Estas rutinas de análisis, llamadas colectivamente Análisis rápido, sólo admiten las representaciones en los formatos de fecha utilizados con más frecuencia, no realizan análisis específicos para una configuración regional, no reconocen los caracteres especiales en los datos de moneda y no pueden convertir la representación hexadecimal o científica de números enteros. El análisis rápido puede mejorar notablemente el rendimiento de los paquetes de Integration Services que no dependen de la configuración regional. Para obtener más información, vea Analizar datos.

Configuración regional

Integration Services admite la configuración regional en el nivel de objeto de paquete, contenedor, tarea y componente de flujo de datos. También puede establecer la configuración regional de los controladores de eventos.

Un paquete puede utilizar varias configuraciones regionales distintas. Por ejemplo, el paquete puede usar la configuración regional Inglés (Estados Unidos) mientras una tarea del paquete utiliza Alemán (Alemania) y otra utiliza Japonés (Japón).

Puede utilizar cualquier configuración regional de Windows en un paquete de Integration Services. La configuración regional se establece al crear el paquete y, a menos que el paquete utilice configuraciones para actualizar las propiedades de la configuración regional, siempre se comporta de la misma manera cuando se implementa en equipos que utilizan opciones regionales y de idioma diferentes de las del entorno de desarrollo.

Sin embargo, si un paquete debe utilizar diferentes configuraciones regionales cuando se implementa en diferentes servidores, puede crear configuraciones que proporcionen las configuraciones regionales actualizadas que se utilizarán cuando se ejecute el paquete. Para obtener más información, vea Establecer las propiedades de paquete y Configuraciones de paquetes.

Opciones de comparación

La configuración regional proporciona las reglas básicas para comparar los datos de cadena en un flujo de datos. Por ejemplo, la configuración regional especifica la posición y el orden de cada letra en el alfabeto. Sin embargo, estas reglas pueden no ser suficientes para las comparaciones que desea realizar, e Integration Services admite un conjunto de opciones de comparación avanzadas que van más allá de las reglas de comparación de una configuración regional. Por ejemplo, si elige omitir los caracteres sin espacio, "a" y "á" serán equivalentes para los fines de la comparación. Para obtener más información, vea Comparar datos de cadena.

Minería de texto

Las transformaciones para la minería de texto, Extracción de términos y Búsqueda de términos, utilizan su propio diccionario. Este diccionario sólo está disponible en inglés y los resultados del uso de las transformaciones de minería de texto en idiomas distintos del inglés pueden ser limitados. Microsoft sólo admite el uso de estas transformaciones en inglés.

Sin embargo, dependiendo de la similitud lingüística entre el inglés y el otro idioma, es posible que la transformación Extracción de términos pueda extraer términos en idiomas que no sean inglés, y que se pueda utilizar la transformación Búsqueda de términos para buscar términos y calcular su frecuencia. Cuánto mayor sea la similitud entre los idiomas, mayor será el éxito de la minería de términos. Por ejemplo, el uso de la transformación Extracción de términos para la minería de texto de cadenas suecas puede ser eficaz porque el idioma sueco utiliza delimitadores de palabras y oraciones similares a los del inglés. Sin embargo, lo más probable es que la transformación Extracción de términos no tenga tanto éxito en japonés. Para obtener más información, vea Transformación Extracción de términos y Transformación Búsqueda de términos.

Coincidencia aproximada

Las dos transformaciones, Agrupación aproximada y Búsqueda aproximada, buscan coincidencias aproximadas para agrupar registros similares en un conjunto de datos o realizar búsquedas en una tabla de referencia. Ambas transformaciones pueden buscar coincidencias de manera más eficaz cuando los datos de texto contienen varias palabras largas separadas por espacios o delimitadores. Las transformaciones no toleran tanto los errores en los idiomas logográficos, como el chino, donde las palabras tienen con frecuencia sólo unos cuantos caracteres y no siempre están separadas por espacios. En general, hay menos probabilidades de que las transformaciones detecten errores ortográficos, o palabras que sobran o que faltan en los idiomas logográficos. Para obtener más información, vea Transformación Agrupación aproximada y Transformación Búsqueda aproximada.

Vea también

Conceptos

SQL Server Integration Services

Ayuda e información

Obtener ayuda sobre SQL Server 2005