Versión imprimible       Enviar     
Evaluar y enviar comentarios
TechNet
Guía de SharePoint Portal Server 2001

Apéndice C: Descripción de las características del idioma japonés

Características del idioma japonés

Importante  Para ver este apéndice en la versión en pantalla del documento, debe tener instalado en su equipo el paquete del idioma japonés.

El servicio de Microsoft Search (MSSearch) incluye características avanzadas del idioma japonés para indizar y buscar con eficacia documentos en japonés. Estas características están especialmente diseñadas para trabajar con las peculiaridades propias de los documentos en japonés. Entre ellas se incluyen la indización por palabras y las técnicas de normalización basadas en este tipo de indización. En la siguiente tabla se muestran algunos ejemplos.

Consulta

Término del documento

Resultado

Efecto

京都

東京都

Sin resultados

Mayor precisión

アジ

アジア

Sin resultados

Mayor precisión

アール・ヌーボー

アールヌーボー

Se obtienen resultados

Mayor cobertura

2000

円札

二千円札

Se obtienen resultados

Mayor cobertura

Indización por palabras

MSSearch incluye un separador de palabras inteligente para la indización y las consultas. Este componente es más sofisticado que el separador de palabras del idioma inglés, porque los límites de las palabras son más ambiguos en japonés. Esto significa que, en los documentos en japonés, MSSearch indiza palabras y no simplemente caracteres. La indización por palabras mejora la precisión de la búsqueda, reduce el tamaño del índice y admite técnicas de normalización que mejoran la cobertura de la búsqueda.

Ejemplo 1

    Consulta: 京都

    El documento contiene : 東京都

    MSSearch (correctamente) no recupera el documento porque los caracteres 東京no están separados. Por esta razón, el término erróneo 京都no se indiza. Esto mejora la precisión de la búsqueda.

Ejemplo 2

    Consulta : アジ

    El documento contiene : アジア

    MSSearch (correctamente) no devuelve este documento porque アジア está indizado como un único término y no coincide con el término de la consulta, アジ. Esto mejora la precisión de la búsqueda.

    Este tipo de consulta es problemático para los sistemas de indización por caracteres, porque el término アジ aparece con mucha menos frecuencia que アジア. Es probable que la búsqueda de アジ devuelva un gran número de documentos con アジア y sólo unos pocos con アジ.

Búsqueda de derivados

MSSearch busca todas las variantes de una palabra cuando indiza el documento y cuando realiza la consulta. Esta característica es diferente en la versión en inglés, que no busca los derivados de la palabra cuando indiza el documento, sino únicamente cuando ejecuta la consulta.

Esto significa que las coincidencias exactas en japonés pueden funcionar de forma ligeramente distinta a la esperada. Este comportamiento se debe a que el separador de palabras puede cambiar una palabra a su forma simple y quitar el carácter que no forma parte del significado básico de la palabra.

Los siguientes ejemplos muestran los términos que son equivalentes para la búsqueda:

    Ejemplo 1: 表示の切り替え方 y 表示を切り替えるには

    Ejemplo 2:特捜部の調べによれば… y 特捜部が調べたところ

    Ejemplo 3:買います y 買う y 買った

    Ejemplo 4:きれい y きれいな y きれいでした

Normalización Hankaku/Zenkaku

Se normalizan todos los caracteres Katakana y numéricos codificados en 1 byte (

半角) y 2 bytes (全角). Una búsqueda en la que se utilizan caracteres de 1 byte encuentra coincidencias de 2 bytes; una búsqueda en la que se utilizan caracteres de 2 bytes encuentra coincidencias de 1 byte.

Los siguientes ejemplos muestran términos que son equivalentes para la búsqueda:

    Ejemplo 1: アメリカ y アメリカ

    Ejemplo 2: 2000 y 2000

Normalización numérica

Los números árabes codificados en 1 byte (

半角数字) o en 2 bytes (全角数字), y los números japoneses (漢数字) se normalizan para que las consultas que contengan estos caracteres puedan encontrar documentos con los otros tipos de números.

Los siguientes ejemplos muestran términos que son equivalentes para la búsqueda:

    Ejemplo 1: 2000 円札 y 2,000円札 y 2000円札 y 2千円札 y 二千円札 y 二〇〇〇円札

    Ejemplo 2: 第二次世界大戦 y 第2次世界大戦 y 第2次世界大戦

Las consultas que tienen términos Katakana pueden encontrar documentos con variantes de esas palabras. No obstante, MSSearch evita recuperar términos Katakana que sean distintos aunque parezcan variantes.

Los siguientes ejemplos muestran términos que son equivalentes para la búsqueda:

    Ejemplo 1: デジタル y ディジタル

    Ejemplo 2: コンピュータ y コンピューター

    Ejemplo 3: ギリシャ y ギリシア

Sin embargo, una consulta en la que se busca シアトルno devuelve resultados de シャトル.

Contracción Nakaguro

MSSearch encuentra términos Katakana contraídos incluso cuando en la consulta se utiliza un separador Nakaguro o de otro tipo. Además, los términos de consulta Katakana también pueden encontrar términos Nakaguro en los documentos.

Los siguientes ejemplos muestran términos que son equivalentes para la búsqueda:

    Ejemplo 1: アール・ヌーボー y アールヌーボー

    Ejemplo 2: サン=テグジュペリ y サンテグジュペリ

    Ejemplo 3: シャーロック・ホームズ y シャーロックホームズ

    Ejemplo 4: アガサクリスティ y アガサ=クリスティ

Sugerencias para el usuario

Uso de NakaguroMM

Las consultas con la forma contraída de las palabras Katakana encuentran menos documentos, aunque más específicos, que las consultas con un término Katakana que contiene un Nakaguro. Utilice la forma contraída para mejorar la precisión de la búsqueda y la forma Nakaguro para ampliar su cobertura.

Ejemplo

    Consulta 1 : メールアドレス

    Consulta 2 : メール・アドレス

    El documento 1 contiene: メールアドレス

    El documento 2 contiene: メール・アドレス

    El documento 3 contiene: メール アドレス

    El documento 4 contiene: メール-アドレス

    El documento 5 contiene: メール y アドレス

Resultados de la búsqueda


Documento 1


Documento 2


Documento 3


Documento 4


Documento 5

Consulta 1

Encontrado

Encontrado

Encontrado

Encontrado

No se encuentra

Consulta 2

Encontrado

Encontrado

Encontrado

Encontrado

Encontrado

MSSearch puede indizar documentos que contienen texto en japonés e inglés. La indización de otros idiomas en documentos en japonés mejora si los idiomas son similares al inglés en lo relativo al uso de espacios y la puntuación.

MSSearch se basa en la configuración regional del equipo para determinar el idioma del texto de la consulta. Para las consultas en japonés, asegúrese de que el idioma de la configuración regional es el japonés o de que la sintaxis de la consulta incluye el Id. de configuración regional de este idioma.


Para más información:

http://www.microsoft.com/spain/servidores/sharepoint/default.asp


© 2009 Microsoft Corporation. Reservados todos los derechos. Condiciones de Uso | Marcas registradas | Declaración de privacidad
Page view tracker