Compartilhar via


Como carregar separadores de palavras de terceiros licenciados

O SQL Server 2008 inclui separadores de palavras de terceiros licenciados para os seguintes idiomas:

  • Dinamarquês

  • Polonês

  • Turco

Esses separadores de palavras estão disponíveis, mas não são instalados por padrão e devem ser registrados manualmente e adicionados à lista de LCIDs suportados para indexação e consulta de texto completo.

Informações de pré-requisito

Para que possa carregar um separador de palavras, você precisa das seguintes informações:

  • Nomes de instância de cada instância do SQL Server na qual deseja registrar os separadores de palavras.

  • O caminho FTDATA de cada instância.

    Depois de obter as IDs das instâncias, recupere o caminho específico da instância apropriado à pasta FTData. Você usará esse caminho ao adicionar os valores de configuração que especificam os arquivos de léxico e de dicionário de sinônimos de um idioma.

Para obter a ID de uma instância do SQL Server

  1. Clique em Iniciar e em Executar.

  2. Na caixa de diálogo Executar, na caixa Abrir, digite Regedit.

  3. Clique em OK. O Editor do Registro será aberto.

  4. Navegue até HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\Instance Names\SQL. Lá, o painel direito exibe, na coluna Dados, o nome e a ID de cada instância instalada do SQL Server. Obtenha a ID de cada instância de servidor em que você carregará separadores de palavras de terceiros.

Para obter o caminho FTData de cada instância

  1. Clique em Iniciar e em Executar.

  2. Na caixa de diálogo Executar, na caixa Abrir, digite Regedit.

  3. Clique em OK.

  4. No Editor do Registro, selecione a seguinte chave do Registro de uma instância do SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\ID_da_instância\MSSQLServer, onde ID_da_instância é o identificador da instância de servidor em que você está carregando separadores de palavras. Por exemplo, para a instância de servidor padrão, o valor da chave do Registro é:

    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\Setup

    O painel direito exibe o valor FullTextDefaultPath, que contém o caminho específico da instância para a pasta FTData. Por exemplo, para a instância padrão do SQL Server 2008, o caminho é:

    C:\Arquivos de Programas\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\FTData

Registrando um separador de palavras e os componentes lingüísticos relacionados

O procedimento de instalação da Microsoft para separadores de palavras de terceiros licenciados consiste em três fases. A lista a seguir resume esses estágios, cujas etapas são descritas posteriormente nesta seção.

  1. Adicione o(s) ID(s) de Classe COM referente(s) às interfaces de separador de palavras e lematizador do idioma que está sendo registrado como uma chave para o nó <InstanceRoot>\MSSearch\CLSID do Registro.

  2. Adicione uma chave ao nó <InstanceRoot>\MSSearch\Language para o idioma.

  3. Adicione os valores de configuração que especificam a localização do léxico e dos arquivos de dicionário de sinônimos do idioma.

ObservaçãoObservação

O separador de palavras para dinamarquês é usado como um exemplo nesta seção. Os valores necessários para a instalação de separadores de palavras de cada idioma são fornecidos nas tabelas mais adiante neste tópico.

Fase 1: Adicionar o(s) ID(s) de Classe COM referente(s) às Interfaces do Separador de Palavras e do Lematizador do idioma que está sendo registrado

Observação sobre cuidadosCuidado

A edição incorreta do Registro pode danificar seriamente o sistema. Antes de alterar o Registro, faça um backup dos dados importantes do computador.

Para adicionar ID(s) de Classe COM desses componentes para o idioma dinamarquês**:**

  1. Abra o Editor do Registro:

    1. Clique em Iniciar e em Executar.

    2. Na caixa de diálogo Executar, na caixa Abrir, digite Regedit.

  2. No Editor do Registro, selecione a seguinte chave do Registro para a instância do SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\CLSID

  3. Na barra de menus, clique em Editar, clique em Novo e clique em Chave.

  4. Digite {16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}.

  5. Pressione ENTER.

  6. No painel à direita, clique com o botão direito do mouse no valor do Registro Default e, em seguida, clique em Modificar.

  7. Na caixa de diálogo Editar Cadeia de Caracteres, na caixa Dados de valor, digite danlr.dll e clique em OK.

  8. Repita as etapas 3 a 7, substituindo o valor da etapa 4 por {83BC7EF7-D27B-4950-A743-0F8E5CA928F8}.

Para um dado idioma, siga as etapas acima, substituindo os valores de chave das etapas 4 e 8 pelos valores de chave do idioma desejado. Esses valores estão listados abaixo. Na etapa 7, substitua danlr.dll pelo nome .dll do idioma desejado.

Idioma

Valor da chave para a etapa 4

.DLL para a etapa 7

Valor da chave para a etapa 8

Dinamarquês

{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}

danlr.dll

{83BC7EF7-D27B-4950-A743-0F8E5CA928F8}

Polonês

{B8713269-2D9D-4BF5-BF40-2615D75723D8}

lrpolish.dll

{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6}

Turco

{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6}

trklr.dll

{8DF412D1-62C7-4667-BBEC-38756576C21B}

Fase 2: Adicionar uma chave ao nó <InstanceRoot>\MSSearch\Language para o idioma

Para adicionar uma chave a esse nó para o idioma dinamarquês:

  1. Selecione a seguinte chave do Registro para a instância padrão do SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language

  2. Repita as etapas de 3 a 5 do procedimento anterior, substituindo o nome da chave na etapa 4 por dan.

Para um dado idioma, siga as etapas anteriores, substituindo o nome da chave na etapa 4 pelo valor listado abaixo para o idioma específico.

Idioma

Nome da chave para a etapa 4

Dinamarquês

dan

Polonês

plk

Turco

trk

Fase 3: Adicionar valores de configuração que especificam a localização de cada componente lingüístico de um idioma

Para adicionar valores de configuração para esses componentes para o idioma dinamarquês:

  1. Selecione a chave do Registro que você digitou na Fase 2. Para a instância padrão do SQL Server, seria: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\dan

  2. Na barra de menus, clique em Editar, em Novo e em Valor da Cadeia de Caracteres.

  3. Digite TsaurusFile.

  4. Pressione ENTER.

  5. Clique com o botão direito do mouse no valor do Registro TsaurusFile que você acabou de adicionar e clique em Modificar.

  6. Na caixa de diálogo Editar Cadeia de Caracteres, na caixa Dados devalor, digite tsdan.xml.

  7. Clique em OK.

Repita as etapas de 2 a 7 para os demais componentes lingüísticos do idioma — arquivo de dicionário de sinônimos, idioma (localidade), separador de palavras e lematizador. Os valores para registrar esses componentes para os idiomas dinamarquês, polonês ou turco são fornecidos abaixo.

Valores para dinamarquês

Repita as etapas de 2 a 7 para adicionar cada conjunto de valores listados abaixo, substituindo o tipo de valor específico do idioma (etapa 2), o nome do valor (etapas 3 e 5) e os dados do valor (etapa 6) de cada valor.

Tipo de valor para a etapa 2

Nomes de valor para as etapas 3 e 5

Tipo de valor para a etapa 6

Valor da cadeia de caracteres

TsaurusFile

tsdan.xml

Valor DWORD

Localidade

00000406

Valor da cadeia de caracteres

WBreakerClass

{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}

Valor da cadeia de caracteres

StemmerClass

{83BC7EF7-D27B-4950-A743-0F8E5CA928F8}

Valores para polonês

Para o idioma polonês, siga as etapas descritas acima, usando os valores listados abaixo. Selecione a chave do Registro que você inseriu para polonês na Fase 2. Para a instância padrão do SQL Server, seria: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\plk

Execute as etapas de 2 a 7 para adicionar cada conjunto de valores listados abaixo, substituindo o tipo de valor específico do idioma (etapa 2), o nome do valor (etapas 3 e 5) e os dados do valor (etapa 6) de cada valor.

Tipo de valor para a etapa 2

Nomes de valor para as etapas 3 e 5

Dados de valor para a etapa 6

Valor da cadeia de caracteres

TsaurusFile

tsplk.xml

Valor DWORD

Localidade

00000415

Valor da cadeia de caracteres

WBreakerClass

{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6}

Valor da cadeia de caracteres

StemmerClass

{B8713269-2D9D-4BF5-BF40-2615D75723D8}

Valores para turco

Para o idioma Turco, siga as etapas descritas acima, usando os valores listados abaixo. Selecione a chave do Registro que você inseriu para o idioma turco na Fase 2. Para a instância padrão do SQL Server, seria: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\trk

Execute as etapas de 2 a 7 para adicionar cada conjunto de valores listados abaixo, substituindo o tipo de valor específico do idioma (etapa 2), o nome do valor (etapas 3 e 5) e os dados do valor (etapa 6) de cada valor.

Tipo de valor para a etapa 2

Nomes de valor para as etapas 3 e 5

Dados de valor para a etapa 6

Valor da cadeia de caracteres

TsaurusFile

tstrk.xml

Valor DWORD

Localidade

0000041f

Valor da cadeia de caracteres

WBreakerClass

{8DF412D1-62C7-4667-BBEC-38756576C21B}

Valor da cadeia de caracteres

StemmerClass

{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6}

Atualizando a lista de idiomas suportados pela pesquisa de texto completo

Depois de carregar separadores de palavras de terceiros, você precisa atualizar a lista de LCIDs suportados para indexação e consulta de texto completo. Para atualizar a lista, use o procedimento armazenado do sistema sp_fulltext_service para atualizar a lista de idiomas, da seguinte maneira:

exec sp_fulltext_service 'update_languages';

Os idiomas dos separadores de palavras recém-carregados agora serão listados pela exibição do catálogo sys.fulltext_languages.