CRIAR UM MODELO DE MINERAÇÃO (DMX)

Cria um novo modelo de mineração e uma nova estrutura de mineração no banco de dados. É possível criar um modelo definindo o novo modelo na instrução ou usando o PMML (Predictive Model Markup Language). Essa segunda opção é apenas para usuários avançados.

A estrutura de mineração recebe o nome anexando "_structure" ao nome do modelo, o que garante que o nome da estrutura seja diferente do nome do modelo.

Para criar um modelo de mineração para uma estrutura de mineração existente, use a instrução ALTER MINING STRUCTURE (DMX).

Sintaxe

CREATE [SESSION] MINING MODEL <model>
(
    [(<column definition list>)]
)
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]
CREATE MINING MODEL <model> FROM PMML <xml string>

Argumentos

  • model
    Um nome exclusivo para o modelo.

  • column definition list
    Uma lista de definições de coluna separadas por vírgulas.

  • algorithm
    O nome de um algoritmo de mineração de dados, conforme definido pelo provedor atual.

    ObservaçãoObservação

    Uma lista dos algoritmos suportados pelo provedor atual pode ser recuperada usando Conjunto de linhas DMSCHEMA_MINING_SERVICES. Para exibir os algoritmos suportados na instância atual de Analysis Services, consulte Propriedades de mineração de dados.

  • parameter list
    Opcional. Uma lista separada por vírgulas de parâmetros definidos pelo provedor para o algoritmo.

  • XML string
    (Apenas para uso avançado.) Um modelo codificado por XML (PMML). A cadeia deve estar entre aspas simples (').

A cláusula SESSION permite que você crie um modelo de mineração removido automaticamente do servidor quando a conexão fecha ou o tempo da sessão esgota. Modelos de mineração SESSION são úteis, pois não exigem que o usuário seja um administrador de banco de dados e possa apenas usar espaço em disco enquanto a conexão estiver aberta.

A cláusula WITH DRILLTHROUGH habilita o detalhamento no novo modelo de mineração. O detalhamento pode ser habilitado somente durante a criação do modelo. Para alguns tipos de modelo, o detalhamento é necessário para procurar o modelo no visualizador personalizado. O detalhamento não é necessário para previsão ou para procurar o modelo usando o Visualizador de Árvore de Conteúdo Genérica da Microsoft.

A instrução CREATE MINING MODEL cria um novo modelo de mineração com base na lista de definições da coluna, no algoritmo e na lista de parâmetros do algoritmo.

Lista de definições da coluna

Você define a estrutura de um modelo que usa a lista de definições da coluna incluindo as seguintes informações para cada coluna:

  • Nome (obrigatório)

  • Tipo de dados (obrigatório)

  • Distribuição

  • Lista de sinalizadores de modelagem

  • Tipo de conteúdo (obrigatório)

  • Solicitação de previsão, que indica ao algoritmo para prever esta coluna, indicada pela cláusula PREDICT ou PREDICT_ONLY

  • Relação com uma coluna de atributo (obrigatório, apenas se aplicável), indicada pela cláusula RELATED TO

Use a seguinte sintaxe para obter a lista de definições de coluna para definir uma única coluna:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>] 

Use a seguinte sintaxe para obter a lista de definições de coluna para definir uma coluna de tabela aninhada:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )

Exceto para os sinalizadores de modelagem, não é possível usar mais de uma cláusula de um grupo específico para definir uma coluna. É possível definir diversos sinalizadores de modelagem para uma coluna.

Para obter uma lista dos tipos de dados, dos tipos de conteúdo, de distribuições de coluna e de sinalizadores de modelagem que podem ser usados para definir uma coluna, consulte os seguintes tópicos:

É possível adicionar uma cláusula a instrução para descrever a relação entre duas colunas. O Analysis Services suporta o uso da seguinte cláusula de <relação de coluna>.

  • RELATED TO
    Este formulário indica uma hierarquia de valor. O destino de uma coluna RELATED TO pode ser a coluna chave em uma tabela aninhada, uma coluna com um valor discreto na linha de caso ou outra coluna com uma cláusula RELATED TO, que indica uma hierarquia mais profunda.

Use uma cláusula de previsão para descrever como a coluna de previsão é usada. A seguinte tabela descreve as duas possíveis cláusulas.

cláusula de <previsão>

Descrição

PREDICT

Esta coluna pode ser prevista pelo modelo e pode ser fornecida em casos de entrada para prever o valor de outras colunas de previsão.

PREDICT_ONLY

Esta coluna pode ser prevista pelo modelo, mas seus valores não podem ser usados em casos de entrada para prever o valor de outras colunas de previsão.

Lista de definições de parâmetro

Você pode usar a lista de parâmetros para ajustar o desempenho e a funcionalidade de um modelo de mineração. A sintaxe da lista de parâmetros é a seguinte:

[<parameter> = <value>, <parameter> = <value>,…]

Para obter uma lista dos parâmetros associados a cada algoritmo, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados).

Comentários

Se você desejar criar um modelo que tem um conjunto de dados de teste interno, deverá usar a instrução CREATE MINING STRUCTURE seguida por ALTER MINING STRUCTURE. No entanto nem todos os tipos de modelo oferecem suporte a um conjunto de dados de validação. Para obter mais informações, consulte CRIAR UMA ESTRUTURA DE MINERAÇÃO (DMX).

Para obter instruções sobre como criar um modelo de mineração usando a instrução CREATEMODEL, consulte Tutorial DMX de previsão de série temporal.

Exemplo de Naive Bayes

O exemplo seguinte usa o algoritmo do Naive Bayes Microsoft para criar um novo modelo de mineração. A coluna Bike Buyer está definida como o atributo previsível.

CREATE MINING MODEL [NBSample]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE PREDICT
)
USING Microsoft_Naive_Bayes

Exemplo de modelo de associação

O seguinte exemplo usa o algoritmo de associação da Microsoft para criar um novo modelo de mineração. A instrução aproveita a capacidade de aninhar uma tabela dentro da definição do modelo usando uma coluna de tabelas. O modelo é modificado usando os parâmetros MINIMUM_PROBABILITY e MINIMUM_SUPPORT.

CREATE MINING MODEL MyAssociationModel (
    OrderNumber TEXT KEY,
    [Products] TABLE PREDICT (
        [Model] TEXT KEY
    )
)
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)

Exemplo de cluster de seqüência

O exemplo seguinte usa o algoritmo MSC da Microsoft para criar um novo modelo de mineração. Duas chaves são usadas para definir o modelo. A coluna OrderNumber é usada como a chave do caso e especifica pedidos individuais. A coluna LineNumber é usada como a chave de tabela aninhada e especifica a seqüência na qual os itens foram adicionados a um pedido.

CREATE MINING MODEL BuyingSequence (
    [Order Number] TEXT KEY,
    [Products] TABLE 
     (
        [Line Number] LONG KEY SEQUENCE,
        [Model] TEXT DISCRETE PREDICT
    )
)
USING Microsoft_Sequence_Clustering

Exemplo de série de tempo

O seguinte exemplo usa o algoritmo Microsoft Times Series para criar um novo modelo de mineração usando o algoritmo ARTxp. ReportingDate é a coluna de chave para a série temporal e ModelRegion é a coluna de chave para a série de dados. Neste exemplo, presume-se que a periodicidade dos dados é a cada 12 meses. Portanto, o parâmetro PERIODICITY_HINT é definido como 12.

ObservaçãoObservação

Você deve especificar o parâmetro PERIODICITY_HINT usando caracteres de chave. Além disso, como o valor é uma cadeia de caracteres, ele deve estar entre aspas simples: "{<valor numérico>} ".

CREATE MINING MODEL SalesForecast (
        ReportingDate DATE KEY TIME,
        ModelRegion TEXT KEY,
        Amount LONG CONTINUOUS PREDICT,
        Quantity LONG CONTINUOUS PREDICT
)
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')