Lição 1: Criando a estrutura de mineração de Comprador de Bicicleta

Nesta lição, você criará uma estrutura de mineração que permite prever se um cliente potencial da Ciclos da Adventure Works irá adquirir uma bicicleta. Se você não estiver familiarizado com as estruturas de mineração e seus papéis na mineração de dados, consulte Estruturas de mineração (Analysis Services – Mineração de dados).

A estrutura de mineração de Comprador de Bicicleta que você criará nesta lição fornece suporte à adição de modelos de mineração com base no Algoritmo Microsoft ClusteringAlgoritmo Árvores de Decisão da Microsoft. Em lições posteriores, você usará os modelos de mineração de clustering para explorar as várias maneiras nas quais os clientes podem ser agrupados e usará os modelos de mineração da árvore de decisão para prever se um cliente potencial comprará ou não uma bicicleta.

Instrução CREATE MINING STRUCTURE

Para criar uma estrutura de mineração, use a instrução CRIAR UMA ESTRUTURA DE MINERAÇÃO (DMX). O código na instrução pode ser dividido nas seguintes partes:

  • Nomeando a estrutura.

  • Definindo a coluna chave

  • Definindo as colunas de mineração.

  • Definindo um conjunto de dados de teste opcional.

A seguir, veja um exemplo genérico da instrução CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]
(
    <key column>,
    <mining structure columns>
) 
WITH HOLDOUT (<holdout specifier>)

A primeira linha do código define o nome da estrutura:

CREATE MINING STRUCTURE [<mining structure name>]

Para obter mais informações sobre como nomear um objeto em DMX (Data Mining Extensions), consulte Identificadores (DMX).

A linha seguinte do código define a coluna chave da estrutura de mineração, que identifica exclusivamente uma entidade nos dados de origem:

<key column>,

Na estrutura de mineração que você criará, o identificador do cliente, CustomerKey, define uma entidade nos dados de origem.

A linha seguinte do código define as colunas de mineração que serão usadas pelos modelos de mineração associados à estrutura de mineração.

<mining structure columns>

Você pode usar a função DISCRETIZE dentro das <colunas de estrutura de mineração> para diferenciar as colunas contínuas usando a sintaxe a seguir:

DISCRETIZE(<method>,<number of buckets>)

Para obter mais informações sobre como diferenciar colunas, consulte Métodos de discretização (mineração de dados). Para obter mais informações sobre os tipos de colunas da estrutura de mineração que você pode definir, consulte Colunas da estrutura de mineração.

A última linha do código define uma partição opcional na estrutura de mineração:

WITH HOLDOUT (<holdout specifier>)

Você especifica parte dos dados a serem usados no teste dos modelos de mineração relacionados com a estrutura, e os demais dados serão usados para treinamento dos modelos. Por padrão, o Analysis Services cria um conjunto de dados de teste que contém 30% de todos os dados dos casos. Você adicionará a especificação de que o conjunto de dados de teste deve conter 30% dos casos até o máximo de 1000 casos. Se 30% dos casos for inferior a 1000, o conjunto de dados de teste terá uma quantidade menor.

Tarefas da lição

Você executará as seguintes tarefas nesta lição:

  • Criar uma nova consulta em branco.

  • Alterar a consulta para criar a estrutura de mineração.

  • Executar a consulta.

Criando a consulta

A primeira etapa é conectar-se com uma instância do Analysis Services e criar uma nova consulta DMX no SQL Server Management Studio.

Para criar uma nova consulta DMX no SQL Server Management Studio

  1. Abra o SQL Server Management Studio.

  2. Na caixa de diálogo Conectar ao Servidor, no Tipo de servidor, selecione Analysis Services. No Nome do servidor, digite LocalHost ou o nome da instância do Analysis Services com a qual você deseja se conectar para esta lição. Clique em Conectar.

  3. No Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX para abrir o Editor de Consultas e uma nova consulta em branco.

Alterando a consulta

A próxima etapa é modificar a instrução CREATE MINING STRUCTURE descrita acima para criar a estrutura de mineração de Comprador de Bicicleta.

Para personalizar a instrução CREATE MINING STRUCTURE.

  1. No Editor de Consultas, copie o exemplo genérico da instrução CREATE MINING STRUCTURE na consulta em branco.

  2. Substitua:

    [<mining structure>] 
    

    por:

    [Bike Buyer]
    
  3. Substitua:

    <key column> 
    

    por:

    CustomerKey LONG KEY
    
  4. Substitua:

    <mining structure columns> 
    

    por:

       [Age] LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned] LONG DISCRETE,
       [Number Children At Home] LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    
  5. Substitua:

    WITH HOLDOUT (holdout specifier>)
    

    por:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    

    A instrução completa da estrutura de mineração agora deve ser:

    CREATE MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key] LONG KEY,
       [Age]LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned]LONG DISCRETE,
       [Number Children At Home]LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    )
    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    
  6. No menu Arquivo, clique em Salvar DMXQuery1.dmx como.

  7. Na caixa de diálogo Salvar como, procure a pasta apropriada e nomeie o arquivo como Estrutura de Comprador de Bicicleta.dmx.

Executando a consulta.

A última etapa é executar a consulta. Depois que uma consulta é criada e salva, ela precisa ser executada. Ou seja, a instrução precisa ser executada para criar a estrutura de mineração no servidor. Para obter mais informações sobre a execução de consultas no Editor de Consultas, consulte Janela do Editor de Consultas do Mecanismo de Banco de Dados do SQL Server Management Studio.

Para executar a consulta.

  • Em Editor de Consultas, na barra de ferramentas, clique em Executar.

    Após a instrução terminar de ser executada, o status da consulta será exibido na guia Mensagens, na parte inferior do Editor de Consultas. As mensagens devem exibir:

    Executing the query 
    Execution complete
    

    Uma estrutura nova nomeada Comprador de Bicicleta existe agora no servidor.

Na próxima lição, você adicionará modelos de mineração à estrutura que acaba de criar.