Lição 1: Criando a estrutura de mineração de Comprador de Bicicleta

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

Nesta lição, você criará uma estrutura de mineração que permite prever se um cliente potencial da Ciclos da Adventure Works irá adquirir uma bicicleta. Se você estiver familiarizado com estruturas de mineração e sua função na mineração de dados, consulte estruturas de mineração e 40; Analysis Services – Data Mining e 41;.

A estrutura de mineração de comprador de bicicleta que você criará nesta lição oferece suporte à adição de modelos de mineração com base no algoritmo Microsoft Clusteringalgoritmo de árvores de decisão Microsoft. Em lições posteriores, você usará os modelos de mineração de clustering para explorar as várias maneiras nas quais os clientes podem ser agrupados e usará os modelos de mineração da árvore de decisão para prever se um cliente potencial comprará ou não uma bicicleta.

Instrução CREATE MINING STRUCTURE

Para criar uma estrutura de mineração, use o Criar estrutura de MINERAÇÃO &40; DMX &41; instrução. O código na instrução pode ser dividido nas seguintes partes:

  • Nomeando a estrutura.

  • Definindo a coluna de chave.

  • Definindo as colunas de mineração.

  • Definindo um conjunto de dados de teste opcional.

A seguir, veja um exemplo genérico da instrução CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

A primeira linha do código define o nome da estrutura:

CREATE MINING STRUCTURE [<mining structure name>]  

Para obter informações sobre como nomear um objeto em extensões DMX (Data Mining), consulte identificadores &40; DMX &41;.

A próxima linha do código define a coluna de chave da estrutura de mineração, que identifica exclusivamente uma entidade nos dados de origem:

<key column>,  

Na estrutura de mineração que você criará, o identificador do cliente, CustomerKey, define uma entidade nos dados de origem.

A próxima linha do código define as colunas de mineração que serão usadas pelos modelos de mineração associados à estrutura de mineração.

<mining structure columns>  

Você pode usar a função DISCRETIZE dentro para diferenciar as colunas contínuas usando a sintaxe a seguir:

DISCRETIZE(<method>,<number of buckets>)

Para obter mais informações sobre como diferenciar colunas, consulte métodos de diferenciação &40; mineração de dados &41;. Para obter mais informações sobre os tipos de colunas de estrutura que você pode definir de mineração, consulte colunas de estrutura de mineração.

A última linha do código define uma partição opcional na estrutura de mineração:

WITH HOLDOUT (<holdout specifier>)  

Você especifica parte dos dados a serem usados no teste dos modelos de mineração relacionados com a estrutura, e os demais dados serão usados para treinamento dos modelos. Por padrão, o Analysis Services cria um conjunto de dados de teste que contém 30% de todos os dados dos casos. Você adicionará a especificação de que o conjunto de dados de teste deve conter 30% dos casos até o máximo de 1000 casos. Se 30% dos casos for inferior a 1000, o conjunto de dados de teste terá uma quantidade menor.

Tarefas da lição

Você executará as seguintes tarefas nesta lição:

  • Criar uma nova consulta em branco.

  • Alterar a consulta para criar a estrutura de mineração.

  • Executar a consulta.

Criando a consulta

A primeira etapa é se conectar a uma instância do Analysis Services e criar uma nova consulta DMX no SQL Server Management Studio.

Para criar uma nova consulta DMX no SQL Server Management Studio

  1. Abra o SQL Server Management Studio.

  2. No conectar ao servidor caixa de diálogo para tipo de servidor, selecione Analysis Services. Em nome do servidor, tipo LocalHost, ou digite o nome da instância do Analysis Services que você deseja se conectar para esta lição. Clique em Conectar.

  3. Em Pesquisador, clique com botão direito a instância do Analysis Services, aponte para nova consulta, e, em seguida, clique em DMX para abrir o Editor de consultas e uma nova consulta em branco.

Alterando a consulta

A próxima etapa é modificar a instrução CREATE MINING STRUCTURE descrita acima para criar a estrutura de mineração de Comprador de Bicicleta.

Para personalizar a instrução CREATE MINING STRUCTURE.

  1. No Editor de Consultas, copie o exemplo genérico da instrução CREATE MINING STRUCTURE na consulta em branco.

  2. Substitua o seguinte:

    [<mining structure>]   
    

    por:

    [Bike Buyer]  
    
  3. Substitua o seguinte:

    <key column>   
    

    por:

    CustomerKey LONG KEY  
    
  4. Substitua o seguinte:

    <mining structure columns>   
    

    por:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. Substitua o seguinte:

    WITH HOLDOUT (holdout specifier>)  
    

    por:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    A instrução completa da estrutura de mineração agora deve ser:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
  6. Sobre o arquivo menu, clique em Salvar Dmxquery1 como.

  7. No Salvar como caixa de diálogo, navegue até a pasta apropriada e nomeie o arquivo Bike Buyer Structure.

Executando a consulta

A última etapa é executar a consulta. Depois que uma consulta é criada e salva, ela precisa ser executada. Ou seja, a instrução precisa ser executada para criar a estrutura de mineração no servidor. Para obter mais informações sobre como executar consultas no Editor de consultas, consulte Editor de consulta do mecanismo de banco de dados e 40; SQL Server Management Studio e 41;.

Para executar a consulta.

  1. No Editor de consultas, na barra de ferramentas, clique em Execute.

    O status da consulta é exibido no mensagens guia na parte inferior do Editor de consulta após a instrução terminar a execução. As mensagens devem exibir:

    Executing the query   
    Execution complete  
    

    Uma estrutura nova nomeada comprador de bicicleta agora existe no servidor.

Na próxima lição, você adicionará modelos de mineração à estrutura que acaba de criar.

Próxima lição

Lição 2: Adicionando modelos de mineração à estrutura de mineração de Comprador de Bicicleta