Lição 4: Explorando modelos de mineração Comprador de Bicicleta

Nesta lição, você usará a instrução SELECT (DMX) para explorar o conteúdo na árvore de decisão e os modelos de mineração de clustering criados em Lição 2: Adicionando modelos de mineração à estrutura de mineração previsível.

As colunas contidas em um modelo de mineração não são as colunas definidas pela estrutura de mineração. Ao contrário, constituem um conjunto específico de colunas que descrevem as tendências e os padrões encontrados pelo algoritmo. Essas colunas de modelo de mineração são descritas no conjunto de linhas de esquema Conjunto de linhas DMSCHEMA_MINING_MODEL_CONTENT. Por exemplo, a coluna de MODEL_NAME no conjunto de linhas de esquema de conteúdo traz o nome do modelo de mineração. Para um modelo de mineração de clustering, a coluna de NODE_CAPTION contém o nome de cada cluster e a coluna NODE_DESCRIPTION contém a descrição das características de cada cluster. Você pode explorar essas colunas usando a instrução SELECT FROM <model>.CONTENT em DMX. Também pode usar essa instrução para explorar os dados usados para criar o modelo de mineração. O uso dessa instrução requer que as análises sejam habilitadas na estrutura de mineração. Para obter mais informações sobre a instrução, consulte SELECIONAR A PARTIR DE CASOS DE <modelo> (DMX).

Você também pode retornar todos os estados de uma coluna discreta usando a instrução SELECT DISTINCT. Por exemplo, se você executar esta operação na coluna gênero, a consulta retornará male e female.

Tarefas da Lição

Você executará as seguintes tarefas nesta lição:

  • Explore o conteúdo inserido nos modelos de mineração.

  • Retorne as ocorrências dos dados de origem usadas para fazer um treinamento com os modelos de mineração

  • Explore os diferentes estados disponíveis de uma coluna discreta específica

Retornando o conteúdo de um modelo de mineração

Nesta lição, você usa a instrução SELECT FROM <modelo>.CONTENT (DMX) para retornar os conteúdos do modelo de clustering.

O item a seguir é um exemplo genérico da instrução SELECT FROM <model>.CONTENT:

SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>

A primeira linha do código define que as colunas retornem do conteúdo do modelo de mineração e do modelo de mineração com as quais estão associadas:

SELECT <select list> FROM [<mining model].CONTENT

A cláusula .CONTENT, próxima ao nome do modelo de mineração, determina que você está retornando conteúdo do modelo de mineração. Para obter mais informações sobre as colunas presentes no modelo de mineração, consulte Conjunto de linhas DMSCHEMA_MINING_MODEL_CONTENT.

Você pode optar por usar a linha final do código para filtrar os resultados retornados pela instrução:

WHERE <where clause>

Por exemplo, se você quiser restringir os resultados da consulta apenas aos clusters que contêm um número elevado de ocorrências, você poderá adicionar a cláusula WHERE à instrução SELECT:

WHERE NODE_SUPPORT > 100

Para obter mais informações sobre como usar a instrução WHERE, consulte SELECT (DMX).

Para retornar o conteúdo do modelo de mineração de clustering

  1. No Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX.

    O editor de consultas é exibido com uma consulta nova em branco.

  2. Copie o exemplo genérico da instrução SELECT FROM <model>.CONTENT no campo em branco da consulta.

  3. Substitua o seguinte:

    <select list> 
    

    por:

    Você também pode substituir * por qualquer lista de colunas presente no Conjunto de linhas DMSCHEMA_MINING_MODEL_CONTENT.

  4. Substitua o seguinte:

    [<mining model>] 
    

    por:

    [Clustering]
    

    A instrução completa agora deve ser:

    SELECT * FROM [Clustering].CONTENT
    
  5. No menu Arquivo, clique em Salvar DMXQuery1.dmx como.

  6. Na caixa de diálogo Salvar Como, procure a pasta apropriada e nomeie o arquivo SELECT_CONTENT.dmx.

  7. Na barra de ferramentas, clique no botão Executar.

    A consulta retorna o conteúdo de um modelo de mineração.

Use a análise

O próximo passo é usar a instrução de análise para retornar uma amostragem dos casos usados para treinar o modelo de mineração de árvore de decisão. Nesta lição, use a instrução SELECIONAR A PARTIR DE CASOS DE <modelo> (DMX) para retornar os conteúdos do modelo da árvore de decisão.

Segue um exemplo genérico da instrução SELECT FROM <model>.CASES:

SELECT <select list> 
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')

A primeira linha do código define que as colunas retornem dos dados de origem, e do modelo de mineração a que pertencem:

SELECT <select list> FROM [<mining model>].CASES

A cláusula .CASES especifica que você está executando uma consulta para análise. Para usar o detalhamento, você deve habilitá-lo durante a criação do modelo de mineração.

A linha final do código é opcional e especifica o nó no modelo de mineração do qual você está solicitando os casos:

WHERE IsInNode('<node id>')

Para obter mais informações sobre como usar a instrução WHERE com IsInNode, consulte SELECIONAR A PARTIR DE CASOS DE <modelo> (DMX).

Para retornar os casos usados para treinar o modelo de mineração

  1. No Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX.

    O editor de consultas é exibido com uma consulta nova em branco.

  2. Copie o exemplo genérico da instrução SELECT FROM <model>.CASES no campo em branco da consulta.

  3. Substitua o seguinte:

    <select list> 
    

    por:

    Você também pode substituir * por qualquer lista de colunas presente nos dados de origem (como [Comprador de Bicicleta]).

  4. Substitua o seguinte:

    [<mining model>] 
    

    por:

    [Decision Tree]
    

    A instrução completa agora deve ser:

    SELECT * 
    FROM [Decision Tree].CASES
    
  5. No menu Arquivo, clique em Salvar DMXQuery1.dmx como.

  6. Na caixa de diálogo Salvar como, procure a pasta apropriada e nomeie o arquivo SELECT_DRILLTHROUGH.dmx.

  7. Na barra de ferramentas, clique no botão Executar.

    A consulta retorna os dados de origem que foram usados para treinar os modelos de mineração da árvore de decisão.

Retorne os estados de uma coluna discreta do modelo de mineração

O próximo passo é usar a instrução SELECT DISTINCT para retornar possíveis estados diferentes na coluna de modelo de mineração especificada.

Segue um exemplo genérico da instrução SELECT DISTINCT:

SELECT DISTINCT [<column>] 
FROM [<mining model>]

A primeira linha do código define as colunas do modelo de mineração para as quais os estados retornam:

SELECT DISTINCT [<column>] 

Você deve incluir DISTINCT para retornar todos os estados da coluna. Se você excluir DISTINCT, então a instrução toda se tornará um atalho para uma previsão e retornará o estado mais provável da coluna especificada. Para obter mais informações, consulte SELECT (DMX).

Para retornar os estados de uma coluna discreta

  1. Em Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX.

    O editor de consultas é exibido com uma consulta nova em branco.

  2. Copie o exemplo genérico da instrução SELECT Distinct, no campo em branco da consulta.

  3. Substitua o seguinte:

    [<column,name> 
    

    por:

    [Bike Buyer]
    
  4. Substitua o seguinte:

    [<mining model>] 
    

    por:

    [Decision Tree]
    

    A instrução completa agora deve ser:

    SELECT DISTINCT [Bike Buyer] 
    FROM [Decision Tree]
    
  5. No menu Arquivo, clique em Salvar DMXQuery1.dmx como.

  6. Na caixa de diálogo Salvar Como, procure a pasta apropriada e nomeie o arquivo SELECT_DISCRETE.dmx.

  7. Na barra de ferramentas, clique no botão Executar.

    A consulta retorna os estados possíveis da coluna Comprador de Bicicleta.

Na próxima lição, você poderá prever se os clientes potenciais serão os compradores de bicicleta usando o modelo de mineração da árvore de decisão.