Compartilhar via


Criando previsões (Tutorial de mineração de dados básico)

Depois de testar a precisão dos modelos de mineração e decidir que está satisfeito com eles, você poderá criar consultas de previsão usando o Construtor de Consultas de Previsão na guia Previsão de Modelo de Mineração no Designer de Mineração de Dados. Esta interface o ajuda a criar consultas no DMX ou na linguagem DMX (Data Mining Extensions). O DMX tem sintaxe semelhante à de T-SQL mas é usado para consultas em objetos de mineração de dados.

O Construtor de Consultas de Previsão contém três exibições. Com as exibições Design e Consulta, você pode construir e examinar sua consulta. Você pode executar a consulta e visualizar os resultados na exibição Resultado.

Para obter mais informações sobre como usar o Construtor de Consultas de Previsão, consulte Interfaces de Consulta de Mineração de Dados.

Criando a consulta

A primeira etapa na criação de uma consulta de previsão é selecionar um modelo de mineração e tabela de entrada.

Para selecionar um modelo e tabela de entrada

  1. Na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados, na caixa Modelo de Mineração, clique em Selecionar Modelo.

  2. Na caixa de diálogo Selecionar Modelo de Mineração, navegue pela árvore até a estrutura Mala Direta, expanda a estrutura, selecione TM_Decision_Tree e clique em OK.

  3. Na caixa Selecionar Tabela(s) de Entrada, clique em Selecionar Tabela de Casos.

  4. Na caixa de diálogo Selecionar Tabela, na lista Fonte de Dados, selecione Adventure Works DW Multidimensional 2012 .

  5. Em Nome da Tabela/Exibição, selecione a tabela ProspectiveBuyer (dbo) e clique em OK.

    A tabela ProspectiveBuyer é bastante semelhante à tabela de casos vTargetMail.

Mapeando as colunas

Depois de selecionar a tabela de entrada, o Construtor de Consultas de Previsão cria um mapeamento padrão entre o modelo de mineração e a tabela de entrada, com base nos nomes das colunas. Pelo menos uma coluna da estrutura deve corresponder a uma coluna nos dados externos.

Observação importanteImportante

Os dados que você usa para determinar a precisão dos modelos devem conter uma coluna que possa ser mapeada para a coluna previsível. Se essa coluna não existir, você poderá criar uma com valores vazios, mas ela precisa ter o mesmo tipo de dados que a coluna previsível.

Para mapear as colunas da estrutura para as colunas da tabela de entrada

  1. Clique com o botão direito do mouse nas linhas que conectam a janela Modelo de Mineração à janela Selecionar Tabela de Entrada e selecione Modificar Conexões.

    Observe que nem todas as colunas são mapeadas. Adicionaremos mapeamentos para várias Colunas da Tabela. Também geraremos uma nova coluna de data de aniversário com base na coluna de data atual, visando melhorar a correspondência das colunas.

  2. Em Coluna da Tabela, clique na célula Bike Buyer e selecione ProspectiveBuyer.Unknown na lista suspensa.

    Isso mapeia a coluna previsível, [Bike Buyer], para uma coluna da tabela de entrada.

  3. Clique em OK.

  4. No Gerenciador de Soluções, clique com o botão direito do mouse na exibição da fonte de dados Mala Direta e selecione Designer de Exibição.

  5. Clique com o botão direito do mouse na tabela, ProspectiveBuyer, e selecione Novo Cálculo Nomeado.

  6. Na caixa de diálogo Criar Cálculo Nomeado, para Nome da coluna, digite calcAge.

  7. Para Descrição, digite Calcular idade com base na data de nascimento.

  8. Na caixa Expressão, digite DATEDIFF(YYYY,[BirthDate],getdate()) e, em seguida, clique em OK.

    Como a tabela de entrada não tem coluna Idade que corresponda à coluna no modo, você pode usar esta expressão para calcular a idade do cliente a partir da coluna BirthDate na tabela de entrada. Como Idade foi identificada como a coluna mais influente para a previsão da compra de bicicleta, ela deverá estar no modelo e na tabela de entrada.

  9. No Designer de Mineração de Dados, selecione a guia Previsão do Modelo de Mineração e reabra a janela Modificar Conexões.

  10. Em Coluna da Tabela, clique na célula Idade e selecione ProspectiveBuyer.calcAge na lista suspensa.

    Observação sobre cuidadosCuidado

    Se você não encontrar a coluna na lista, poderá ter que atualizar a definição da exibição da fonte de dados que é carregada no designer. Para fazer isso, no menu Arquivo, selecione Salvar tudo. Depois, feche e reabra o projeto no designer.

  11. Clique em OK.

Criando a consulta de previsão

Para criar a consulta de previsão

  1. O primeiro botão da barra de ferramentas da Previsão do Modelo de Mineração é o botão Alternar para a exibição de design de consulta/Alternar para a exibição de resultado da consulta. Clique na seta para baixo desse botão e selecione Design.

  2. Na grade da guia Previsão do Modelo de Mineração, clique na célula da primeira linha vazia da coluna Origem e selecione Função de Previsão.

  3. Na linha Função de Previsão, na coluna Campo, selecione PredictProbability.

    Na coluna Alias da mesma linha, digite Probabilidade de resultado.

  4. Na janela Modelo de Mineração anterior, selecione e arraste [Bike Buyer] para a célula Critérios/Argumento.

    Ao soltar o botão, [TM_Decision_Tree].[Bike Buyer] aparece na célula Critérios/Argumento.

    Isso especifica a coluna de destino da função PredictProbability. Para obter mais informações sobre as funções, consulte Referência de função de DMX (Data Mining Extensions).

  5. Clique na próxima linha vazia na coluna Origem e, em seguida, selecione TM_Decision_Tree mining model**.**

  6. Na linha TM_Decision_Tree, na coluna Campo, selecione Comprador de Bicicleta.

  7. Na linha TM_Decision_Tree, na coluna Critérios/Argumentos, digite =1.

  8. Clique na próxima linha vazia na coluna Origem e, em seguida, selecione tabela ProspectiveBuyer.

  9. Na linha ProspectiveBuyer, na coluna Campo, selecione ProspectiveBuyerKey.

    Isso adicionará o identificador exclusivo à consulta de previsão para que você possa identificar a probabilidade de quem vai comprar ou não uma bicicleta

  10. Adicione mais cinco linhas à grade. Para cada linha, selecione tabela ProspectiveBuyer como a Origem e adicione as seguintes colunas às células Campo:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Por fim, execute a consulta e navegue pelos resultados.

Para executar a consulta e exibir resultados

  1. Na guia Previsão do Modelo de Mineração selecione o botão Resultado.

  2. Depois que a consulta for executada e os resultados exibidos, você poderá revisá-los.

    A guia Previsão do Modelo de Mineração exibe informações de contato para clientes potenciais que têm probabilidade de comprar bicicletas. A coluna Probabilidade de resultado indica a probabilidade da previsão estar certa. Você poderá usar esses resultados para determinar para quais clientes em potencial a mala direta deverá ser direcionada.

  3. Neste momento, você pode salvar os resultados. Você tem três opções:

    • Clique com o botão direito em uma linha de dados nos resultados e selecione Copiar para salvar apenas esse valor (e o título da coluna) na Área de Transferência.

    • Clique com o botão direito em qualquer linha nos resultados e selecione Copiar Tudo para copiar o conjunto de resultados inteiro, inclusive títulos de coluna, na Área de Transferência.

    • Clique em Salvar resultado da consulta para salvar os resultados diretamente no banco de dados da seguinte maneira:

      1. Na caixa de diálogo Salvar Resultado da Consulta de Mineração de Dados, selecione uma fonte de dados ou defina uma nova.

      2. Digite um nome para a tabela que conterá os resultados da consulta.

      3. Use a opção Adicione à DSV para criar a tabela e adicioná-la a uma exibição da fonte de dados existente. Isto será útil se você quiser manter todas as tabelas relacionadas para um modelo, por exemplo, dados de treinamento, dados de origem de previsão e resultados de consulta, na mesma exibição da fonte de dados.

      4. Use a opção Substitua se existir para atualizar uma tabela existente com os resultados mais recentes.

        Use a opção para substituir a tabela se você adicionou alguma coluna à consulta de previsão, alterou os nomes ou tipos de dados de alguma coluna na consulta de previsão, ou se executou alguma instrução ALTER na tabela de destino.

        Além disso, se várias colunas tiverem o mesmo nome (por exemplo, o nome da coluna padrão Expressão), você deverá criar um alias para as colunas com nomes duplicados ou um erro será gerado quando o designer tentar salvar os resultados no SQL Server. A razão é que o SQL Server não permite que várias colunas tenham o mesmo nome.

        Para obter mais informações, consulte Caixa de diálogo Salvar Resultado da Consulta de Mineração de Dados (Exibição de Previsão do Modelo de Mineração).

Próxima tarefa na lição

Usando o detalhamento em dados de estrutura (Tutorial de mineração de dados básico)

Consulte também

Tarefas

Criar uma consulta de previsão usando o construtor de consultas de previsão

Outros recursos

Usando o construtor de consultas de previsão para criar consultas de previsão DMX