Compartilhar via


Criando uma estrutura de modelo de mineração de mala direta (Tutorial de mineração de dados básico)

A primeira etapa para criar um cenário de correspondência destinada é usar o Assistente de Mineração de Dados no Business Intelligence Development Studio para criar uma nova estrutura de mineração e um modelo de mineração de árvore de decisão.

Nesta tarefa, você criará a estrutura de mineração inicial com base no algoritmo de Árvores de Decisão da Microsoft. Para criar a estrutura, primeiro você selecionará tabelas e exibições e depois identificará as colunas que serão usadas no treinamento e as que serão usadas para teste.

Para criar uma estrutura de mineração para o cenário de mala direta

  1. No Gerenciador de Soluções, clique com o botão direito em Estruturas de Mineração e selecione Nova Estrutura de Mineração para iniciar o Assistente de Mineração de Dados.

  2. Na página Bem-vindo ao Assistente de Mineração de Dados, clique em Avançar.

  3. Na página Selecionar Método de Definição, verifique se No banco de dados ou no data warehouse relacional existente está selecionado e clique em Avançar.

  4. Na página Criar a Estrutura de Mineração de Dados, em Qual técnica de mineração de dados você deseja usar?, selecione Árvores de Decisão da Microsoft.

    ObservaçãoObservação

    Se você receber um aviso de que não é possível encontrar nenhum algoritmo de mineração de dados, as propriedades do projeto talvez não sejam configuradas corretamente. Esse aviso ocorre quando o projeto tenta recuperar uma lista de algoritmos de mineração de dados do servidor do Analysis Services e não consegue encontrá-lo. Por padrão, o BI Development Studio usará localhost como servidor. Se você estiver usando uma instância diferente ou uma instância nomeada, altere as propriedades do projeto. Para obter mais informações, consulte Criando um projeto do Analysis Services (Tutorial de mineração de dados básico).

  5. Clique em Avançar.

  6. Na página Selecionar Exibição da Fonte de Dados, em Exibições da fonte de dados disponíveis, selecione Mala Direta. Você pode clicar em Procurar para exibir as tabelas na exibição de fonte de dados e clique em Fechar para retornar ao assistente.

  7. Clique em Avançar.

  8. Na página Especificar Tipos de Tabela , marque a caixa de seleção na coluna Caso para vTargetMail para usá-la como tabela de casos e clique em Avançar. Você usará a tabela ProspectiveBuyer posteriormente para testes; ignore-a por enquanto.

  9. Na página Especificar os Dados de Treinamento, você identificará pelo menos uma coluna previsível, uma coluna de chave e uma coluna de entrada para seu modelo. Marque a caixa de seleção na coluna Previsível da linha Comprador de Bicicleta.

    ObservaçãoObservação

    Observe o aviso na parte inferior da janela. Você não será capaz de navegar até a próxima página até selecionar pelo menos uma coluna Entrada e uma Previsível.

  10. Clique em Sugerir para abrir a caixa de diálogo Sugerir Colunas Relacionadas.

    O botão Sugerir fica habilitado sempre que pelo menos um atributo previsível foi selecionado. A caixa de diálogo Sugerir Colunas Relacionadas lista as colunas que estejam mais relacionadas à coluna previsível e classifica os atributos pela correlação com o atributo previsível. As colunas com uma correlação significativa (confiança acima de 95%) são selecionadas automaticamente para serem incluídas no modelo.

    Revise as sugestões e clique em Cancelar para ignorá-las.

    ObservaçãoObservação

    Se você clicar em OK, todas as sugestões listadas serão marcadas como colunas de entrada no assistente. Se você concordar com apenas algumas das sugestões, deverá alterar os valores manualmente.

  11. Verifique se a caixa de seleção da coluna Chave está selecionada na linha CustomerKey.

    ObservaçãoObservação

    Se a tabela de origem na exibição de fonte de dados indicar uma chave, o Assistente de Mineração de Dados escolherá automaticamente essa coluna como uma chave para o modelo.

  12. Marque as caixas de seleção da coluna Entrada nas linhas a seguir. Você pode marcar várias colunas ao realçar um intervalo de células e pressionar CTRL durante a marcação de uma caixa de seleção.

    • Idade

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gênero

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Region

    • TotalChildren

    • YearlyIncome

  13. Na coluna mais à esquerda da página, marque as caixas de seleção nas linhas a seguir.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName.

    Verifique se essas linhas só possuem marcações na coluna à esquerda. Essas colunas serão adicionadas à sua estrutura mas não serão incluídas no modelo. No entanto, depois que o modelo for criado, elas estarão disponíveis para detalhamento e teste. Para obter mais informações sobre detalhamento, consulte Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados)

  14. Clique em Avançar.