Tutorial DMX Comprador de bicicleta

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

Nesse tutorial, você aprenderá a criar, treinar e explorar modelos de mineração de dados com o uso da linguagem de consulta DMX (Extensões de Mineração de Dados). Você então utilizará esses modelos de mineração de dados para criar previsões que determinem se um cliente comprará uma bicicleta.

Os modelos de mineração serão criados a partir dos dados contidos no banco de dados de exemplo AdventureWorksDW2012 , que armazena dados para a empresa fictícia Ciclos da Adventure Works. Ciclos da Adventure Works é uma grande empresa industrial e multinacional. A empresa fabrica e vende bicicletas de metal e compostas para os mercados norte-americano, europeu e asiático. A central de operações está situada em Bothell, Washington, com 290 funcionários, e possui várias equipes regionais de vendas distribuídas por toda a sua base de mercado internacional. Para obter mais informações sobre o AdventureWorksDW2012 banco de dados de exemplo, consulte soluções de mineração de dados.

Cenário do tutorial

Ciclos da Adventure Works decidiu estender a análise de dados, criando um aplicativo personalizado que usa a funcionalidade de data mining. Sua meta para o aplicativo personalizado é ser capaz de:

  • Usar como entrada as características específicas sobre um cliente potencial e prever se eles comprarão uma bicicleta.

  • Usar como entrada uma lista de cliente potenciais, assim como características sobre clientes e prever quais comprarão uma bicicleta.

No primeiro caso, os dados de cliente são fornecidos por uma página de registro de cliente e, no segundo caso, uma lista de clientes potenciais é fornecida pelo departamento de marketing da Ciclos da Adventure Works .

Além disso, o departamento de marketing solicitou a capacidade de agrupar clientes existentes em categorias com base em características como onde eles vivem, o número de filhos que possuem e a distância do trabalho. Eles querem consultar se esses agrupamentos podem ser usados para ajudar a estabelecer como meta tipos específicos de clientes. Isso irá requerer um modelo de mineração adicional.

Microsoft SQL Server Analysis Services fornece várias ferramentas que podem ser usadas para executar essas tarefas:

DMX (Extensões de Mineração de Dados) é uma linguagem de consulta fornecida por Analysis Services que pode ser usada para criar e trabalhar com modelos de mineração. O algoritmo Árvores de Decisão da Microsoft cria modelos que podem ser usados para prever se alguém comprará uma bicicleta. O modelo resultante pode usar cliente individual ou uma tabela de clientes como uma entrada. O algoritmo Microsoft Clustering pode criar agrupamentos de clientes com base em características compartilhadas. O objetivo deste tutorial é fornecer os scripts DMX que serão usados no aplicativo personalizado.

Para obter mais informações:soluções de mineração de dados

Estrutura de mineração e modelos de mineração

Antes de começar a criar instruções DMX, é importante compreender os objetos principais que o Analysis Services usa para criar modelos de mineração. A estrutura de mineração é uma estrutura de dados que define o domínio de dados do qual modelos de mineração são criados. Uma única estrutura de mineração pode conter vários modelos de mineração que compartilham o mesmo domínio. Um modelo de mineração aplica um algoritmo de modelo de mineração aos dados que são representados por uma estrutura de mineração.

Os blocos de construção da estrutura de mineração são as colunas da estrutura de mineração, que descrevem os dados que a fonte de dados contém. Essas colunas contêm informações como tipo de dados, tipo de conteúdo e como os dados são distribuídos.

Os modelos de mineração devem conter a coluna de chave descrita na estrutura de mineração, bem como um subconjunto das colunas restantes. O modelo de mineração define o uso para cada coluna e define o algoritmo que é utilizado para criar o modelo de mineração. Por exemplo, em DMX você pode especificar que uma coluna é uma coluna de chave ou uma coluna PREDICT. Se uma coluna não for especificada, será assumido que é uma coluna de entrada.

Em DMX, há dois modos para criar modelos de mineração. Você pode criar a estrutura de mineração e o modelo de mineração associado juntos utilizando a instrução CREATE MINING MODEL, ou pode criar primeiro uma estrutura de mineração utilizando a instrução CREATE MINING STRUCTURE e, em seguida, adicionar um modelo de mineração à estrutura utilizando a instrução ALTER STRUCTURE. Esses métodos são descritos na tabela a seguir.

CREATE MINING MODEL
Use esta instrução para criar juntos uma estrutura de mineração e um modelo de mineração associado que usa o mesmo nome. O nome de modelo de mineração é acrescentado com "Structure" para diferenciá-lo da estrutura de mineração. Esta instrução será útil se você estiver criando uma estrutura de mineração que conterá um único modelo de mineração.

Para obter mais informações, consulte CREATE MINING MODEL (DMX).

ALTER MINING STRUCTURE
Use esta instrução para acrescentar um modelo de mineração a uma estrutura de mineração que já existe no servidor. Essa instrução será útil se você quiser criar uma estrutura de mineração que contenha vários modelos de mineração diferentes. Há várias razões pelas quais você deseja adicionar mais de um modelo de mineração em uma única estrutura de mineração. Por exemplo, é possível criar vários modelos de mineração que usam algoritmos diferentes para verificar qual algoritmo funciona melhor. Você pode criar vários modelos de mineração que usam o mesmo algoritmo, mas com um parâmetro definido de modo diferente para cada modelo de mineração a fim de encontrar a melhor definição para o parâmetro.

Para obter mais informações, consulte ALTER MINING STRUCTURE &40; DMX &41;.

Como você criará uma estrutura que contém vários modelos de mineração, utilizará o método secundário neste tutorial.

Para obter mais informações

Extensões de mineração de dados &40; DMX &41; Referência, Noções básicas sobre o DMX instrução Select, estrutura e o uso de consultas de previsão DMX

O que você aprenderá

Ele se divide nas lições a seguir:

Lição 1: Criando a estrutura de mineração de Comprador de Bicicleta
Nesta lição, você aprenderá como usar o criar instrução para criar estruturas de mineração.

Lição 2: Adicionando modelos de mineração à estrutura de mineração de Comprador de Bicicleta
Nesta lição, você aprenderá como usar o ALTER para adicionar modelos de mineração para uma estrutura de mineração.

Lição 3: Processando a estrutura de mineração Comprador de Bicicleta
Nesta lição você aprenderá a usar o INSERT INTO instrução para processar estruturas de mineração e seus modelos de mineração associados.

Lição 4: Explorando modelos de mineração Comprador de Bicicleta
Nesta lição, você aprenderá como usar o Selecione instrução para explorar o conteúdo dos modelos de mineração.

Lição 5: Executando previsão de consultas
Nesta lição, você aprenderá como usar o PREDICTION JOIN instrução para criar previsões em relação aos modelos de mineração.

Requisitos

Antes de fazer este tutorial, verifique se os seguintes itens estão instalados:

  • Microsoft SQL Server

  • Microsoft SQL Server 2005 Analysis Services (SSAS), SQL Server 2008 Analysis Services (SSAS), SSAS (SQL Server 2016 Analysis Services)ou SQL Server Analysis Services

  • O banco de dados AdventureWorksDW2012. Por padrão, e para reforçar a segurança, os bancos de dados de exemplo não são instalados. Para instalar os bancos de dados de exemplo oficial para Microsoft SQL Server, visite o Microsoft SQL Sample Databases página e selecione os bancos de dados que você deseja instalar. Para obter mais informações sobre como instalar os bancos de dados de exemplo, consulte instalação inicial (Analysis Services).

Consulte também

Tutorial de DMX do Market Basket
Tutorial de mineração de dados básico