Création d'une nouvelle structure d'exploration de données

Lorsque vous générez une solution d'exploration de données dans Microsoft SQL Server Analysis Services, la première étape consiste à créer une structure d'exploration de données à l'aide de la rubrique Assistant Exploration de données (Analysis Services - Exploration de données) dans Business Intelligence Development Studio. La structure d'exploration de données définit le domaine de données à partir duquel les modèles d'exploration de données sont générés. Tous les modèles d'exploration de données sont basés sur une structure.

Les structures d'exploration de données utilisent des sources de données relationnelles ou des sources de données de traitement analytique en ligne (OLAP). Les structures d'exploration de données relationnelles sont basées sur les données stockées dans les tables, fichiers ou systèmes de bases de données relationnelles, définies comme vue de source de données. Les structures d'exploration de données OLAP sont basées sur une dimension et les mesures connexes d'un cube OLAP qui existe sur la même base de données que la structure d'exploration de données.

Pour plus d'informations :Conception des bases de données, Conception d'objets multidimensionnels de base de données Analysis Services

L'Assistant Exploration de données définit automatiquement une structure d'exploration de données et permet d'ajouter un modèle d'exploration de données initial à la structure. Étant donné qu'une structure d'exploration de données peut contenir plusieurs modèles d'exploration de données, vous pouvez utiliser le Concepteur d'exploration de données pour ajouter des modèles d'exploration de données supplémentaires à la structure.

Les sections suivantes fournissent plus d'informations sur la création de structures d'exploration de données avec l'Assistant Exploration de données et sur la définition des options de la structure d'exploration de données qui permettent de créer un jeu de test ou d'exécuter des requêtes sur les données de la structure d'exploration de données.

  • Création d'une structure d'exploration de données relationnelle

  • Création d'une structure d'exploration de données OLAP

  • Activation de l'exclusion et de l'extraction

Création d'une structure d'exploration de données relationnelle

Les structures d'exploration de données relationnelles peuvent être basées sur n'importe quelles données disponibles par le biais d'une source de données OLE DB. Si les données sources sont contenues dans plusieurs tables, vous pouvez créer une vue de source de données qui réunit les tables et colonnes dont vous avez besoin. Si les tables incluent des relations un-à-plusieurs -- par exemple, vous avez plusieurs enregistrements d'achats pour chaque client que vous souhaitez analyser -- vous pouvez ajouter les deux tables et utiliser une table comme la table de cas et les données du côté « plusieurs » de la relation comme tables imbriquées.

Pour plus d'informations :Tables imbriquées (Analysis Services - Exploration de données)

L'Assistant Exploration de données vous guide à travers les étapes suivantes pour créer la structure d'un nouveau modèle d'exploration de données :

  1. sélection d'un type de source de données, dans ce cas une base de données relationnelle ;

  2. Choix de générer simplement une structure ou une structure avec un modèle d'exploration de données.

  3. Sélection d'un algorithme pour le modèle.

  4. sélection d'une source de données ;

  5. sélection d'une table de cas et, si nécessaire, de tables imbriquées ;

  6. Sélection du type pour chaque colonne (colonne prédictible, colonne d'entrée ou colonne clé).

  7. spécification des types de contenu des colonnes ;

  8. Spécification d'un jeu de données d'exclusion facultatif.

  9. Activation de l'extraction sur la structure ; dénomination et enregistrement de la nouvelle structure d'exploration de données et du modèle d'exploration de données associé.

Pour plus d'informations :Algorithmes d'exploration de données (Analysis Services – exploration de données), Colonnes d'un modèle d'exploration de données, Colonnes de structure d'exploration de données, Types de données (Exploration de données), Types de contenu (Exploration de données)

Création d'une structure d'exploration de données OLAP

Les cubes OLAP contiennent souvent tant de membres et de dimensions qu'il peut être difficile de déterminer l'emplacement où doit commencer l'exploration de données. Pour aider à identifier les modèles que les cubes contiennent, vous identifiez généralement une seule dimension d'intérêt, puis commencez à explorer les modèles en rapport avec cette dimension. Le tableau suivant répertorie plusieurs tâches d'exploration de données OLAP courantes, décrit des exemples de scénarios d'application de chaque tâche et identifie l'algorithme d'exploration de données à utiliser pour chaque tâche.

Tâche

Exemple de scénario

Algorithme

Regrouper des membres en clusters

Segmentez une dimension de clients en fonction des propriétés de membre des clients, des produits achetés par les clients et du montant dépensé par les clients.

Algorithme MC (Microsoft Clustering)

Rechercher des membres intéressants ou anormaux

Identifiez des magasins intéressants ou anormaux dans une dimension de magasins en fonction des ventes, des bénéfices, de la situation géographique et de la taille des magasins.

Algorithme MDT (Microsoft Decision Trees)

Rechercher des cellules intéressantes ou anormales

Identifiez les ventes des magasins qui ne suivent pas les tendances générales dans le temps.

Algorithme MTS (Microsoft Time Series)

L'Assistant Exploration de données vous guide à travers la procédure suivante pour créer la structure d'un nouveau modèle d'exploration de données :

  1. sélection d'un type de source de données, dans ce cas un cube ;

    Notes

    Le cube OLAP doit exister dans la même base de données que la structure d'exploration de données. Vous ne pouvez pas utiliser un cube créé par le complément PowerPivot pour Excel comme une source pour l'exploration de données.

  2. sélection d'un algorithme ;

  3. sélection d'une dimension de cube source ;

  4. sélection d'une clé de cas ;

  5. sélection des colonnes de cas ;

  6. sélection de tables imbriquées, si nécessaire ;

  7. Sélection de l'utilisation pour chaque colonne (colonne prédictible, colonne d'entrée ou colonne clé).

  8. spécification des types de contenu des colonnes ;

  9. découpage du cube source ;

  10. Création d'un jeu de données de test facultatif.

  11. nom et enregistrement de la nouvelle structure d'exploration de données et du modèle d'exploration de données associé.

Vous pouvez définir les options suivantes dans la dernière page de l'Assistant :

  • Autoriser l'extraction

  • Créer une dimension du modèle d'exploration de données

  • Créer un cube en utilisant une dimension du modèle d'exploration de données

Si vous décidez de créer une nouvelle dimension de modèle d'exploration de données dans le cube source, vous pouvez inclure les informations découvertes par l'algorithme d'exploration de données dans la source de données OLAP. En créant une dimension de modèle d'exploration de données, vous pouvez parcourir et interroger le contenu du modèle stocké sous la forme d'une dimension. Cette option est disponible pour les modèles construits à l'aide des algorithmes Microsoft Clustering, Microsoft Decision Trees et Microsoft Association Rules.

Si vous sélectionnez l'option de créer un cube, un nouveau cube est défini sur la base de données qui inclut la dimension du modèle d'exploration de données, et, le cas échéant, toutes les dimensions connexes. Cela vous permet de couper vos données de faits par la hiérarchie découverte par le modèle d'exploration de données.

Pour plus d'informations :Algorithmes d'exploration de données (Analysis Services – exploration de données), Colonnes d'un modèle d'exploration de données, Colonnes de structure d'exploration de données, Types de données (Exploration de données), Types de contenu (Exploration de données)

Activation de l'extraction et de l'exclusion

Lorsque vous créez la structure d'exploration de données, vous devez également définir deux options importantes pour utiliser les données : exclusion et extraction. L'exclusion vous permet de partitionner les données de la structure d'exploration de données en un jeu d'apprentissage et un jeu de test, en vue d'une utilisation avec tous les modèles associés à cette structure. Pour plus d'informations, consultez Partitionnement des données en jeux d'apprentissage et jeux de test (Analysis Services – Exploration de données).

L'extraction permet de consulter les données source de la structure d'exploration de données en interrogeant le modèle d'exploration de données. Cette option est utile lorsque vous consultez les résultats d'un modèle d'exploration de données et souhaitez visualiser des détails supplémentaires provenant de cas sous-jacents. Par exemple, vous pouvez rechercher les informations de contact, les cas utilisés pour l'apprentissage d'un cluster particulier, etc. Pour utiliser l'extraction, vous devez l'activer au moment de créer la structure d'exploration de données ; vous ne pourrez pas l'activer ultérieurement. Pour plus d'informations, consultez Utilisation de l'extraction sur les modèles et les structures d'exploration de données (Analysis Services - Exploration de données).