Traitement des structures et des modèles (Analysis Services - Exploration de données)

Un objet d'exploration de données n'est rien de plus qu'un conteneur vide tant qu'il n'est pas traité. Le traitement d'un modèle d'exploration de données est également appelé apprentissage.

Traitement des structures d'exploration de données :   une structure d'exploration de données reçoit les données d'une source de données externe, comme défini par les liaisons de colonne et métadonnées d'utilisation, puis elle les lit. Ces données sont lues entièrement, puis analysées pour extraire différentes statistiques. Analysis Services contient une représentation compacte des données, appropriée pour l'analyse par les algorithmes d'exploration de données, dans un cache local. Vous pouvez conserver ce cache ou le supprimer lorsque les modèles ont été traités. Par défaut, le cache est stocké. Pour plus d'informations, consultez Procédure : traiter une structure d'exploration de données.

Traitement des modèles d'exploration de données :   un modèle d'exploration de données est vide (il ne contient que des définitions) jusqu'à ce qu'il soit traité. Pour traiter un modèle d'exploration de données, la structure d'exploration de données doit avoir fait l'objet d'un traitement. Le modèle d'exploration de données reçoit les données du cache de la structure d'exploration de données, il applique tous les filtres qui ont pu être créés sur le modèle, puis transmet le jeu de données via l'algorithme pour détecter des motifs. Une fois le modèle traité, il stocke uniquement les résultats du traitement, et non les données. Pour plus d'informations, consultez Procédure : traiter un modèle d'exploration de données.

Le diagramme suivant illustre le flux de données lors du traitement d'une structure d'exploration de données et d'un modèle d'exploration de données.

Traitement des données : source à structure à modèle

Requêtes sur le magasin relationnel au cours du traitement

Le traitement s'effectue en trois phases : l'interrogation des données sources, la détermination des statistiques brutes et l'utilisation de la définition et de l'algorithme du modèle pour l'apprentissage du modèle d'exploration de données.

Le serveur Analysis Services émet des requêtes vers la base de données qui fournit les données brutes. Cette base de données peut être une instance de SQL Server 2008 ou d'une version antérieure du moteur de base de données SQL Server. Lors du traitement d'une structure d'exploration de données, les données de la source sont transférées à cette structure et conservées sur le disque dans un nouveau format compressé. Seules certaines colonnes de la source de données sont traitées : il s'agit des colonnes incluses dans la structure d'exploration de données, comme défini par les liaisons.

À l'aide de ces données, Analysis Services génère un index de toutes les données et colonnes discrétisées, et crée un index séparé pour les colonnes continues. Une requête est émise pour chaque table imbriquée pour créer l'index. De plus, une requête supplémentaire par table imbriquée est générée pour traiter les relations entre chaque paire table imbriquée/table de cas. La création de plusieurs requêtes sert à traiter un cube de traitement analytique en ligne (OLAP) interne spécial. Vous pouvez limiter le nombre de requêtes qu'Analysis Services envoie au magasin relationnel en définissant la propriété de serveur DatabaseConnectionPoolMax. Pour plus d'informations, consultez Propriétés OLAP.

Lors du traitement du modèle, celui-ci ne relit pas les données à partir de la source de données, mais il récupère à la place un résumé des données à partir de la structure d'exploration de données. À l'aide du cube qui a été créé, ainsi que des données d'index et de cas mises en cache, le serveur crée des threads indépendants pour l'apprentissage des modèles.

Dans SQL Server Enterprise, l'ensemble du traitement a lieu en parallèle. Dans SQL Server Standard, le traitement est sérialisé.

Affichage des résultats du traitement

Lorsqu'une structure d'exploration de données a été traitée, elle contient une représentation compacte des données à utiliser dans l'analyse statistique. Si le cache n'a pas été effacé, il est possible d'accéder à ses données en utilisant l'une des méthodes suivantes :

Lorsqu'un modèle d'exploration de données a été traité, il contient uniquement les motifs découlant de l'analyse et les mappages des résultats du modèle vers les données d'apprentissage mises en cache. Vous pouvez parcourir ou interroger les résultats du modèle, soit le contenu du modèle, ou interroger le modèle et les cas de structure, s'ils ont été mis en cache.

Le contenu de chaque modèle d'exploration de données dépend de l'algorithme utilisé pour sa création. Par exemple, si un modèle est un modèle de clustering et si un autre est un modèle d'arbres de décision, le contenu de ces modèles sera très différent même s'ils utilisent exactement les mêmes données. Pour plus d'informations, consultez Contenu du modèle d'exploration de données (Analysis Services - Exploration de données).