Exigences et considérations concernant le traitement (exploration de données)

Article
07/30/2013

Cette rubrique décrit quelques considérations techniques que vous devez garder à l'esprit lors du traitement des objets d'exploration de données. Pour une présentation générale du traitement et de la manière dont il s'applique à l'exploration de données, consultez Traitement des objets d'exploration de données.

Requêtes sur le magasin relationnel

Traitement des structures d'exploration de données

Traitement des modèles d'exploration de données

Requêtes sur le magasin relationnel au cours du traitement

Pour l'exploration de données, le traitement s'effectue en trois phases : l'interrogation des données sources, la détermination des statistiques brutes et l'utilisation de la définition et de l'algorithme du modèle pour l'apprentissage du modèle d'exploration de données.

Le serveur Analysis Services émet des requêtes vers la base de données qui fournit les données brutes. Cette base de données peut être une instance de SQL Server 2012 ou d'une version antérieure du moteur de base de données SQL Server. Lors du traitement d'une structure d'exploration de données, les données de la source sont transférées à cette structure et conservées sur le disque dans un nouveau format compressé. Seules certaines colonnes de la source de données sont traitées : il s'agit des colonnes incluses dans la structure d'exploration de données, comme défini par les liaisons.

À l'aide de ces données, Analysis Services génère un index de toutes les données et colonnes discrétisées, et crée un index séparé pour les colonnes continues. Une requête est émise pour chaque table imbriquée pour créer l'index. De plus, une requête supplémentaire par table imbriquée est générée pour traiter les relations entre chaque paire table imbriquée/table de cas. La raison pour laquelle il convient de créer plusieurs requêtes est le traitement d'une banque de données multidimensionnelle interne spéciale. Vous pouvez limiter le nombre de requêtes qu'Analysis Services envoie au magasin relationnel en définissant la propriété de serveur DatabaseConnectionPoolMax. Pour plus d'informations, consultez Propriétés OLAP.

Lors du traitement du modèle, celui-ci ne relit pas les données à partir de la source de données, mais il récupère à la place un résumé des données à partir de la structure d'exploration de données. À l'aide du cube qui a été créé, ainsi que des données d'index et de cas mises en cache, le serveur crée des threads indépendants pour l'apprentissage des modèles.

Pour plus d'informations sur les éditions de SQL Server qui prennent en charge le traitement de modèles parallèles, consultez Fonctionnalités prises en charge par les éditions de SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Traitement des structures d'exploration de données

Une structure d'exploration de données peut être traitée avec tous les modèles dépendants, ou séparément. Le traitement d'une structure d'exploration de données séparément des modèles peut être utile lorsqu'il est envisagé que le traitement de certains modèles prenne beaucoup de temps et que vous souhaitez différer cette opération.

Pour plus d'informations, consultez traiter une structure d'exploration de données.

Si vous êtes désireux de conserver de l'espace disponible sur le disque dur, notez que Analysis Services conserve localement les caches de structure d'exploration de données. Cela signifie que toutes les données d'apprentissage sont recopiées sur votre disque dur local. Si vous ne voulez pas mettre en cache ces données, vous pouvez modifier le paramètre par défaut en attribuant à la propriété MiningStructureCacheMode sur la structure d'exploration de données la valeur ClearAfterProcessing. Cela aura pour conséquence de supprimer le cache une fois les modèles traités et de désactiver l'extraction sur la structure d'exploration de données. Pour plus d'informations, consultez Requêtes d'extraction (exploration de données).

Par ailleurs, si vous effacez le cache, vous ne pourrez pas utiliser le jeu de test d'exclusion (si vous en avez défini un) et la définition de la partition du jeu de test sera perdue. Pour plus d'informations sur les ensembles de tests d'exclusion, consultez Jeux de données d'apprentissage et de test.

Traitement des modèles d'exploration de données

Vous pouvez traiter un modèle d'exploration de données séparément de la structure d'exploration de données associée, ou vous pouvez traiter tous les modèles basés sur la structure avec cette dernière.

Pour plus d'informations, consultez Traiter un modèle d'exploration de données.

Toutefois, dans Outils de données SQL Server (SSDT) et SQL Server Management Studio, vous ne pouvez pas sélectionner plusieurs modèles d'exploration de données à traiter avec la structure. Si vous devez contrôler les modèles traités, vous devez les sélectionner individuellement, ou utiliser XMLA ou DMX pour les traiter en série.

Lorsqu'un retraitement est requis

Vous devez traiter les modèles Analysis Services que vous définissez avant de commencer à les utiliser. Vous devez également retraiter les modèles d'exploration de données chaque fois que vous modifiez la structure d'exploration de données, mettez à jour les données d'apprentissage, modifiez un modèle d'exploration de données existant ou ajoutez un nouveau modèle d'exploration de données à la structure.

Les modèles d'exploration de données sont également traités dans les scénarios suivants :

Déploiement d'un projet : en fonction des paramètres et de l'état actuel du projet, les modèles d'exploration de données du projet sont généralement traités intégralement lorsque le projet est déployé.

Lorsque vous commencez le déploiement, le traitement démarre automatiquement, à moins qu'il n'existe une version préalablement traitée sur le serveur Analysis Services et qu'aucune modification sur la structure n'ait eu lieu. Vous pouvez déployer un projet en sélectionnant Déployer la solution dans la liste déroulante ou en appuyant sur la touche F5. Plusieurs possibilités s'offrent à vous :

Pour plus d'informations sur la définition des propriétés de déploiement d'Analysis Services qui contrôlent la manière dont les modèles d'exploration de données sont déployés, consultez Déploiement de solutions d'exploration de données.

Déplacement d'un modèle d'exploration de données : lorsque vous déplacez un modèle d'exploration de données à l'aide de la commande EXPORT, seule la définition du modèle est exportée, laquelle comprend le nom de la structure d'exploration de données qui doit fournir des données au modèle.

Exigences de retraitement pour les scénarios suivants utilisant les commandes EXPORT et IMPORT :

La structure d'exploration de données existe sur l'instance cible et la structure d'exploration de données est dans un état non traité.

La structure et le modèle doivent être retraités.
La structure d'exploration de données existe sur l'instance cible et la structure d'exploration de données a été traitée. Seul le modèle d'exploration de données a été exporté.

Le modèle peut être utilisé sans traitement.
La définition de la structure d'exploration de données a également été exportée à l'aide du mot-clé WITH DEPENDENCIES.

La structure et le modèle doivent être retraités.

Pour plus d'informations, consultez Exporter et importer des objets d'exploration de données.

Voir aussi

Concepts

Structures d'exploration de données (Analysis Services – exploration de données)

Traitement des objets de modèles multidimensionnels

Exigences et considérations concernant le traitement (exploration de données)

Requêtes sur le magasin relationnel au cours du traitement

Traitement des structures d'exploration de données

Traitement des modèles d'exploration de données

Lorsqu'un retraitement est requis

Voir aussi

Concepts

Ressources supplémentaires