Utilisation de l'extraction sur les modèles et les structures d'exploration de données (Analysis Services - Exploration de données)

L'extraction signifie la capacité d'interroger à la fois un modèle d'exploration de données et une structure d'exploration de données pour obtenir des informations détaillées sur les cas inclus dans le modèle ou dans la structure. SQL Server 2008 fournit deux options différentes pour l'extraction des données de cas. Vous pouvez extraire les cas utilisés pour générer les données ou les cas de la structure d'exploration de données.

L'extraction des données de cas est utile si vous souhaitez consulter les cas utilisés pour l'apprentissage du modèle, par opposition à ceux utilisés pour tester le modèle, ou si vous souhaitez examiner les attributs des données de cas.

L'extraction des cas de structure est utile lorsque la structure contient des informations qui peuvent ne pas être disponibles dans le modèle. En général, si votre structure d'exploration de données prend en charge plusieurs types de modèles, les données de la structure sont utilisées de manière plus sélective dans le modèle. Par exemple, vous n'utiliserez pas les informations de contact client dans un modèle de clustering, même si les données ont été incluses dans la structure. Toutefois, après avoir créé le modèle, vous pouvez souhaiter extraire les informations de contact pour les clients regroupés dans un cluster donné.

Utilisation de l'extraction dans le concepteur de modèle d'exploration de données

Si un modèle d'exploration de données a été configuré pour autoriser l'extraction, et si vous avez les autorisations appropriées, lorsque vous parcourez le modèle, vous pouvez cliquer sur un nœud dans la visionneuse appropriée et extraire des informations détaillées sur les cas de ce nœud particulier.

Si les cas d'apprentissage ont été mis en cache lorsque vous avez traité la structure d'exploration de données et si vous disposez des autorisations nécessaires, vous pouvez retourner des informations des cas des modèles et de la structure d'exploration de données, y compris les colonnes non incluses dans le modèle d'exploration de données. Pour plus d'informations, consultez Procédure : extraire des données de cas à partir d'un modèle d'exploration de données.

Pour plus d'informations sur l'activation de l'extraction sur un modèle d'exploration de données existant, consultez Procédure : activer l'extraction pour un modèle d'exploration de données.

Considérations sur l'utilisation de l'extraction

  • Si vous utilisez l'Assistant Exploration de données, l'option d'activation de l'extraction vers les cas de modèles figure sur la dernière page de l'Assistant. L'extraction est désactivée par défaut. Pour plus d'informations, consultez Fin de l'Assistant (Assistant Exploration de données).

  • Si vous créez la structure d'exploration de données avec DMX, utilisez la clause WITH DRILLTHROUGH. Pour plus d'informations, consultez CREATE MINING STRUCTURE (DMX).

  • Vous pouvez ajouter la capacité d'extraire un modèle existant d'exploration de données, mais si vous procédez ainsi, le modèle doit être retraité avant que vous ne puissiez extraire les données.

  • Le principe de l'extraction consiste à extraire des informations sur les cas d'apprentissage mis en cache lorsque vous avez traité la structure d'exploration de données. Par conséquent, si vous choisissez d'effacer les données en cache après avoir traité la structure en modifiant la propriété MiningStructureCacheMode en ClearAfterProcessing, l'extraction ne fonctionnera pas. Pour activer l'extraction aux colonnes de structure, vous devez modifier la propriété MiningStructureCacheMode en KeepTrainingCases, puis retraiter la structure.

  • Si, contrairement au modèle d'exploration de données, la structure d'exploration de données ne vous autorise pas à extraire les données sous-jacentes, vous pouvez n'afficher les informations que des cas de modèle, mais non de la structure d'exploration de données.

Problèmes de sécurité pour l'extraction

Si vous souhaitez extraire les cas de structure du modèle, vérifiez que la propriété AllowDrillThrough de la structure d'exploration de données et du modèle d'exploration de données possède la valeur True. De plus, vous devez être membre d'un rôle ayant les autorisations d'extraction sur la structure et le modèle. Pour plus d'informations sur la manière de créer des rôles, consultez Concepteur de rôle (Analysis Services - Données multidimensionnelles). Pour plus d'informations sur l'assignation d'autorisations qui s'appliquent à des structures d'exploration de données et à des modèles d'exploration de données spécifiques, consultez Octroi d'accès aux structures d'exploration de données et aux modèles d'exploration de données.

Les autorisations d'extraction sont définies séparément sur la structure et le modèle. L'autorisation de modèle permet d'effectuer une extraction à partir du modèle, même si vous n'avez pas d'autorisations sur la structure. Les autorisations d'extraction sur la structure permettent en outre d'inclure des colonnes de structure dans les requêtes d'extraction à partir du modèle, à l'aide de la fonction StructureColumn (DMX).

Notes

Si vous activez l'extraction à la fois sur la structure d'exploration de données et le modèle d'exploration de données, tout utilisateur membre d'un rôle ayant les autorisations d'extraction sur le modèle d'exploration de données peut également consulter les colonnes de la structure d'exploration de données, même si ces colonnes ne sont pas incluses dans le modèle d'exploration de données. Par conséquent, afin de protéger les informations sensibles, vous devez configurer la vue de la source de données de façon à masquer les informations personnelles et à n'autoriser l'accès en extraction sur la structure d'exploration de données qu'en cas de nécessité.

Limitations sur l'extraction

  • Les limitations suivantes s'appliquent aux opérations d'extraction sur un modèle, selon l'algorithme utilisé pour créer le modèle :

Nom de l'algorithme

Question

Algorithme MNB (Microsoft Naive Bayes)

Non pris en charge. Ces algorithmes n'assignent pas de cas aux nœuds spécifiques du contenu.

Algorithme MNN (Microsoft Neural Network)

Non pris en charge. Ces algorithmes n'assignent pas de cas aux nœuds spécifiques du contenu.

Algorithme MLR (Microsoft Logistic Regression)

Non pris en charge. Ces algorithmes n'assignent pas de cas aux nœuds spécifiques du contenu.

Algorithme MLR (Microsoft Linear Regression)

Pris en charge. Toutefois, comme le modèle crée un nœud unique, All, l'extraction retourne tous les cas d'apprentissage pour le modèle. Si le jeu d'apprentissage est volumineux, le chargement des résultats peut durer plusieurs minutes.

Algorithme MTS (Microsoft Time Series)

Pris en charge. Toutefois, vous ne pouvez pas extraire les données de structure ou de cas en utilisant la Visionneuse de modèle d'exploration de données dans le Concepteur de modèle d'exploration de données. Vous devez créer à la place une requête DMX.

De même, vous ne pouvez pas extraire des nœuds spécifiques ou écrire une requête DMX pour extraire les cas de nœuds spécifiques d'un modèle de série chronologique. Vous pouvez extraire les données de cas depuis le modèle ou la structure en utilisant d'autres critères, comme les valeurs de date ou d'attribut.

Si vous souhaitez consulter les détails des nœuds ARTxp et ARIMA créés par l'algorithme MTS (Microsoft Time Series), vous pouvez utiliser la Visionneuse de l'arborescence de contenu générique Microsoft (Concepteur d'exploration de données).

Création de requêtes d'extraction à l'aide de DMX

Pour tous les modèles qui prennent en charge l'extraction, et sous réserve que l'extraction soit activée, vous pouvez extraire les données de cas et de structure en créant une requête DMX dans SQL Server Management Studio ou dans tout autre client prenant en charge DMX. La syntaxe générale pour extraire les cas de modèles et les cas de structure est la suivante :

SELECT <model column list>, StructureColumn('<structure column name') FROM <modelname>.CASES

Par exemple, la requête DMX suivante retourne les cas pour une gamme de produit spécifique dans un modèle de série chronologique. La requête retourne également la colonne Amount, qui n'a pas été utilisée dans le modèle, mais qui est disponible dans la structure d'exploration de données.

SELECT [DateSeries], [Model Region], Quantity, StructureColumn('Amount') AS [M200 Pacific Amount]
FROM Forecasting.CASES
WHERE [Model Region] = 'M200 Pacific'

Notez que, dans cet exemple, un alias est utilisé pour renommer la colonne de structure. Si vous n'assignez pas d'alias à la colonne de structure, la colonne est retournée avec le nom 'Expression'.

Pour plus d'informations sur l'utilisation de requêtes DMX pour retourner les données de cas, consultez SELECT FROM <modèle>.CASES (DMX) et SELECT FROM <structure>.CASES.