Requêtes d'exploration de données

Les requêtes d'exploration de données sont utiles à de nombreuses fins. Plusieurs possibilités s'offrent à vous :

  • Appliquer le modèle aux nouvelles données, pour créer des prédictions uniques ou multiples. Vous pouvez fournir des valeurs d'entrée sous forme de paramètres, ou dans un lot.

  • Obtenir un résumé statistique des données utilisées pour l'apprentissage.

  • Extraire les schémas et les règles, ou générer un profil du cas type qui représente un schéma dans le modèle.

  • Extraire les formules de régression et d'autres calculs qui expliquent les schémas.

  • Obtenir les cas qui conviennent à un schéma particulier.

  • Récupérer des détails sur les cas utilisés dans le modèle, y compris des données non utilisées dans l'analyse.

  • Recycler un modèle en ajoutant de nouvelles données ou effectuer une prédiction croisée.

Cette section fournit une vue d'ensemble des informations dont vous avez besoin pour utiliser les requêtes d'exploration de données. Elle décrit les types de requêtes que vous pouvez créer sur des objets d'exploration de données, présente les outils et les langages de requête et fournit des liens vers des exemples de requêtes que vous pouvez créer sur des modèles générés à l'aide des algorithmes fournis dans l'exploration de données SQL Server.

Fonctionnement des requêtes d'exploration de données

Outils et interfaces de requête

Requêtes pour différents types de modèle

Spécifications

Fonctionnement des requêtes d'exploration de données

L'exploration de données dans Analysis Services prend en charge les types de requêtes suivants :

Avant de créer des requêtes, il est recommandé de vous familiariser avec les différences qu'il existe entre les modèles créés à l'aide de chacun des algorithmes d'exploration de données fournis par SQL Server.

Outils et interfaces de requête

Vous pouvez générer des requêtes d'exploration de données en mode interactif à l'aide de l'un des outils de requête fournis par SQL Server. Le générateur de requêtes de prédiction graphique est fourni à la fois dans Outils de données SQL Server (SSDT) et SQL Server Management Studio. Si vous n'avez pas utilisé le générateur de requêtes de prédiction auparavant, nous vous recommandons de suivre les étapes du Didacticiel sur l'exploration de données de base pour vous familiariser avec l'interface. Pour obtenir une vue d'ensemble rapide des étapes, consultez la rubrique consacrée à la création d'une requête à l'aide du Créer une requête de prédiction à l'aide du Générateur de requêtes de prédiction.

Le générateur de requêtes de prédiction est utile pour démarrer des requêtes que vous personnaliserez ultérieurement. Vous pouvez ajouter facilement des sources de données et les mapper à des colonnes, puis basculer vers la vue DMX et personnaliser la requête en ajoutant une clause WHERE ou d'autres fonctions.

Une fois que vous êtes familiarisé avec les modèles d'exploration de données et la procédure de génération des requêtes, vous pouvez également écrire des requêtes directement à l'aide du langage d'extensions DMX (Data Mining Extensions). DMX est un langage de requête semblable à Transact-SQL, et que vous pouvez utiliser à partir de nombreux clients. DMX est l'outil de choix pour créer des prédictions personnalisées et des requêtes complexes. Pour obtenir une présentation de DMX, consultez Création et interrogation de modèles d'exploration de données à l'aide du langage DMX : didacticiels (Analysis Services - Exploration de données).

Les éditeurs DMX sont fournis à la fois dans Outils de données SQL Server (SSDT) et SQL Server Management Studio. Vous pouvez également utiliser le générateur de requêtes de prédiction pour démarrer vos requêtes, puis changer la vue afin d'activer l'éditeur de texte et copier l'instruction DMX dans un autre client. Pour plus d'informations, consultez Interface de requête d'exploration de données.

Vous pouvez composer des instructions DMX par programme et les envoyer depuis votre client vers le serveur Analysis Services en utilisant AMO ou XMLA. Toutefois, DMX est le langage que vous devez utiliser pour créer des requêtes sur un modèle d'exploration de données.

Vous pouvez également interroger les métadonnées, les statistiques et une partie du contenu du modèle à l'aide de vues de gestion dynamique (DMV), basées sur les ensembles de lignes de schéma d'exploration de données. Ces vues DMV facilitent la récupération d'informations relatives au modèle en tapant des instructions SELECT ; toutefois, vous ne pouvez pas créer de prédictions. Pour plus d'informations sur les vues DMVs prises en charge par Analysis Services, consultez Utiliser des vues de gestion dynamique (DMV) pour surveiller Analysis Services.

Enfin, vous pouvez créer des requêtes d'exploration de données à utiliser dans les packages Integration Services, à l'aide de la Tâche de requête d'exploration de données ou Transformation de requête d'exploration de données. La tâche de flux de contrôle prend en charge plusieurs types de requêtes DMX, alors que la transformation de flux de données ne prend en charge que les requêtes qui utilisent des données dans le flux de données, à savoir les requêtes qui utilisent la syntaxe PREDICTION JOIN.

Requêtes pour différents types de modèle

L'algorithme utilisé lors de la création du modèle influence considérablement le type d'informations que vous pouvez obtenir à partir d'une requête d'exploration de données. La raison de ces différences s'explique par le fait que chaque algorithme traite les données d'une manière différente et stocke différents types de schémas. Par exemple, certains algorithmes créent des clusters ; d'autres créent des arborescences. Par conséquent, vous devrez peut-être utiliser la prédiction et les fonctions de requêtes spécialisées, selon le type de modèle avec lequel vous travaillez.

La liste suivante fournit un résumé des fonctions que vous pouvez utiliser dans les requêtes :

  • Fonctions de prédiction générales : la fonction Predict est polymorphe, ce qui signifie qu'elle fonctionne avec tous les types de modèle. Cette fonction détecte automatiquement le type de modèle que vous utilisez et vous invite à saisir des paramètres supplémentaires. Pour plus d'informations, consultez Predict (DMX).

    AttentionAttention

    Tous les modèles ne sont pas utilisés pour effectuer des prédictions. Par exemple, vous pouvez créer un modèle de clustering qui n'a pas d'attribut prédictible. Toutefois, même si un modèle ne dispose pas d'attribut prédictible, vous pouvez créer des requêtes de prédiction qui retournent d'autres types d'informations utiles à partir du modèle.

  • Fonctions de prédiction personnalisées : chaque type de modèle fournit un ensemble de fonctions de prédiction conçues pour utiliser les schémas créés par l'algorithme.

    Par exemple, la fonction Lag est fournie pour les modèles de série chronologique, pour vous permettre de visualiser les données d'historique utilisées pour le modèle. Pour les modèles de clustering, les fonctions telles que ClusterDistance sont plus explicites.

    Pour plus d'informations sur les fonctions prises en charge pour chaque type de modèle, consultez les liens suivants :

    Exemples de requêtes de modèle d'association

    Algorithme MNB (Microsoft Naive Bayes)

    Exemples de requêtes de modèle de clustering

    Exemples de requêtes de modèle de réseau neuronal

    Exemples de requêtes de modèle d'arbre de décision

    Exemples de requêtes de modèle MSC (Sequence Clustering)

    Exemples de requête de modèle de régression linéaire

    Exemples de requêtes de modèle de série chronologique

    Exemples de requêtes de modèle de régression logistique

    Vous pouvez également appeler des fonctions VBA ou créer vos propres fonctions. Pour plus d'informations, consultez Fonctions (DMX).

  • Statistiques générales : il existe plusieurs fonctions qui peuvent être utilisées avec presque n'importe quel type de modèle et retournent un ensemble standard de statistiques descriptives, telles que l'écart type.

    Par exemple, la fonction PredictHistogram retourne une table qui répertorie tous les états de la colonne spécifiée.

    Pour plus d'informations, consultez Fonctions de prédiction générales (DMX).

  • Statistiques personnalisées : des fonctions de prise en charge supplémentaires sont fournies pour chaque type de modèle, afin de générer des statistiques qui sont appropriées à la tâche analytique spécifique.

    Par exemple, lorsque vous utilisez un modèle de clustering, vous pouvez utiliser la fonction, PredictCaseLikelihood pour retourner le score de vraisemblance associé à un certain cas et cluster. Toutefois, si vous avez créé un modèle de régression linéaire, vous serez plus intéressé à récupérer le coefficient et l'ordonnée à l'origine, ce que vous pouvez effectuer à l'aide d'une requête de contenu.

  • Fonctions de contenu de modèle : le contenu de tous les modèles est représenté dans un format standardisé qui vous permet de récupérer des informations avec une requête simple. Vous créez des requêtes sur le contenu du modèle à l'aide du langage DMX. Vous pouvez également obtenir un certain type de contenu de modèle à l'aide des ensembles de lignes du schéma d'exploration de données.

    Dans le contenu du modèle, la signification de chaque ligne ou nœud de la table retournée diffère selon le type d'algorithme utilisé pour générer le modèle, ainsi que le type de données de la colonne. Pour plus d'informations, consultez Requêtes de contenu (Exploration de données).

Spécifications

Avant de pouvoir créer une requête sur un modèle, le modèle d'exploration de données doit avoir été traité. Le traitement d'objets Analysis Services requiert des autorisations spéciales. Pour plus d'informations sur le traitement des modèles d'exploration de données, consultez Exigences et considérations concernant le traitement (exploration de données).

Exécuter des requêtes sur un modèle d'exploration de données requiert différents niveaux d'autorisations, selon le type de requête que vous exécutez. Par exemple, l'extraction des données de structure ou de cas nécessite généralement des autorisations supplémentaires qui peuvent être définies sur l'objet de structure d'exploration de données ou sur un objet de modèle d'exploration de données.

Toutefois, si votre requête utilise des données externes et inclut des instructions telles que OPENROWSET ou OPENQUERY, la base de données que vous interrogez doit activer ces instructions, et vous devez disposer d'une autorisation sur les objets de base de données sous-jacents.

Pour plus d'informations sur les contextes de sécurité requis pour exécuter des requêtes d'exploration de données, consultez Vue d'ensemble de la sécurité (exploration de données)

Dans cette section

Les rubriques de cette section présentent chaque type de requête d'exploration de données plus en détail et fournissent des liens vers des exemples détaillés de création de requêtes sur des modèles d'exploration de données.

Requêtes de prédiction (Exploration de données)

Requêtes de contenu (Exploration de données)

Requêtes d'extraction (exploration de données)

Requêtes de définition des données (Exploration de données)

Interface de requête d'exploration de données

Tâches associées

Utilisez ces liens pour apprendre à créer et à utiliser des requêtes d'exploration de données.

Tâches

Liens

Afficher des didacticiels et des procédures pas à pas sur les requêtes d'exploration de données

Leçon 6 : création et utilisation de prédictions (Didacticiel sur l'exploration de données de base)

Didacticiel DMX sur la prédiction de série chronologique

Utiliser les outils de requête d'exploration de données dans SQL Server Management Studio et Outils de données SQL Server (SSDT)

Créer une requête DMX dans SQL Server Management Studio

Créer une requête de prédiction à l'aide du Générateur de requêtes de prédiction

Appliquer des fonctions de prédiction à un modèle

Modifier manuellement une requête de prédiction

Utiliser des données externes utilisées dans des requêtes de prédiction

Choisir et mapper les données d'entrée pour une requête de prédiction

Choisir et mapper les données d'entrée pour une requête de prédiction

Utiliser les résultats de requêtes

Afficher et enregistrer les résultats d'une requête de prédiction

Utiliser les modèles de requête DMX et XMLA fournis dans Management Studio

Créer une requête singleton de prédiction à partir d'un modèle

Créer une requête d'exploration de données en utilisant XML/A

Utiliser des modèles Analysis Services dans SQL Server Management Studio

En savoir plus sur les requêtes de contenu et afficher des exemples

Créer une requête de contenu sur un modèle d'exploration de données

Interroger les paramètres utilisés pour créer un modèle d'exploration de données

Requêtes de contenu (Exploration de données)

Définir des options de requête et résoudre les problèmes liés aux autorisations et aux requêtes

Modifier la valeur du délai d'attente pour les requêtes d'exploration de données

Utiliser les composants d'exploration de données dans Integration Services

Tâche de requête d'exploration de données

Transformation de requête d'exploration de données

Voir aussi

Concepts

Algorithmes d'exploration de données (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données (Analysis Services - Exploration de données)