TechNet
Exporter (0) Imprimer
Développer tout

Algorithmes d'exploration de données (Analysis Services - Exploration de données)

 

S'applique à: SQL Server 2016

Un algorithme dans les données d’exploration de données (ou ml) est un ensemble de paramètres heuristiques et les calculs qui crée un modèle de données. Pour créer un modèle, l'algorithme analyse d'abord les données que vous fournissez, à la recherche de types spécifiques de modèles ou de tendances. L’algorithme utilise les résultats de cette analyse sur le nombre d’itérations pour trouver les paramètres optimaux pour la création du modèle d’exploration de données. Ensuite, ces paramètres sont appliqués au jeu de données entier pour extraire des modèles utilisables et des statistiques détaillées.

Le modèle d'exploration de données qu'un algorithme crée à partir de vos données peut prendre des formes variées, dont les suivantes :

  • Un ensemble de clusters qui décrivent la manière dont les cas sont liés dans un dataset.

  • Un arbre de décision qui prédit les résultats et décrit comment les différents critères affectent ces résultats.

  • Un modèle mathématique permettant de prévoir les ventes.

  • Un ensemble de règles qui décrivent la manière dont les produits sont regroupés dans une transaction et les probabilités que les produits soient achetés ensemble.

Les algorithmes fournis dans SQL Server d’exploration de données sont des méthodes les plus populaires, les recherches de dériver des modèles de données. Pour prendre un exemple, clustering K-means est un des algorithmes de clusters plus anciens et disponible largement dans les différents outils et avec de nombreuses implémentations différentes et des options. Toutefois, l’implémentation particulière de clustering K-means utilisé dans SQL Server d’exploration de données a été développée par Microsoft Research et puis optimisé pour les performances avec Analysis Services. Tous les algorithmes d’exploration de données Microsoft peuvent être largement personnalisé et sont entièrement programmables à l’aide des API fournies. Vous pouvez également automatiser la création, de formation et le recyclage des modèles en utilisant les composants d’exploration de données dans Integration Services.

Vous pouvez également utiliser des algorithmes tiers conformes avec OLE DB pour l’exploration de données, ou développer des algorithmes personnalisés qui peuvent être enregistrés en tant que services, puis utilisés dans la SQL Server framework d’exploration de données.

Le choix du meilleur algorithme à utiliser pour une tâche analytique spécifique peut être un véritable défi. Vous pouvez utiliser des algorithmes différents pour effectuer la même tâche professionnelle, mais chaque algorithme produit un résultat différent et certains algorithmes peuvent produire plusieurs types de résultats. Par exemple, vous pouvez utiliser l'algorithme MDT (Microsoft Decision Trees) pas seulement pour des prédictions, mais aussi comme manière de réduire le nombre de colonnes dans un dataset, car l'arbre de décision peut identifier les colonnes qui n'affectent pas le modèle d'exploration de données final.

Choix d'un algorithme par type

SQL Server Exploration de données inclut les types d’algorithmes suivants :

  • Algorithmes de classification prévoient une ou plusieurs variables discrètes, basées sur les autres attributs du jeu de données.

  • Algorithmes de régression prédire une ou plusieurs continues variables numériques, tels que les bénéfices ou les pertes, en fonction d’autres attributs du jeu de données.

  • Algorithmes de segmentation diviser les données en groupes, ou des clusters, des éléments ayant des propriétés similaires.

  • Algorithmes d’association Rechercher des corrélations entre différents attributs d’un groupe de données. L'application la plus courante de ce genre d'algorithme concerne la création de règles d'association, utilisables dans une analyse de panier d'achat.

  • Algorithmes d’analyse de séquence résument les séquences ou épisodes dans les données, comme une série de clics dans un site web ou une série de journaux d’événements précédant la maintenance de l’ordinateur.

Toutefois, il n'y a aucune raison pour laquelle vous devriez être limité à un algorithme dans vos solutions. Les analystes expérimentés utilisent parfois un algorithme pour déterminer les entrées les plus efficaces (autrement dit, les variables), puis appliquent un algorithme différent pour prédire un résultat spécifique en fonction de ces données. SQL Server Exploration de données vous permet de créer plusieurs modèles sur une structure d’exploration de données, donc dans une solution d’exploration de données unique, vous pouvez utiliser un algorithme de clustering, un modèle d’arbre de décision et un modèle Naïve Bayes pour obtenir différents affichages de vos données. Vous pouvez également utiliser plusieurs algorithmes dans une seule solution pour effectuer des tâches distinctes : par exemple, vous pourriez régression permet d’obtenir des prévisions financières et utiliser un algorithme de réseau neuronal pour effectuer une analyse des facteurs qui influencent les prévisions.

Choix d'un algorithme par tâche

Pour vous aider à sélectionner un algorithme en vue d'une utilisation avec une tâche spécifique, le tableau suivant fournit des suggestions pour les types de tâches pour lesquelles chaque algorithme est traditionnellement utilisé.

Exemples de tâchesAlgorithmes Microsoft à utiliser
Prédiction d’un attribut discret :

Signaler les clients dans une liste de prospects comme intéressants ou inintéressants.

Calculer la probabilité qu'un serveur échoue dans les 6 mois suivants.

Classer les résultats des patients et explorer les facteurs connexes.
Algorithme MDT (Microsoft Decision Trees)

 Algorithme MNB (Microsoft Naive Bayes)

 Algorithme de gestion de clusters Microsoft

 Algorithme MNN (Microsoft Neural Network)
Prévoient un attribut continu :

Prévoir les ventes de l'année suivante.

Prédire les visiteurs du site compte tendu des tendances historiques et saisonnières passées.

Générer un score de risque en fonction de données démographiques.
Algorithme MDT (Microsoft Decision Trees)

 Algorithme MTS (Microsoft Time Series)

 Algorithme MLR (Microsoft Linear Regression)
Prévision d’une séquence :

Effectuer une analyse des parcours de visite du site Web d'une société.

Analyser les facteurs conduisant à la défaillance d'un serveur.

Capturer et analyser les séquences d'activités pendant les visites de patients, afin de formuler les meilleures pratiques autour des activités courantes.
Algorithme MSC (Microsoft Sequence Clustering)
Recherche de groupes d’éléments communs dans les transactions :

Utiliser l'analyse du panier d'achat pour déterminer le placement d'un produit.

Suggérer des produits supplémentaires à acheter par un client.

Analyser les données d'enquête de participants à un événement afin de rechercher les activités qui ont été mises en corrélation, pour planifier de futures activités.
Algorithme Microsoft Association

 Algorithme MDT (Microsoft Decision Trees)
Recherche de groupes d’éléments similaires :

Créer des groupes de patients avec profils à risque basés sur des attributs tels que des données démographiques et des comportements.

Analyser les utilisateurs par consultation des habitudes d'achat.

Identifier les serveurs qui ont des caractéristiques d'utilisation similaires.
Algorithme de gestion de clusters Microsoft

 Algorithme MSC (Microsoft Sequence Clustering)

Le tableau suivant fournit des liens vers des ressources de formation pour chacun des algorithmes d’exploration de données de données qui sont fournies dans SQL Server d’exploration de données :

Description de l'algorithme de baseExplique le rôle de l'algorithme et son fonctionnement, et présente les scénarios d'entreprise possibles dans lesquels l'algorithme peut être utile.
Algorithme Microsoft Association

 Algorithme de gestion de clusters Microsoft

 Algorithme MDT (Microsoft Decision Trees)

 Algorithme MLR (Microsoft Linear Regression)

 Algorithme MLR (Microsoft Logistic Regression)

 Algorithme MNB (Microsoft Naive Bayes)

 Algorithme MNN (Microsoft Neural Network)

 Algorithme MSC (Microsoft Sequence Clustering)

 Algorithme MTS (Microsoft Time Series)
Références techniquesFournit des informations techniques sur l'implémentation de l'algorithme, à l'aide de références universitaires selon les besoins. Dresse la liste des paramètres que vous pouvez configurer pour contrôler le comportement de l'algorithme et personnaliser les résultats dans le modèle. Décrit les spécifications de données et fournit des conseils en matière de performances, si possible.
Références techniques relatives à l'algorithme Microsoft Association

 Références techniques relatives à l'algorithme de gestion de clusters Microsoft

 Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

 Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

 Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

 Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

 Microsoft Neural Network Algorithm Technical Reference

 Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)

 Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
Contenu de modèleExplique comment les informations sont structurées dans chaque type de modèle d'exploration de données et indique comment interpréter les informations stockées dans chacun des nœuds.
Contenu du modèle d’exploration de données pour les modèles d’Association & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour le Clustering des modèles & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles d’arbre de décision & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles de régression linéaire & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles de régression logistique & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles Naive Bayes & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles de réseau neuronal & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles de Clustering de séquence & #40 ; Analysis Services - Exploration de données & #41 ;

 Contenu du modèle d’exploration de données pour les modèles de série chronologique & #40 ; Analysis Services - Exploration de données & #41 ;
Requêtes d'exploration de donnéesFournit plusieurs requêtes que vous pouvez utiliser avec chaque type de modèle. Les exemples incluent des requêtes de contenu qui vous permettent d'en savoir plus sur les schémas du modèle, ainsi que des requêtes de prédiction pour vous aider à établir des prédictions en fonction de ces schémas.
Exemples de requêtes de modèle d'association

 Exemples de requêtes de modèle de clustering

 Exemples de requêtes de modèle d'arbre de décision

 Exemples de requête de modèle de régression linéaire

 Exemples de requêtes de modèle de régression logistique

 Naive Bayes Model Query Examples

 Neural Network Model Query Examples

 Sequence Clustering Model Query Examples

 Time Series Model Query Examples
RubriqueDescription
Déterminer l'algorithme utilisé par un modèle d'exploration de donnéesInterroger les paramètres utilisés pour créer un modèle d'exploration de données
Créer un algorithme de plug-in personnaliséAlgorithmes de plug-in
Explorer un modèle à l'aide d'une visionneuse d'algorithmeVisionneuses de modèle d'exploration de données
Afficher le contenu d'un modèle à l'aide d'un format tabulaire génériqueExplorer un modèle à l'aide de la visionneuse de l'arborescence de contenu générique Microsoft
En savoir plus sur la configuration de vos données et l'utilisation d'algorithmes pour créer des modèlesLes Structures d’exploration de données & #40 ; Analysis Services - Exploration de données & #41 ;

 Les modèles d’exploration de données & #40 ; Analysis Services - Exploration de données & #41 ;

Outils d'exploration de données

Ajouts de la communauté

Afficher:
© 2016 Microsoft