Algorithmes d'exploration de données

Un algorithme d'exploration de données est un mécanisme qui crée des modèles d'exploration de données. Pour créer un modèle, un algorithme commence par analyser un jeu de données en recherchant des motifs et des tendances spécifiques. L'algorithme utilise ensuite les résultats ce cette analyse pour définir les paramètres du modèle d'exploration de données.

Le modèle d'exploration de données qu'un algorithme crée peut prendre des formes variées, dont les suivantes :

  • Un ensemble de règles qui décrivent la manière dont les produits sont regroupés dans une transaction.
  • Un arbre de décision qui prévoit si un client particulier achètera un produit.
  • Un modèle mathématique permettant d'estimer les ventes.
  • Un ensemble de clusters qui décrivent la manière dont les cas sont liés dans un jeu de données.

Microsoft SQL Server 2005 Analysis Services (SSAS) fournit plusieurs algorithmes à utiliser dans vos solutions d'exploration de données. Ces algorithmes représentent un sous-ensemble de tous les algorithmes qui peuvent être utilisés pour l'exploration de données. Vous pouvez également utiliser des algorithmes tiers conformes à la spécification OLE DB pour l'exploration de données. Pour plus d'informations sur les algorithmes tiers, consultez Algorithmes de plug-in.

Vérification des algorithmes

Analysis Services inclut les types d'algorithmes suivants :

  • Les algorithmes de classification prévoient une ou plusieurs variables discrètes, en fonction des autres attributs dans le jeu de données. Algorithme MDT (Microsoft Decision Trees) est un exemple d'algorithme de classification.
  • Les algorithmes de régression prévoient une ou plusieurs variables continues, telles que les bénéfices ou les pertes, en fonction d'autres attributs du jeu de données. Algorithme MTS (Microsoft Time Series) est un exemple d'algorithme de régression.
  • Les algorithmes de segmentation divisent les données en groupes, ou en clusters, d'éléments possédant des propriétés similaires. Algorithme Clusters Microsoft est un exemple d'algorithme de segmentation.
  • Les algorithmes d'association recherchent des corrélations entre différents attributs d'un jeu de données. L'application la plus courante de ce genre d'algorithme concerne la création de règles d'association, utilisables dans une analyse de panier d'achat. Algorithme Microsoft Association est un exemple d'algorithme d'association.
  • Les algorithmes d'analyse de séquence synthétisent les séquences ou épisodes fréquents dans des données, tels qu'un flux de chemin d'accès Web. Algorithme MSC (Microsoft Sequence Clustering) est un exemple d'algorithme d'analyse de séquence.

Application des algorithmes

Le choix de l'algorithme approprié à utiliser pour une tâche professionnelle spécifique peut être un véritable défi. Vous pouvez utiliser des algorithmes différents pour effectuer la même tâche professionnelle, mais chaque algorithme produit un résultat différent et certains algorithmes peuvent produire plusieurs types de résultats. Par exemple, vous pouvez utiliser l'algorithme MDT (Microsoft Decision Trees) pas seulement pour des prévisions, mais aussi comme manière de réduire le nombre de colonnes dans un jeu de données, car l'arbre de décision peut identifier les colonnes qui n'affectent pas le modèle d'exploration de données final.

Vous n'êtes pas non plus tenu d'utiliser séparément les algorithmes — dans une même solution d'exploration de données, vous pouvez utiliser certains algorithmes pour explorer les données, puis utiliser d'autres algorithmes pour prévoir un résultat spécifique en fonction de ces données. Par exemple, vous pouvez utiliser un algorithme de clusters, qui reconnaît des motifs, pour diviser les données en groupes plus ou moins homogènes, puis utiliser les résultats pour créer un meilleur modèle d'arbre de décision. Vous pouvez utiliser plusieurs algorithmes au sein d'une même solution pour effectuer des tâches distinctes. Par exemple, vous pouvez utiliser un algorithme d'arborescence de régression pour obtenir des informations de prévisions financières et un algorithme basé sur des règles pour effectuer une analyse de panier d'achat.

Les modèles d'exploration de données permettent de prévoir des valeurs, de produire des synthèses de données et de rechercher des corrélations cachées. Pour vous aider à sélectionner des algorithmes pour votre solution d'exploration de données, le tableau ci-dessous fournit des suggestions sur les algorithmes à utiliser pour des tâches spécifiques.

Tâche Algorithmes Microsoft à utiliser

Prévision d'un attribut discret. Par exemple, pour prévoir si le destinataire d'une campagne de publipostage ciblée achètera un produit.

Algorithme MDT (Microsoft Decision Trees)

Algorithme MNB (Microsoft Naive Bayes)

Algorithme Clusters Microsoft

Algorithme MNN (Microsoft Neural Network) (SSAS)

Prévision d'un attribut continu. Par exemple, pour prévoir les ventes de l'année suivante.

Algorithme MDT (Microsoft Decision Trees)

Algorithme MTS (Microsoft Time Series)

Prévision d'une séquence. Par exemple, pour effectuer une analyse de parcours sur le site Web d'une société.

Algorithme MSC (Microsoft Sequence Clustering)

Recherche de groupes d'éléments communs dans des transactions. Par exemple, pour utiliser l'analyse de panier d'achat pour suggérer des produits supplémentaires à un client.

Algorithme Microsoft Association

Algorithme MDT (Microsoft Decision Trees)

Recherche de groupes d'éléments similaires. Par exemple, pour segmenter les données démographiques en groupes pour mieux comprendre les relations entre des attributs.

Algorithme Clusters Microsoft

Algorithme MSC (Microsoft Sequence Clustering)

Comme chaque modèle retourne un type différent de résultat, Analysis Services fournit une visionneuse distincte pour chaque algorithme. Lorsque vous explorez un modèle d'exploration de données dans Analysis Services, le modèle s'affiche sous l'onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données, à l'aide de la visionneuse appropriée pour ce modèle. Pour plus d'informations, consultez Affichage d'un modèle d'exploration de données.

Détails des algorithmes

Vous pouvez utiliser des fonctions pour étendre les résultats retournés par un modèle d'exploration de données. Le tableau ci-dessous répertorie les fonctions prises en charge par tous les algorithmes dans Analysis Services.

BottomCount

RangeMin

BottomPercent

TopCount

Predict

TopPercent

RangeMax

TopSum

RangeMid

Les algorithmes individuels peuvent prendre en charge des fonctions supplémentaires. Aucun des algorithmes fournis par Microsoft n'autorise les clés dupliquées.

Voir aussi

Concepts

Concepts d'exploration de données
Structures d'exploration de données (Analysis Services)
Algorithme Microsoft Association
Algorithme Clusters Microsoft
Algorithme MDT (Microsoft Decision Trees)
Algorithme MNB (Microsoft Naive Bayes)
Algorithme MNN (Microsoft Neural Network) (SSAS)
Algorithme MSC (Microsoft Sequence Clustering)
Algorithme MTS (Microsoft Time Series)
Algorithme MLR (Microsoft Linear Regression)
Algorithme MLR (Microsoft Logistic Regression)
Algorithmes de plug-in
Utilisation des outils d'exploration de données

Autres ressources

Guide de référence du langage DMX (Data Mining Extensions)

Aide et Informations

Assistance sur SQL Server 2005