Article
09/27/2010

Nouveautés (Analysis Services - Exploration de données)

Cette nouvelle version de MicrosoftSQL ServerAnalysis Services intègre de nouvelles fonctionnalités et des améliorations.

Création de jeux de test d'exclusion

Lorsque vous créez une structure d'exploration de données, vous pouvez à présent diviser les données de la structure d'exploration de données en jeux d'apprentissage et de test. La définition de la partition est stockée avec la structure, ce qui vous permet de réutiliser les jeux d'apprentissage et de test avec n'importe quel modèle d'exploration de données basé sur cette structure.

Les données sont réparties de façon aléatoire entre les partitions d'apprentissage et de test, mais vous pouvez également spécifier la valeur de départ utilisée pour créer les partitions si vous devez recréer une partition.

Vous pouvez spécifier la taille du jeu de test sous la forme d'un pourcentage du nombre total de lignes, sous la forme d'un nombre maximal de lignes ou bien combiner ces critères. Pour plus d'informations sur l'utilisation des jeux de données d'apprentissage et de test, consultez Partitionnement des données en jeux d'apprentissage et jeux de test (Analysis Services – Exploration de données).

Pour plus d'informations sur l'ensemble des fonctionnalités de validation de modèle de SQL Server 2008, consultez Validation des modèles d'exploration de données (Analysis Services - Exploration de données).

Filtrage sur les cas de modèles

Vous pouvez à présent joindre des filtres à un modèle d'exploration de données et appliquer le filtre pendant l'apprentissage et le test. L'application d'un filtre au modèle vous permet de contrôler les données utilisées pour l'apprentissage du modèle et d'évaluer plus facilement les performances du modèle sur des sous-ensembles de données.

Si, par exemple, vous souhaitez connaître la précision d'un modèle de publipostage ciblé pour des clients au-dessus d'un certain niveau de revenu uniquement, vous pouvez appliquer le filtre sur la colonne Revenu du modèle d'exploration de données lorsque vous créez le graphique de courbes d'élévation et afficher les résultats de cette catégorie démographique uniquement.

Business Intelligence Development Studio fournit également de nouveaux éditeurs de filtre vous permettant de générer des conditions complexes pouvant s'appliquer aux tables de cas comme aux tables imbriquées.

Pour plus d'informations sur la création de filtres de modèles d'exploration de données, consultez Création de filtres pour les modèles d'exploration de données (Analysis Services - Exploration de données).

Pour plus d'informations sur le filtrage des données pour le test du modèle d'exploration de données, consultez Outils de création de diagramme de précision de modèle (Analysis Services - Exploration de données).

Validation croisée de plusieurs modèles d'exploration de données

La validation croisée est un procédé établi permettant d'évaluer la précision des modèles d'exploration de données. Dans le cadre de la validation croisée, vous partitionnez de manière itérative les données de la structure d'exploration de données en sous-ensembles, créez des modèles sur les sous-ensembles, puis mesurez la précision du modèle pour chaque partition. En examinant les statistiques retournées, vous pouvez déterminer la fiabilité du modèle d'exploration de données et comparer plus facilement des modèles se basant sur la même structure.

La validation croisée est disponible dans la vue Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données. Vous pouvez également partitionner une structure d'exploration de données, tester plusieurs modèles d'exploration de données et générer une analyse en utilisant des procédures stockées Analysis Services.

Pour générer un rapport de validation croisée dans SQL Server 2008, vous spécifiez la structure d'exploration de données et l'attribut prévisible, puis vous indiquez le nombre de replis à utiliser pour segmenter les données de cas.

Analysis Services retourne un tableau qui indique des statistiques comme la vraisemblance ou l'erreur quadratique moyenne pour chaque partition, ainsi que l'écart moyen et l'écart type de toutes les mesures pour les modèles d'agrégat. Pour plus d'informations, consultez Validation croisée (Analysis Services - Exploration de données).

Prise en charge des compléments d'exploration de données pour Office 2007

SQL Server 2008 prend en charge la création, la gestion et l'utilisation de modèles d'exploration de données de Microsoft Excel lorsque vous utilisez les compléments d'exploration de données SQL Server 2008 pour Office 2007. La dernière version de ce complément gratuit très populaire a fait l'objet de plusieurs améliorations. Il prend notamment en charge les partitions d'apprentissage et de test côté serveur, la validation croisée et plusieurs nouveaux outils analytiques tels que l'analyse du panier d'achat et le calcul de prédiction imprimable.

Vous pouvez également utiliser l'Assistant Modèle de document pour créer facilement une documentation pour les structures et les modèles stockés dans une instance de SQL Server 2008. Pour plus d'informations sur les compléments, consultez Data Mining Add-ins for Office 2007 (en anglais).

Améliorations apportées à l'algorithme MTS (Microsoft Time Series)

Pour améliorer la précision et la stabilité de certaines prédictions dans les modèles de série chronologique, un nouvel algorithme a été ajouté à l'algorithme MTS (Microsoft Time Series). Le nouvel algorithme, qui se base sur l'algorithme ARIMA bien connu, fournit de meilleures prédictions à long terme que l'algorithme ARTxp utilisé par Analysis Services. (ARTxp est un algorithme d'arborescence autorégressif optimisé pour une tranche de temps unique ou des prédictions à court terme.)

Par défaut, la nouvelle implémentation de l'algorithme MTS (Microsoft Time Series) utilise l'algorithme ARTxp pour l'apprentissage d'une version du modèle et l'algorithme ARIMA pour l'autre version. L'algorithme pondère ensuite les résultats de ces deux modèles pour fournir les caractéristiques de prédiction que vous préférez. Si vous ne souhaitez pas utiliser cette implémentation par défaut, vous pouvez spécifier que l'algorithme MTS (Microsoft Time Series) doit uniquement utiliser l'algorithme ARTxp ou ARIMA. Dans SQL Server 2008 Enterprise, vous pouvez spécifier une pondération personnalisée des algorithmes pour fournir une prédiction optimale sur un intervalle de temps variable.

L'algorithme MTS (Microsoft Time Series) accepte également à présent des données au cours de la prédiction pour permettre de nouveaux scénarios commerciaux. Vous pouvez par exemple créer un modèle de prédiction du revenu basé sur des moyennes entre produits, agrégats régionaux ou un autre jeu de données générales. Vous pouvez ensuite appliquer ce modèle à la série chronologique qui présente les ventes d'un produit donné. En appliquant le modèle général, vous pouvez tirer parti de la stabilité et la disponibilité de données d'agrégat et personnaliser la prédiction pour le produit en particulier.

Vous pouvez également effectuer l'apprentissage des modèles à l'aide de plusieurs séries, puis appliquer les modèles à de nouvelles données pour prédire des scénarios.

Pour plus d'informations sur les modèles d'exploration de données de série chronologique, consultez Algorithme MTS (Microsoft Time Series) et PredictTimeSeries (DMX).

Extraction dans des cas de structure et des colonnes de structure

Dans SQL Server 2008, si vous activez l'extraction sur une structure d'exploration de données, vous pouvez interroger la structure d'exploration de données et retourner des détails sur les cas utilisés pour l'apprentissage et le test. Vous pouvez créer des requêtes d'extraction sur une structure à l'aide d'extensions DMX (Data Mining Extensions).

De plus, si l'extraction est activée sur un modèle d'exploration de données et la structure d'exploration de données connexe, vous pouvez créer des requêtes qui extraient des colonnes de données de la structure d'exploration de données sous-jacente. Cela s'avère utile si vous souhaitez connaître des informations détaillées sur les cas d'un nœud en particulier. Vous pouvez par exemple extraire des informations de contact pour les clients d'un cluster donné.

Pour plus d'informations, consultez Utilisation de l'extraction sur les modèles et les structures d'exploration de données (Analysis Services - Exploration de données).

Pour obtenir des exemples de requêtes DMX sur une structure d'exploration de données, consultez SELECT FROM <structure>.CASES.

Pour obtenir des exemples d'extraction d'un modèle dans des données de structure, consultez SELECT FROM <modèle>.CASES (DMX).

Utilisation d'alias dans les colonnes du modèle d'exploration de données

Vous pouvez à présent ajouter des alias aux colonnes d'un modèle d'exploration de données pour qu'il soit plus facile de comprendre le contenu des colonnes et de les référencer dans des instructions DMX.

Par exemple, si vous générez une structure d'exploration de données qui contient des versions continue et discrétisée des mêmes données, vous pouvez attribuer aux deux colonnes le même nom pour faciliter la comparaison.

Pour plus d'informations sur la gestion et l'affichage des alias, consultez Définition des propriétés sur un modèle d'exploration de données ou Procédure : créer un alias pour une colonne du modèle.

Pour plus d'informations sur la création d'un alias de colonne à l'aide de DMX, consultez ALTER MINING STRUCTURE (DMX).

Interrogation des ensembles de lignes de schéma d'exploration de données

Dans SQL Server 2008, la plupart des ensembles de lignes de schéma d'exploration de données OLE DB existants ont été exposés sous forme d'un jeu de tables système que vous pouvez facilement interroger à l'aide d'instructions DMX. Cela facilite la récupération des métadonnées relatives aux modèles et aux structures, l'extraction des détails du contenu du modèle d'exploration de données, ainsi que l'analyse d'une instance ou d'un service Analysis Services.

Pour plus d'informations, consultez Interrogation des ensembles de lignes de schéma d'exploration de données (Analysis Services - Exploration de données).

Nouvel emplacement des exemples

La documentation en ligne n'inclut plus d'exemples de bases de données et d'applications SQL Server. Ces exemples sont désormais disponibles sur le site Web des Exemples pour Microsoft SQL Server (en anglais). Ce site Web simplifie la recherche de ces exemples par les utilisateurs et fournit des exemples supplémentaires concernant MicrosoftSQL Server et Business Intelligence. Sur le site Web des exemples pour SQL Server, vous pouvez effectuer les opérations suivantes :

parcourir les exemples fournis par les développeurs, les utilisateurs et la communauté Microsoft MVP (Most Valuable Professional) ;
télécharger des exemples de bases de données et de projets de code ;
consulter une zone de discussion où vous pouvez signaler des problèmes et poser des questions sur les exemples dans chaque domaine technologique, ou y participer.

Installation côte à côte avec SQL Server 2005 Analysis Services

SQL Server 2008Analysis Services peut maintenant être installé côte à côte avec SQL Server 2005 Analysis Services (SSAS). Pour plus d'informations, consultez Utilisation de plusieurs versions et instances de SQL Server.

Pour les problèmes d'installation côte à côte importants qui affectent Analysis Services, consultez le document Lisezmoi qui accompagne cette version.

Sauvegarde et restauration de bases de données Analysis Services

La capacité à sauvegarder et restaurer une base de données Analysis Services a été améliorée. Moins de restrictions sont imposées quant à la taille de la base de données et la durée requise pour les opérations de sauvegarde et de restauration a été beaucoup réduite.

Pour plus d'informations, consultez Nouveautés (Analysis Services - Base de données multidimensionnelle).

Autres améliorations apportées à Analysis Services

Si vous utilisez Analysis Services pour créer des cubes OLAP que vous utilisez également pour l'exploration de données, il peut être bien plus facile de concevoir des dimensions et leurs hiérarchies et attributs connexes. Le Concepteur de dimensions inclut un nouveau concepteur de relation d'attribut vous permettant de concevoir des relations d'attributs et de vous assurer qu'elles sont conformes aux meilleures pratiques.