Création de filtres pour les modèles d'exploration de données (Analysis Services - Exploration de données)

Le filtrage de modèle basé sur les données est utile pour créer des modèles d'exploration de données qui utilisent les sous-ensembles de données d'une structure d'exploration de données. Le filtrage offre une certaine souplesse lorsque vous concevez vos structures d'exploration de données et sources de données, car vous pouvez créer une structure d'exploration de données unique basée sur une vue détaillée de la source de données. Vous pouvez créer ensuite des filtres pour utiliser uniquement une partie de ces données à des fins de formation et de test de divers modèles, au lieu de générer une structure différente et un modèle associé pour chaque sous-ensemble de données.

Par exemple, vous définissez la vue de la source de données sur la table Customers et les tables associées. Ensuite, vous définissez une structure d'exploration de données unique qui inclut tous les champs dont vous avez besoin. Enfin, vous créez un modèle filtré sur un attribut client particulier, tel que Region. Vous pouvez effectuer ensuite aisément une copie de ce modèle, et ne modifiez que la condition de filtre pour générer un nouveau modèle fondé sur une autre région.

Voici quelques scénarios réels où vous pourriez tirer parti de cette fonctionnalité :

  • Création de modèles séparés pour les valeurs discrètes telles que le sexe, les régions, etc. Par exemple, un magasin de vêtements peut utiliser les caractéristiques démographiques de la clientèle pour générer des modèles distincts en fonction du sexe, même si les chiffres de ventes proviennent de la même source de données pour tous les clients.

  • Expérimentation des modèles par la création et le test de plusieurs regroupements des mêmes données, comme les différentes tranches d'âge (20-30 ans, 20-40 ans et 20-25 ans).

  • Spécification de filtres complexes sur le contenu de tables imbriquées, comme l'inclusion impérative d'un cas dans le modèle si le client a acheté au moins deux exemplaires d'un élément particulier.

Cette section explique comment générer, utiliser et gérer les filtres sur les modèles d'exploration de données.

Création de filtres de modèle

Vous pouvez créer et appliquer des filtres de différentes façons :

  • Utilisation de l'onglet Modèles d'exploration de données du Concepteur de modèle d'exploration de données pour générer les conditions à l'aide des boîtes de dialogue de l'Éditeur de filtre.

  • Saisie directe d'une expression de filtre dans la propriété Filter du modèle d'exploration de données.

  • Définition de conditions de filtrage sur un modèle par programme, à l'aide d'AMO.

Création des filtres de modèle à l'aide du Concepteur d'exploration de données

Vous filtrez un modèle dans le Concepteur d'exploration de données en modifiant la propriété Filter du modèle d'exploration de données. Vous pouvez taper directement une expression de filtre dans le volet Propriétés ou ouvrir une boîte de dialogue de filtre pour créer les conditions.

Il existe deux boîtes de dialogue de filtre. La première permet de créer des conditions appliquées à la table de cas. Si la source de données contient plusieurs tables, sélectionnez d'abord une table, puis sélectionnez une colonne et spécifiez les opérateurs et les conditions qui s'appliquent à cette colonne. Vous pouvez lier plusieurs conditions à l'aide des opérateurs AND/OR. Les opérateurs disponibles pour définir les valeurs varient selon que la colonne contient des valeurs discrètes ou continues. Par exemple, vous pouvez utiliser les opérateurs greater than et less than avec les valeurs continues. Toutefois, vous pouvez utiliser uniquement les opérateurs = (equal to), != (not equal to) et is null avec les valeurs discrètes.

Notes

Le mot clé LIKE n'est pas pris en charge. Si vous souhaitez inclure plusieurs attributs discrets, vous devez créer des conditions séparées et les lier avec l'opérateur OR.

Si les conditions sont complexes, vous pouvez choisir la deuxième boîte de dialogue de filtre pour utiliser une table à la fois. Lorsque vous fermez la deuxième boîte de dialogue de filtre, l'expression est évaluée, puis associée aux conditions de filtrage qui ont été définies sur d'autres colonnes de la table de cas.

Création de filtres sur les tables imbriquées

Si la vue de source de données contient des tables imbriquées, vous pouvez utiliser la deuxième boîte de dialogue de filtre pour créer des conditions sur les lignes des tables imbriquées.

Par exemple, si votre table de cas est liée aux clients et que la table imbriquée affiche les produits achetés par un client, vous pouvez créer un filtre pour les clients ayant acquis des éléments particuliers, en utilisant la syntaxe suivante dans le filtre de table imbriquée : [ProductName]=’Water Bottle’ OR ProductName=’Water Bottle Cage'.

Vous pouvez également filtrer sur l'existence d'une valeur particulière de la table imbriquée en utilisant les mots clés EXISTS ou NOT EXISTS et une sous-requête. Vous pouvez ainsi créer des conditions telles que EXISTS (SELECT * FROM Products WHERE ProductName=’Water Bottle’). L'instruction EXISTS SELECT(<subquery>) retourne true si la table imbriquée contient au moins une ligne incluant la valeur Water Bottle.

Vous pouvez combiner les conditions de la table de cas et les conditions de la table imbriquée. Par exemple, la syntaxe suivante inclut une condition sur la table de cas (Age > 30), une sous-requête sur la table imbriquée (EXISTS (SELECT * FROM Products)) et plusieurs conditions sur la table imbriquée (WHERE ProductName=’Milk’ AND Quantity>2).

(Age > 30 AND EXISTS (SELECT * FROM Products WHERE ProductName=’Milk’  AND Quantity>2) )

Lorsque vous avez terminé de générer le filtre, le texte de filtre est analysé par Analysis Services, traduit en expression DMX, puis enregistré avec le modèle.

Pour les instructions relatives à l'utilisation des boîtes de dialogue de filtre dans Business Intelligence Development Studio, consultez Procédure : appliquer un filtre à un modèle d'exploration de données.

Gestion des filtres de modèle d'exploration de données

Le filtrage de modèle basé sur les données simplifie grandement la gestion des structures d'exploration de données et des modèles d'exploration de données, parce que vous pouvez créer facilement plusieurs modèles basés sur la même structure. Vous pouvez également effectuer rapidement des copies de modèles d'exploration de données existants, puis modifier uniquement la condition de filtre. Les remarques suivantes concernent la gestion des filtres de modèle :

  • Pour déterminer le filtre qui s'applique à un modèle, consultez la propriété Filter du modèle d'exploration de données.

  • Vous pouvez renommer le modèle afin de refléter le contenu du filtre. Il est ainsi plus facile d'indiquer séparément les modèles associés.

  • L'expression de filtre est enregistrée en tant que script stocké avec la table imbriquée ou le modèle d'exploration de données associé. Si vous supprimez le texte de filtre, il ne peut être restauré qu'en recréant manuellement l'expression de filtre. Par conséquent, si vous créez des expressions de filtre complexes, vous devez créer une copie de sauvegarde du texte de filtre.

  • Chaque fois que vous changez ou ajoutez une expression de filtre, vous devez retraiter la structure et le modèle avant de pouvoir consulter les résultats du filtre.

Pour plus d'informations sur la syntaxe des filtres et obtenir des exemples d'expressions de filtre, consultez Syntaxe de filtre de modèle et exemples (Analysis Services - Exploration de données).

Pour plus d'informations sur l'utilisation des filtres de modèle lorsque vous testez un modèle d'exploration de données, consultez Mesure de la précision du modèle d'exploration de données (Analysis Services - Exploration de données).