Data Mining (SSAS)

 

SQL Server est la première solution d’analyse prédictive depuis la version 2000, qui a introduit l’exploration de données dans Analysis Services. La combinaison d’Integration Services, de Reporting Services et de SQL Server Data Mining fournit une plateforme intégrée pour l’analyse prédictive qui englobe la préparation et le nettoyage des données, l’apprentissage automatique et la création de rapports. SQL Server Data Mining inclut de nombreux algorithmes standard, y compris les modèles de clustering EM et K-means, les réseaux neuronaux, les régressions logistique et linéaire, les arbres de décision et les classifieurs Naive Bayes. Tous les modèles proposent des visualisations destinées à vous aider à concevoir, ajuster et évaluer vos modèles. L’intégration de l’exploration des données dans une solution d’aide à la décision vous permet de prendre des décisions plus avisées concernant des problèmes complexes.

L’exploration des données (également appelée analyse prédictive ou apprentissage automatique) utilise les principes statistiques bien connus pour découvrir des modèles dans vos données. En appliquant les algorithmes d'exploration de données dans Analysis Services à vos données, vous pouvez prévoir des tendances, identifier des modèles, créer des règles et des recommandations, analyser la séquence d'événements dans des jeux de données complexes et bénéficier de nouvelles analyses.

Dans SQL Server 2016, l’exploration des données est une fonctionnalité puissante et accessible, qui est intégrée aux principaux outils utilisés pour effectuer des analyses et créer des rapports.

SQL Server Data Mining fournit les fonctionnalités suivantes pour la prise en charge des solutions d’exploration de données intégrées :

  • Sources de données multiples : vous pouvez utiliser n’importe quelle source de données tabulaires pour l’exploration des données, y compris des fichiers texte et des feuilles de calcul. Vous pouvez aussi facilement exploiter les cubes OLAP créés dans Analysis Services. Toutefois, vous ne pouvez pas utiliser les données d'une base de données en mémoire.

  • Intégration du nettoyage des données, de la gestion des données et de la création de rapports : Integration Services fournit des outils de profilage et de nettoyage des données. Vous pouvez créer des processus ETL pour nettoyer les données préalablement à la modélisation. De plus, ssISnoversion facilite la conservation et la mise à jour des modèles.

  • Plusieurs algorithmes personnalisables : outre la mise à disposition d’algorithmes comme le clustering, les réseaux neuronaux et les arbres de décision, SQL Server Data Mining prend en charge le développement de vos propres algorithmes de plug-in personnalisés.

  • Infrastructure de test de modèle : testez vos modèles et jeux de données à l'aide d'outils statistiques importants comme la validation croisée, les matrices de classification, les graphiques de courbes d'élévation et les nuages de points. Créez et gérez facilement des jeux d'apprentissage et de test.

  • Interrogation et extraction : SQL Server Data Mining fournit le langage DMX permettant d’intégrer des requêtes de prédiction dans des applications. Vous pouvez également récupérer des statistiques détaillées et des schémas à partir des modèles, et effectuer une extraction de données de cas.

  • Outils clients : outre les studios de développement et de conception fournis par SQL Server, vous pouvez utiliser les compléments d'exploration de données pour Excel afin de créer, interroger et parcourir des modèles. Vous pouvez également créer des clients personnalisés, notamment des services Web.

  • Prise en charge du langage de script et des API managées : tous les objets d'exploration de données sont entièrement programmables. La création de scripts est possible grâce à MDX, XMLA ou aux extensions PowerShell pour Analysis Services. Utilisez le langage DMX (Data Mining Extensions) pour la création rapide de requêtes et de scripts.

  • Sécurité et déploiement : fournit la sécurité basée sur les rôles via Analysis Services, notamment les autorisations distinctes pour l’extraction des données de structure et de modèle. Déploiement simple des modèles vers d'autres serveurs, afin que les utilisateurs puissent accéder aux modèles ou effectuer des prédictions

Les rubriques de cette section présentent les principales fonctionnalités de SQL Server Data Mining et les tâches associées.

SQL Server R Services

Ajouts de la communauté

AJOUTER
Afficher: