Verwenden von Data Mining

Mit Data Mining erhalten Sie Zugriff auf Informationen, die Sie benötigen, um bei schwierigen Geschäftsproblemen richtige Entscheidungen treffen zu können. Die in Microsoft SQL Server 2005 Analysis Services (SSAS) bereitgestellten Data Mining-Tools unterstützen Sie beim Identifizieren systematischer Strukturen und Muster in Ihren Daten. Aus diesen Strukturen und Mustern lässt sich ableiten, warum es in der Vergangenheit bestimmte Entwicklungen gegeben hat und welche Entwicklungen für die Zukunft zu erwarten sind. Beim Erstellen einer Data Mining-Lösung in Analysis Services müssen Sie zuerst ein Modell generieren, das Ihr Geschäftsproblem beschreibt. Anschließend führen Sie auf Ihren Daten einen Algorithmus aus, der ein mathematisches Modell Ihrer Daten erstellt. Dieser Vorgang wird als Modelltraining bezeichnet. Sie können das Miningmodell entweder visuell durchsuchen oder Vorhersageabfragen für das Miningmodell ausführen. Analysis Services unterstützt Datasets aus relationalen Datenbanken und OLAP-Datenbanken und enthält mehrere Algorithmen, die Sie zum Analysieren der Daten verwenden können. Eine grobe Beschreibung des Data Mining-Prozesses finden Sie unter Data Mining-Konzepte.

SQL Server 2005 stellt unterschiedliche Umgebungen und Tools für Data Mining-Projekte bereit. In den folgenden Abschnitten wird das typische Vorgehen beim Erstellen einer Data Mining-Lösung beschrieben. Darüber hinaus erfahren Sie, welche Ressourcen in den einzelnen Schritten zu verwenden sind.

Erstellen eines Analysis Services-Projekts

Um eine Data Mining-Lösung zu erstellen, müssen Sie zunächst ein neues Analysis Services-Projekt erstellen und dann eine Datenquelle und eine Datenquellensicht für das Projekt hinzufügen und konfigurieren. Die Datenquelle definiert die Verbindungszeichenfolge und die Authentifizierungsinformationen für den Verbindungsaufbau mit der Datenquelle, die dem Miningmodell zugrunde liegen soll. Die Datenquellensicht liefert eine Abstraktion der Datenquelle. Mithilfe dieser Sicht können Sie die Struktur der Daten bearbeiten, um sie gezielter an Ihr Projekt anzupassen.

Weitere Informationen finden Sie unter Definieren eines Analysis Services-Projekts, Definieren einer Datenquelle mit dem Datenquellen-Assistenten, Definieren einer Datenquellensicht mithilfe des Datenquellensicht-Assistenten.

Hinzufügen von Miningstrukturen zu einem Analysis Services-Projekt

Nachdem Sie ein Analysis Services-Projekt erstellt haben, können Sie Miningstrukturen und ein oder mehrere Miningmodelle, die auf den jeweiligen Strukturen basieren, hinzufügen. Eine Miningstruktur, einschließlich Tabellen und Spalten, wird aus einer vorhandenen Datenquellensicht oder einem OLAP-Cube des Projekts abgeleitet. Beim Hinzufügen einer neuen Miningstruktur wird der Data Mining-Assistent gestartet. Sie verwenden diesen Assistenten, um die Struktur zu definieren und einen Algorithmus sowie Trainingsdaten anzugeben, die beim Erstellen eines ersten Modells auf der Basis dieser Struktur verwendet werden.

Weitere Informationen finden Sie unter:Erstellen einer neuen Miningstruktur, Data Mining-Algorithmen, Data Mining-Assistent

Mithilfe der Registerkarte Miningstruktur im Data Mining-Designer können Sie vorhandene Miningstrukturen ändern. Dies schließt auch das Hinzufügen von Spalten und geschachtelten Tabellen ein.

Weitere Informationen:Data Mining-Designer

Verwenden von Data Mining-Modellen

Bevor Sie die von Ihnen definierten Miningmodelle verwenden können, müssen Sie sie verarbeiten, damit Analysis Services die Trainingsdaten an die Algorithmen übergeben kann und die Modelle schließlich mit Daten gefüllt werden. Analysis Services stellt mehrere Optionen für die Verarbeitung von Miningmodellobjekten zur Verfügung. Dazu zählt auch die Möglichkeit, bestimmen zu können, welche Objekte wie verarbeitet werden.

Weitere Informationen finden Sie unter:Verarbeitung in Analysis Services, Verarbeiten von Data Mining-Objekten

Nachdem Sie die Modelle verarbeitet haben, können Sie die Ergebnisse analysieren und entscheiden, welche Modelle ihrer Aufgabe am besten gerecht wurden. Analysis Services stellt für jeden Modelltyp auf der Registerkarte Miningmodell-Viewer Viewer zur Verfügung, die Sie beim Prüfen der Miningmodelle verwenden können. Außerdem stellt Analysis Services auf der Registerkarte Mininggenauigkeitsdiagramm des Designers Tools bereit, mit denen Sie Miningmodelle direkt miteinander vergleichen und das für Ihre Problemstellung am besten geeignete Modell auswählen können. Zu diesen Tools gehören ein Liftdiagramm, ein Gewinndiagramm und eine Klassifikationsmatrix.

Weitere Informationen finden Sie unter:Anzeigen eines Data Mining-Modells, Überprüfen von Data Mining-Modellen

Erstellen von Vorhersagen

Das wichtigste Ziel der meisten Data Mining-Projekte liegt darin, mithilfe eines Miningmodells Vorhersagen zu treffen. Nachdem Sie Miningmodelle geprüft und miteinander verglichen haben, können Sie mit einem von mehreren Tools Vorhersagen generieren. Analysis Services stellt eine als Data Mining-Erweiterungen (Data Mining Extensions, DMX) bezeichnete Abfragesprache zur Verfügung, die die Basis für das Generieren von Vorhersagen bildet. Zur Unterstützung beim Generieren von DMX-Vorhersageabfragen stellt SQL Server einen Abfrage-Generator (verfügbar in SQL Server Management Studio und in Business Intelligence Development Studio) und DMX-Vorlagen für den Abfrage-Editor in Management Studio zur Verfügung. Von BI Development Studio aus können Sie über die Registerkarte Miningmodellvorhersage des Data Mining-Designers auf den Abfrage-Generator zugreifen.

Weitere Informationen finden Sie unter:Erstellen von DMX-Vorhersageabfragen, Data Mining-Erweiterungen (DMX) - Anweisungsreferenz

SQL Server Management Studio

Nachdem Sie mithilfe von BI Development Studio Miningmodelle für Ihr Data Mining-Projekt generiert haben, können Sie die Modelle in Management Studio verwalten und verwenden sowie Vorhersagen erstellen.

Weitere Informationen:Data Mining in SQL Server Management Studio

SQL Server Reporting Services

Nachdem Sie ein Miningmodell erstellt haben, möchten Sie die Ergebnisse ggf. einem breiteren Publikum zukommen lassen. Sie können den Berichts-Designer in Microsoft SQL Server 2005 Reporting Services (SSRS) zum Erstellen von Berichten verwenden, mit denen Sie die in einem Miningmodell enthaltenen Informationen präsentieren. Als Basis für einen Bericht eignen sich die Ergebnisse einer beliebigen DMX-Abfrage. Darüber hinaus können Sie die Parametrisierungs- und Formatierungsfunktionen nutzen, die Reporting Services zur Verfügung stehen.

Weitere Informationen finden Sie unter:Verwenden des Berichts-Designers, Verwenden des DMX-Abfrage-Designers von Analysis Services

Programmgesteuertes Verwenden von Data Mining

Sie haben in Analysis Services Zugriff auf mehrere Tools, die die programmgesteuerte Verwendung von Data Mining unterstützen. Mit den Data Mining-Erweiterungen steht Ihnen eine Sprache zur Verfügung, die Sie zum Erstellen, Trainieren und Verwenden von Data Mining-Modellen verwenden können. Sie können diese Tasks auch mit einer Kombination aus XML für Analysis (XMLA) und Analysis Services Scripting Language (ASSL) oder mithilfe von Analysis Management Objects (AMO) ausführen.

Mithilfe von Data Mining-Schemarowsets können Sie auf alle Metadaten zugreifen, die mit Data Mining verknüpft sind. Sie können mithilfe von Schemarowsets z. B. ermitteln, welche Datentypen ein Algorithmus unterstützt oder welche Modellnamen in einer Datenbank vorhanden sind.

Weitere Informationen:Data Mining-Erweiterungen (DMX) – Referenz, Data Mining Schema Rowsets, Analysis Services Administration Programming (SSAS), Using XML for Analysis in Analysis Services (XMLA)

Siehe auch

Konzepte

Entwickeln von Projektmappen und Projekten von Analysis Services
Data Mining-Konzepte
Miningstrukturen (Analysis Services)
SQL Server Analysis Services

Andere Ressourcen

Data Mining-Erweiterungen (DMX) – Referenz
Einführung in Business Intelligence Development Studio
SQL Server Management Studio und Business Intelligence Development Studio

Hilfe und Informationen

Informationsquellen für SQL Server 2005