Erstellen einer neuen Miningstruktur

Wenn Sie in Microsoft SQL Server Analysis Services eine Data Mining-Lösung erstellen, müssen Sie als Erstes eine Miningstruktur mithilfe des Data Mining-Assistent (Analysis Services - Data Mining) in Business Intelligence Development Studio erstellen. Die Miningstrukturen definieren die Datendomäne, aus der die Miningmodelle erstellt werden. Alle Miningmodelle basieren auf einer Struktur.

Miningstrukturen können entweder relationale oder OLAP-Datenquellen (Online Analytical Processing) verwenden. Relationale Miningstrukturen basieren auf Daten, die in Tabellen, Dateien oder relationalen Datenbanksystemen gespeichert sind und als Datenquellensicht definiert werden. OLAP-Miningstrukturen basieren auf einer Dimension und zugehörigen Measures eines OLAP-Cubes, der sich in der gleichen Datenbank wie die Miningstruktur befindet.

Weitere Informationen finden Sie unter:Entwerfen von Datenbanken, Entwerfen von mehrdimensionalen Datenbankobjekten für Analysis Services

Der Data Mining-Assistent definiert automatisch eine Miningstruktur und ermöglicht Ihnen, der Struktur das erste Miningmodell hinzuzufügen. Da eine Miningstruktur mehrere Miningmodelle enthalten kann, können Sie den Data Mining-Designer verwenden, um der Struktur weitere Miningmodelle hinzuzufügen.

In den folgenden Abschnitten erhalten Sie weitere Informationen über die Erstellung neuer Miningstrukturen mithilfe des Data Mining-Assistenten sowie über das Festlegen von Optionen für die Miningstruktur, mit denen Sie einen Testsatz erstellen oder Abfragen mit den Daten in der Miningstruktur ausführen können.

  • Erstellen einer relationalen Miningstruktur

  • Erstellen einer OLAP-Miningstruktur

  • Aktivieren von zurückgehaltenen Daten und Drillthrough

Erstellen einer relationalen Miningstruktur

Relationale Miningstrukturen können auf Daten basieren, die durch eine OLE DB-Datenquelle zur Verfügung gestellt werden. Wenn die Quelldaten in mehreren Tabellen enthalten sind, können Sie eine Datenquellensicht erstellen, die die Tabellen und die Spalten zusammenführt, die Sie benötigen. Wenn die Tabellen 1:n-Beziehungen enthalten, haben Sie z. B. mehrere Kaufdatensätze für jeden Kunden, den Sie analysieren möchten. Sie können sowohl Tabellen hinzufügen als auch eine Tabelle als Falltabelle verwenden und Daten aus den zahlreichen Seiten der Beziehung als geschachtelte Tabellen verwenden.

Weitere Informationen finden Sie unterGeschachtelte Tabellen (Analysis Services - Data Mining).

Der Data Mining-Assistent führt Sie beim Erstellen der Struktur eines neuen Miningmodells durch folgende Schritte:

  1. Auswahl eines Datenquellentyps, in diesem Falle eine relationale Datenbank.

  2. Entscheidung, ob nur eine Struktur oder eine Struktur mit einem Miningmodell erstellt werden soll.

  3. Auswahl eines Algorithmus für das Modell.

  4. Auswahl einer Datenquelle.

  5. Auswahl einer Falltabelle und ggf. von geschachtelten Tabellen.

  6. Auswahl des Typs der einzelnen Spalten, entweder als vorhersagbare, als Eingabe- oder als Schlüsselspalte.

  7. Festlegen der Spalteninhaltstypen.

  8. Angeben eines optionalen zurückgehaltenen Datasets.

  9. Aktivieren von Drillthrough für die Struktur; Benennen und Speichern der neuen Miningstruktur und des zugeordneten Miningmodells.

Weitere Informationen finden Sie unter:Data Mining-Algorithmen (Analysis Services - Data Mining), Miningmodellspalten, Miningstrukturspalten, Datentypen (Data Mining), Inhaltstypen (Data Mining)

Erstellen einer OLAP-Miningstruktur

OLAP-Cubes enthalten häufig zahlreiche Elemente und Dimensionen, sodass es schwierig sein kann, zu entscheiden, wo mit dem Data Mining begonnen werden soll. Um die Muster in den Cubes leichter zu identifizieren, identifizieren Sie normalerweise zuerst eine Dimension von Interesse und durchsuchen dann Muster, die mit dieser Dimension verknüpft sind. In der folgenden Tabelle werden mehrere allgemeine Data Mining-Aufgaben von OLAP aufgelistet, Beispielszenarien zur Anwendung der einzelnen Aufgaben beschrieben und der Data Mining-Algorithmus zum Verwenden für die jeweilige Aufgabe identifiziert.

Aufgabe

Beispielszenario

Algorithmus

Gruppieren Sie Elemente in Clustern

Segmentieren Sie eine Kundendimension auf Basis der Kundenelementeigenschaften, der Produkte, die die Kunden kaufen, und des Geldbetrags, den die Kunden ausgeben.

Microsoft Clustering-Algorithmus

Finden Sie interessante oder ungewöhnliche Elemente

Identifizieren Sie interessante oder ungewöhnliche Läden in einer Speicherdimension, basierend auf Nettoumsatz, Gewinn, Ort und Größe des Ladens.

Microsoft Decision Trees-Algorithmus

Finden Sie interessante oder ungewöhnliche Zellen

Identifizieren Sie Umsätze in Läden, die nicht den allgemeinen Trends im Verlauf der Zeit entsprechen.

Microsoft Time Series-Algorithmus

Der Data Mining-Assistent führt Sie beim Erstellen der Struktur eines neuen Miningmodells durch folgende Schritte:

  1. Auswahl eines Datenquellentyps, in diesem Falle ein Cube.

    HinweisHinweis

    Der OLAP-Cube muss innerhalb der gleichen Datenbank wie die Miningstruktur vorhanden sein. Sie können keinen Cube verwenden, der vom PowerPivot für Excel-Add-In als Data Mining-Quelle erstellt wurde.

  2. Auswahl eines Algorithmus.

  3. Auswahl einer Quellcubedimension.

  4. Auswahl eines Fallschlüssels.

  5. Auswahl von Fallspalten.

  6. Auswahl von geschachtelten Tabellen.

  7. Auswahl der Verwendung der einzelnen Spalten, entweder als vorhersagbare, als Eingabe- oder als Schlüsselspalte.

  8. Festlegen der Spalteninhaltstypen.

  9. Aufteilen des Quellcubes.

  10. Erstellen eines optionalen Test-Datasets

  11. Benennen und Speichern der neuen Miningstruktur und des zugeordneten Miningmodells.

Auf der letzten Seite des Assistenten können Sie die folgenden Optionen festlegen:

  • Drillthrough zulassen

  • Miningmodelldimension erstellen

  • Cube mithilfe der Miningmodelldimension erstellen

Wenn Sie im Quellcube eine neue Miningmodelldimension erstellen möchten, können Sie die Informationen einschließen, die vom Data Mining-Algorithmus in der OLAP-Datenquelle gefunden werden. Wenn Sie eine Miningmodelldimension erstellen, können Sie den gespeicherten Modellinhalt in Form einer Dimension durchsuchen und abfragen. Die Option steht für Modelle zur Verfügung, die unter Verwendung von Microsoft Clustering, Microsoft Decision Trees und des Microsoft Association Rules-Algorithmus erstellt wurden.

Wenn Sie die Option zum Erstellen eines neuen Cubes auswählen, wird ein neuer Cube in der Datenbank definiert, die die Miningmodelldimension enthält sowie optional alle verknüpften Dimensionen. Dadurch können Sie die Faktendaten anhand der Hierarchie, die vom Miningmodell ermittelt wurde, in Slices aufteilen.

Weitere Informationen finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining), Miningmodellspalten, Miningstrukturspalten, Datentypen (Data Mining), Inhaltstypen (Data Mining)

Aktivieren von Drillthrough und zurückgehaltenen Daten

Wenn Sie die Miningstruktur erstellen, müssen Sie auch zwei wichtige Optionen für das Arbeiten mit den Daten festlegen: zurückgehaltene Daten und Drillthrough. Das Zurückhalten ermöglicht Ihnen, die Daten in der Miningstruktur in einen Trainingssatz und einen Testsatz zu partitionieren, um sie mit allen Modellen zu verwenden, die der Struktur zugeordnet sind. Weitere Informationen finden Sie unter Partitionieren von Daten in Trainings- und Testsätze (Analysis Services - Data Mining).

Mithilfe von Drillthrough können Sie Quelldaten in der Miningstruktur anzeigen, indem Sie das Miningmodell abfragen. Dies ist hilfreich, wenn Sie die Ergebnisse eines Miningmodells anzeigen, und zusätzliche Details der zugrunde liegenden Fälle sehen möchten. Sie können beispielsweise nach Kontaktinformationen suchen oder nach den Fällen, die zum Trainieren eines bestimmten Clusters verwendet wurden usw. Um Drillthrough verwenden zu können, müssen Sie es beim Erstellen der Miningstruktur aktivieren. Eine nachträgliche Aktivierung ist nicht möglich. Weitere Informationen finden Sie unter Verwenden von Drillthrough für Miningmodelle und Miningstrukturen (Analysis Services - Data Mining).