Artikel
09/24/2010

Neuigkeiten (Analysis Services - Data Mining)

Diese neueste Version von MicrosoftSQL ServerAnalysis Services enthält neue Features und Erweiterungen.

Erstellen von Zurückhaltungstestsätzen

Beim Erstellen einer Miningstruktur können Sie nun die in dieser Struktur enthaltenen Daten in Trainings- und Testsätze aufteilen. Die Definition der Partition wird mit der Struktur gespeichert, sodass die Trainings- und Testsätze mit beliebigen Miningmodellen, die auf dieser Struktur basieren, wiederverwendet werden können.

Die Daten werden nach dem Zufallsprinzip auf die Trainings- und die Testpartition aufgeteilt. Wenn Sie eine Partition neu erstellen müssen, können Sie jedoch auch den zum Erstellen der Partitionen verwendeten Ausgangswert angeben.

Sie können die Größe des Testsatzes als Prozentsatz der Gesamtanzahl der Zeilen, als maximale Anzahl der Zeilen oder als Kombination dieser Anforderungen angeben. Weitere Informationen zum Verwenden von Trainings- und Testdatasets finden Sie unter Partitionieren von Daten in Trainings- und Testsätze (Analysis Services - Data Mining).

Weitere Informationen zu allen Features für die Modellüberprüfung in SQL Server 2008 finden Sie unter Überprüfen von Data Mining-Modellen (Analysis Services - Data Mining).

Filtern nach Modellfällen

Sie können nun Filter an ein Miningmodell anfügen und diese beim Trainieren und beim Testen anwenden. Durch Anwenden eines Filters auf das Modell können Sie steuern, welche Daten zum Trainieren des Modells verwendet werden. Zudem wird dadurch die Bewertung der Leistung des Modells für Datenteilmengen vereinfacht.

Angenommen, Sie möchten die Genauigkeit eines Targeted Mailing-Modells nur für Kunden ermitteln, deren Einkommen ein bestimmtes Niveau übersteigt. Beim Erstellen des Prognosegütediagramms können Sie den Filter auf die Spalte Income des Miningmodells anwenden und nur Ergebnisse für die eine gewünschte Demographie anzeigen.

In Business Intelligence Development Studio stehen zudem neue Filter-Editoren zur Verfügung, mit denen Sie komplexe Bedingungen erstellen können, die sowohl auf Falltabellen als auch auf geschachtelte Tabellen angewendet werden können.

Weitere Informationen zum Erstellen von Miningmodellfiltern finden Sie unter Erstellen von Filtern für Miningmodelle (Analysis Services - Data Mining).

Weitere Informationen zum Filtern von Daten zum Testen von Miningmodellen finden Sie unter Tools zum Auswerten der Modellgenauigkeit (Analysis Services - Data Mining).

Übergreifende Überprüfung mehrerer Miningmodelle

Die übergreifende Überprüfung ist eine feststehende Methode zur Bewertung der Genauigkeit von Data Mining-Modellen. Die übergreifende Überprüfung ist ein iterativer Vorgang, bei dem die Daten der Miningstruktur in Teilmengen partitioniert werden, Modelle für die Teilmengen erstellt werden und dann die Genauigkeit der Modelle für die einzelnen Partitionen gemessen wird. Die zurückgegebene Statistik gibt Aufschluss über die Zuverlässigkeit des Miningmodells, und Sie können Modelle, die auf der gleichen Struktur basieren, einfacher vergleichen.

Die übergreifende Überprüfung ist in der Sicht Mininggenauigkeitsdiagramm des Data Mining-Designers verfügbar. Sie können auch eine Miningstruktur partitionieren, mehrere Miningmodelle testen und mithilfe von gespeicherten Prozeduren aus Analysis Services eine Analyse generieren.

In SQL Server 2008 geben Sie zum Generieren eines Berichts für die übergreifende Überprüfung die Miningstruktur und das vorhersagbare Attribut an und legen dann die Anzahl von Folds fest, in die die Falldaten aufgeteilt werden sollen.

Analysis Services gibt eine Tabelle zurück, die statistische Daten wie Wahrscheinlichkeit oder Wurzel des mittleren Fehlers zum Quadrat für einzelne Partitionen sowie die mittlere und die Standardabweichung aller Measures für die aggregierten Modelle enthält. Weitere Informationen finden Sie unter Übergreifende Überprüfung (Analysis Services - Data Mining)

Unterstützung für die Data Mining-Add-Ins für Office 2007

SQL Server 2008 unterstützt die Erstellung, Verwaltung und Verwendung von Data-Mining-Modellen von Microsoft Excel, wenn Sie die SQL Server 2008-Data-Mining-Add-Ins für Office 2007 verwenden. Die neueste Version dieses beliebten kostenlosen Add-Ins wurde durch die Einführung von Unterstützung für serverseitiges Trainieren, Testpartitionen, Kreuzvalidierung und mehreren neuen Analysetools verbessert, wie beispielsweise die Warenkorbanalyse und ein druckbarer Vorhersagerechner.

Sie können außerdem den Dokumentenmodell-Assistenten verwenden, um auf einfache Weise Dokumentation für Strukturen und Modelle zu erstellen, die in einer Instanz von SQL Server 2008 gespeichert sind. Weitere Informationen über die Add-Ins finden Sie unter Data Mining Add-ins for Office 2007.

Verbesserungen des Microsoft Time Series-Algorithmus

Dem Microsoft Time Series-Algorithmus wurde ein neuer Algorithmus hinzugefügt, der die Genauigkeit und Stabilität bestimmter Vorhersagen in Zeitreihenmodellen verbessert. Der auf dem bekannten ARIMA-Algorithmus basierende neue Algorithmus bietet bessere Langzeitvorhersagen als der von Analysis Services verwendete ARTxp-Algorithmus. (ARTxp ist ein Algorithmus für eine autoregressive Entscheidungsstruktur, der entweder für eine einzelne Zeitscheibe oder für kurzfristige Vorhersagen optimiert ist.)

Standardmäßig wird bei der neuen Implementierung des Microsoft Time Series-Algorithmus der ARTxp-Algorithmus zum Trainieren einer Version des Modells und der ARIMA-Algorithmus zum Trainieren einer anderen Version verwendet. Der Algorithmus gewichtet dann die Ergebnisse der beiden Modelle, um die von Ihnen bevorzugten Vorhersagemerkmale bereitzustellen. Wenn Sie diese Standardimplementierung nicht verwenden möchten, können Sie angeben, dass der Microsoft Time Series-Algorithmus nur den ARTxp-Algorithmus oder nur den ARIMA-Algorithmus verwenden soll. In SQL Server 2008 Enterprise können Sie eine benutzerdefinierte Gewichtung der Algorithmen angeben, um die beste Vorhersage für einen variablen Zeitraum zu erhalten.

Der Microsoft Time Series-Algorithmus akzeptiert nun auch Daten während der Vorhersage, um neue Geschäftsszenarien zu ermöglichen. Sie können z. B. ein Umsatzprognosemodell erstellen, das auf Durchschnittswerten für Produkte, regionale Aggregate oder für ein anderes breites Dataset basiert. Dieses Modell können Sie dann auf die Zeitreihe anwenden, die die Verkaufszahlen für ein einzelnes Produkt anzeigt. Durch Anwenden des allgemeinen Modells profitieren Sie von der Stabilität und Verfügbarkeit der aggregierten Daten und können die Vorhersage für das einzelne Produkt anpassen.

Sie können auch Modelle mit mehreren Reihen trainieren und diese Modelle dann auf neue Daten anwenden, um Was-wäre-wenn-Szenarien vorherzusagen.

Weitere Informationen zu Zeitreihenminingmodellen finden Sie unter Microsoft Time Series-Algorithmus und PredictTimeSeries (DMX).

Drillthrough zu Strukturfällen und Strukturspalten

Wenn Sie in SQL Server 2008 Drillthrough für eine Miningstruktur aktivieren, können Sie die Miningstruktur abfragen und Details zu den für Training und Testen verwendeten Fällen zurückgeben. Sie können Drillthroughabfragen für eine Struktur mit Data Mining-Erweiterungen (DMX) erstellen.

Wenn für ein Miningmodell und die zugehörige Miningstruktur Drillthrough aktiviert ist, können Sie zudem Abfragen erstellen, mit denen Datenspalten aus der zugrunde liegenden Miningstruktur abgerufen werden. Dies ist nützlich, wenn Sie detaillierte Informationen zu Fällen in einem bestimmten Knoten abrufen möchten. Sie könnten z. B. Kontaktinformationen für Kunden in einem bestimmten Cluster abrufen.

Weitere Informationen finden Sie unter Verwenden von Drillthrough für Miningmodelle und Miningstrukturen (Analysis Services - Data Mining).

Beispiele für DMX-Abfragen für eine Miningstruktur finden Sie unter SELECT FROM <structure>.CASES.

Beispiele für Drillthroughs von einem Modell zu den Strukturdaten finden Sie unter SELECT FROM <model>.CASES (DMX).

Aliasing für Miningmodellspalten

Sie können Spalten in einem Miningmodell nun Aliase hinzufügen, um den Inhalt der Spalten leichter erkennen und in DMX-Anweisungen einfacher auf die Spalten verweisen zu können.

Wenn Sie z. B. eine Miningstruktur erstellen, die kontinuierliche und diskretisierte Versionen der gleichen Daten enthält, können Sie beiden Spalten den gleichen Namen zuweisen, um sie leichter vergleichen zu können.

Weitere Informationen zum Verwalten und Anzeigen von Aliasen finden Sie unter Festlegen von Eigenschaften in einem Miningmodell und Gewusst wie: Erstellen eines Alias für eine Modellspalte.

Informationen zum Erstellen eines Spaltenalias mit DMX finden Sie unter ALTER MINING STRUCTURE (DMX).

Abfragen der Data Mining-Schemarowsets

In SQL Server 2008 wurden viele der bestehenden OLE DB Data Mining-Schemarowsets als Gruppe von Systemtabellen verfügbar gemacht, die Sie mit DMX-Anweisungen problemlos abfragen können. Dies erleichtert es, auf Modelle und Strukturen bezogene Metadaten abzurufen, Details des Miningmodellinhalts zu extrahieren oder eine Instanz oder einen Service von Analysis Services zu überwachen.

Weitere Informationen finden Sie unter Abfragen des Data Mining-Schemarowsets (Analysis Services - Data Mining).

Neuer Speicherort für Beispiele

Die Onlinedokumentation umfasst keine SQL Server-Beispieldatenbanken und Beispielanwendungen mehr. Diese Beispieldatenbanken und Beispielanwendungen sind jetzt auf der Website SQL Server Samples verfügbar. Diese Website vereinfacht das Suchen nach Beispielen und stellt zusätzliche neue Beispiele für MicrosoftSQL Server und Business Intelligence bereit. Auf der SQL Server-Website mit Beispielen können Sie die folgenden Aktionen ausführen:

Durchsuchen Sie die Beispiele, die von Entwicklern, Benutzern und der Microsoft MVP (Most Valuable Professional)-Community bereitgestellt wurden.
Laden Sie Beispieldatenbanken und Codeprojekte herunter.
Rufen Sie einen Diskussionsbereich auf, in dem Sie Probleme melden und Fragen zu den Beispielen für die einzelnen Technologiebereiche stellen können.

Gleichzeitige Installation mit SQL Server 2005 Analysis Services

SQL Server 2008Analysis Services kann jetzt parallel zu SQL Server 2005 Analysis Services (SSAS) installiert werden. Weitere Informationen finden Sie unter Verwenden mehrerer Versionen und Instanzen von SQL Server.

Informationen zu Problemen bei der gleichzeitigen Installation, die sich auf Analysis Services auswirken, finden Sie in der mit dieser Version bereitgestellten Infodatei.

Sichern und Wiederherstellen von Analysis Services-Datenbanken

Die Möglichkeit zum Sichern und Wiederherstellen einer Analysis Services-Datenbank wurde verbessert. Es bestehen weniger Einschränkungen hinsichtlich der Größe der Datenbank, und der Zeitaufwand für Sicherungs- und Wiederherstellungsvorgänge wurde erheblich reduziert.

Weitere Informationen finden Sie unter Neuigkeiten (Analysis Services - Mehrdimensionale Datenbank).

Weitere Verbesserungen von Analysis Services

Wenn Sie mit Analysis Services OLAP-Cubes erstellen, die Sie auch für das Data Mining verwenden, erweist sich das Entwerfen von Dimensionen und zugehörigen Hierarchien und Attributen möglicherweise als sehr viel einfacher. Der Dimensions-Designer umfasst einen neuen Attributbeziehungs-Designer, der Sie beim Entwerfen von Attributbeziehungen unter Beachtung bewährter Methoden unterstützt.