Ausnahmen hervorheben – Videolernprogramm (Data Mining-Tabellenanalysetool)

Betrifft: Microsoft SQL Server Analysis Services

Autor: Michele Hart, Microsoft Corporation

Sprecher: Mary Brennan, Microsoft Corporation

Länge: 00:04:28

Größe: 19.479 KB

Typ: WMV-Datei

Video ansehen

Verwandte Hilfethemen:

Data Mining-Algorithmen (Analysis Services - Data Mining)

Weitere Videos:

Erste Schritte mit den Tabellenanalysetools (SQL Server-Video)

Wichtige Einflussfaktoren analysieren – Videolernprogramm (Data Mining-Tabellenanalysetool)

Erkennen von Kategorien - Videolernprogramm (Data Mining-Tabellenanalysetool)

Aus Beispiel füllen – Videolernprogramm (Data Mining-Tabellenanalysetool)

Planung – Videolernprogramm (Data Mining-Tabellenanalysetool)

Vorhersagerechner – Videolernprogramm (Data Mining-Tabellenanalysetool)

Szenarienanalyse – Videolernprogramm zur Zielsuche (Data Mining-Add-In für Excel)

Szenarienanalyse – Videolernprogramm zur Was-wäre-wenn-Funktion (Data Mining-Add-In für Excel)

Warenkorbanalyse – Videolernprogramm (Data Mining-Tabellenanalysetool)

Videozusammenfassung

In diesem Lernprogramm erfahren Sie, wie Sie das Tabellenanalysetool "Ausnahmen hervorheben" für Excel 2007 verwenden können.

Videotranskript

Einführung

Guten Tag, mein Name ist Mary Brennan. Ich bin technische Redakteurin für Microsoft SQL Server. Dieses Video erleichtert Ihnen den Einstieg in die Verwendung des Tools "Ausnahmen hervorheben". Für das Tool "Ausnahmen hervorheben" werden der Microsoft Clustering-Algorithmus und die Musteranalyse verwendet, um in einem Dataset nach atypischen Werten zu suchen. Diese können fehlen, außerhalb des Bereichs der meisten anderen Werte liegen oder sogar falsch sein und sich auf die Qualität Ihrer Analyse auswirken. Mit dem Tool "Ausnahmen hervorheben" können Sie diese Werte finden und prüfen, welche weiteren Maßnahmen erforderlich sind.

Mit dem Tool "Ausnahmen hervorheben" können Sie die gesamten Daten einer Excel-Datentabelle ebenso bearbeiten wie einige ausgewählte Spalten. Sie können zudem einen Schwellenwert anpassen, mit dem die Datenvariabilität gesteuert wird, um mehr oder weniger Ausnahmen zu finden.

In diesem Lernprogramm verwenden wir das Tool "Ausnahmen hervorheben", um abweichende Daten zu ermitteln. Diese Werte werden auch als "Ausreißer" bezeichnet. Dabei kann es sich um Fehler bei der Dateneingabe oder um an sich ungewöhnliche Werte handeln, die genauer analysiert werden müssen. Anschließend prüfen wir die Ausreißer und nehmen Korrekturen vor. Abschließend werden wir den Ausnahmeschwellenwert anpassen, damit nur die auffallendsten Ausreißer ermittelt werden.

Der Assistent

  1. Wählen Sie zunächst die Registerkarte Tabellenanalysetools-Beispiel (Table Analysis Tools Sample) aus, und klicken Sie auf eine beliebige Stelle in der Tabelle, um die Tabellenanalysetools zu aktivieren.
  2. Wählen Sie unter dem Menü Tabellentools (Table Tools) die Registerkarte Analyse (Analyze) aus, um die Multifunktionsleiste Tabellenanalysetools (Table Analysis Tools) zu öffnen.
  3. Doppelklicken Sie auf Ausnahmen hervorheben (Highlight Exceptions), um den Assistenten zu starten.
  4. Wählen Sie im Fenster Spaltenauswahl (Column Selection) die Spalten aus, die Sie auf Ausnahmen untersuchen möchten. Heben Sie die Auswahl für Eingabespalten auf, die nur wenige Informationen enthalten, oder die für das Erstellen eines Musters nicht erforderlich sind. Heben Sie beispielsweise die Auswahl für Spalten auf, die viele fehlende oder leere Werte aufweisen, oder die unterschiedliche Werte wie Namen oder ID-Nummern enthalten.
  5. Klicken Sie auf Ausführen (Run). Die Berichte werden in einem neuen Arbeitsblatt angezeigt.

Die Berichte

Im Ausreißerarbeitsblatt finden Sie einen Zusammenfassungsbericht über die Anzahl der in den einzelnen analysierten Spalten erkannten Ausreißer. Außerdem werden die Ausnahmen in der ursprünglichen Datentabelle hervorgehoben.

In unserem Beispiel wurden 34 Ausreißer gefunden, die über dem Ausnahmeschwellenwert liegen. Die meisten befinden sich in den Spalten Kinder (Children) und Autos (Cars). In den Beispieldaten können wir einfach nach diesen Ausreißern suchen. Dunkel hervorgehobene Spalten müssen untersucht werden. Eine helle Hervorhebung weist darauf hin, dass der Wert in dieser Zelle als verdächtig erkannt wurde.

  1. Sortieren Sie im Arbeitsblatt Tabellenanalysetools-Beispiele (Table Analysis Tools Samples) die Spalte Alter (Age) absteigend von den ältesten bis hin zu den jüngsten Personen.
    In der dritten und sechsten Spalte finden Sie Ausreißer hinsichtlich des Alters. Es erscheint sonderbar, dass ein 78-Jähriger $ 100.000 verdienen und ein Fahrrad erworben haben soll.
  2. Navigieren Sie zu Ausreißer 17657. Sie erkennen, dass es sich um einen Fehler handelt und dass dieser 30-jährige Kunde zwei Kinder hat.
  3. Ändern Sie den Wert von 4 zu 2. Der neue Wert wird umgehend analysiert. Da er nun in den erwarteten Bereich fällt, wird er nicht mehr hervorgehoben.
  4. Kehren Sie im Anschluss an die Prüfung der hervorgehobenen Zellen zum Zusammenfassungsbericht zurück, und ändern Sie den Ausnahmeschwellenwert (Exception threshold value), damit weniger Ausreißer ermittelt werden. Der Anfangswert für den Ausnahmeschwellenwert liegt stets bei 75. Dies bedeutet, dass der Algorithmus berechnet hat, dass die hervorgehobenen Daten mit einer Wahrscheinlichkeit von 75 % falsch sind. Wir wollen jedoch nur die deutlichsten Ausreißer betrachten.
    Erhöhen Sie den Ausnahmeschwellenwert (Exception threshold) auf 90. Nun werden nur noch sieben Ausnahmen erkannt. Entsprechend werden im Quellarbeitsblatt nur noch sieben Zeilen hervorgehoben.

Zusammenfassung

Damit sind wir am Ende des Videolernprogramms zum Thema "Ausnahmen hervorheben" angelangt. Weitere Hilfe zu den Tabellenanalysetools finden Sie in den anderen Videolernprogrammen der Tabellenanalysetools und in der Hilfedokumentation zu den Data Mining-Add-Ins. Vielen Dank, dass Sie sich dieses Lernprogramm angesehen haben.