Stoppwörter und Stopplisten

Um zu verhindern, dass ein Volltextindex unnötig aufgebläht wird, verfügt SQL Server über einen Mechanismus, der häufig vorkommende, für die Suche nutzlose Zeichenfolgen ignoriert. Diese verworfenen Zeichenfolgen werden als Stoppwörter bezeichnet. Während der Indexerstellung lässt das Volltextmodul Stoppwörter vom Volltextindex weg. Dies bedeutet, dass Volltextabfragen nicht nach Stoppwörtern suchen.

Wichtiger HinweisWichtig

SQL Server 2005-Füllwörter wurden durch Stoppwörter ersetzt. Wenn eine Datenbank von einer vorherigen Version auf SQL Server 2008 aktualisiert wird, werden die Füllwortdateien in SQL Server 2008 nicht mehr verwendet. Die Füllwortdateien werden jedoch im Ordner FTDATA\FTNoiseThesaurusBak gespeichert, und Sie können sie später beim Aktualisieren oder Erstellen der entsprechenden SQL Server 2008-Stopplisten verwenden. Informationen zur Aktualisierung von Füllwortdateien auf Stopplisten finden Sie unter Aktualisieren der Volltextsuche.

Ein Stoppwort kann ein Wort mit einer Bedeutung in einer bestimmten Sprache oder ein Token ohne jegliche linguistische Bedeutung sein. Beispielsweise werden in der englischen Sprache Wörter wie "a", "and", "is" und "the" im Volltextindex ausgelassen, da sie erfahrungsgemäß keinen Beitrag zur Suche leisten.

Obwohl der Volltextindex die Inklusion von Stoppwörtern ignoriert, berücksichtigt er ihre Position. Als Beispiel sei der Ausdruck "Instructions are applicable to these Adventure Works Cycles models" angeführt. In der folgenden Tabelle sind die Positionen der Wörter im Ausdruck angegeben:

Wort

Position

Instructions

1

are

2

applicable

3

to

4

these

5

Adventure

6

Works

7

Cycles

8

models

9

Die Stoppwörter "are", "to" und "these" an den Positionen 2, 4 und 5 werden im Volltextindex ausgelassen. Die Positionsinformationen bleiben jedoch erhalten, sodass die Positionen der anderen Wörter im Ausdruck unverändert bleiben.

Stopplisten

In SQL Server 2008 werden Stoppwörter über Objekte mit dem Namen Stopplisten in Datenbanken verwaltet. Eine Stoppliste ist eine Liste mit Stoppwörtern, die, wenn sie einem Volltextindex zugeordnet ist, auf Volltextabfragen für diesen Index angewendet wird.

Erstellen einer Stoppliste

Zum Erstellen einer Stoppliste stehen die folgenden Möglichkeiten zur Verfügung:

  • Verwenden der vom System bereitgestellten Stoppliste in der Datenbank. Der Lieferumfang von SQL Server umfasst eine Systemstoppliste, die die am häufigsten verwendeten Stoppwörter für jede unterstützte Sprache enthält, d. h. für jede Sprache, die den jeweiligen Wörtertrennungen standardmäßig zugeordnet ist. Die Systemstoppliste enthält gebräuchliche Stoppwörter für alle unterstützten Sprachen. Sie können die Systemstoppliste kopieren und Ihre Kopie durch das Hinzufügen und Entfernen von Stoppwörtern anpassen.

    Die Systemstoppliste ist in der Datenbank Ressourcen installiert.

  • Erstellen einer eigenen Stoppliste und Hinzufügen von Stoppwörtern für jede Sprache, die Sie angeben. Sie können bei Bedarf auch Stoppwörter aus der Stoppliste löschen.

  • Verwenden einer vorhandenen benutzerdefinierten Stoppliste aus einer anderen Datenbank in der aktuellen Serverinstanz und anschließendes Hinzufügen und Löschen von Stoppwörtern nach Bedarf.

Wichtiger HinweisWichtig

CREATE FULLTEXT STOPLIST, ALTER FULLTEXT STOPLIST und DROP FULLTEXT STOPLIST werden nur bei einem Kompatibilitätsgrad von 100 unterstützt. Bei Kompatibilitätsgraden von 80 und 90 werden diese Anweisungen nicht unterstützt. Bei allen Kompatibilitätsgraden wird die Systemstoppliste jedoch automatisch neuen Volltextindizes zugeordnet.

So erstellen Sie eine Stoppliste

So fügen Sie einer Stoppliste Stoppwörter hinzu oder löschen diese

So löschen Sie eine Stoppliste

Verwenden einer Stoppliste in Abfragen

Wenn Sie eine Stoppliste in Abfragen nutzen möchten, müssen Sie diese einem Volltextindex zuordnen. Sie können einem Volltextindex eine Stoppliste zuordnen, wenn Sie den Index erstellen, oder Sie können den Index später ändern, um eine Stoppliste hinzuzufügen.

So erstellen Sie einen Volltextindex und ordnen diesem eine Stoppliste zu

So ordnen Sie einem vorhandenen Volltextindex eine Stoppliste zu oder heben eine Zuordnung auf

So unterdrücken Sie eine Fehlermeldung, wenn Stoppwörter bei einer booleschen Operation für eine Volltextabfrage einen Fehler erzeugen

Anzeigen von Stopplisten und Stopplistenmetadaten

So zeigen Sie alle Stoppwörter einer Stoppliste an

So rufen Sie Informationen zu allen Stopplisten in der aktuellen Datenbank ab

So zeigen Sie das Tokenisierungsergebnis einer Kombination aus Wörtertrennung, Thesaurus und Stopplisten an