next up previous contents
Nächste Seite: Textvorverarbeitung Aufwärts: Indexierung. Algorithmen für die Vorherige Seite: Inhalt   Inhalt

Motivation

Die ständig anwachsenden Informationsmengen in Bibliotheken, Datenbanken und gerade in den letzten Jahren auch im World Wide Web haben die Entwicklung von immer leistungsfähigeren Information Retrieval (IR) Systemen notwendig gemacht und vorangetrieben. Die Komprimierung dieser Informationen ist nur ein Teil der Lösung für die Informationsexplosion. Weitere Probleme, wie die Organisation der Daten und die effiziente Suche nach Begriffen in diesen müssen ebenfalls behandelt werden.

Der wohl wichtigste Bestandteil eines IR Systems ist der Index, eine Liste von Termen und Verweisen auf Orte, an denen die dazugehörige Information zu finden ist. Er ermöglicht die rasche Lokalisierung eines Suchbegriffes in einer umfangreichen Datensammlung. In ihrer ursprünglichsten Form findet man Indizes in Büchern oder als Karteikartensystem in Bibliotheken. Derartige Suchhilfen sind aufgrund ihrer Einfachheit und Effizienz auch heute, etwa 200 Jahre nach ihrer Einführung, die am häufigsten verwendete Methode, um auf Informationen zuzugreifen.

Ein Index ermöglicht es beispielsweise eine bestimmte Information zu finden, ohne die komplette Dokumentensammlung Seite für Seite durchsuchen zu müssen, und, vorausgesetzt der Index kann verstanden werden, es ist sogar möglich, relevante Stellen in einem fremdsprachigen Dokument zu lokalisieren. Auf diese Weise müssten nur die gefundenen relevanten Seiten übersetzt werden, was Zeit und Kosten sparen kann.


next up previous contents
Nächste Seite: Textvorverarbeitung Aufwärts: Indexierung. Algorithmen für die Vorherige Seite: Inhalt   Inhalt
Nagy Istvan 2001-07-25