CIS
Centrum für Informations-
und Sprachverarbeitung

Aktuelles

Klausurergebnis

Beispielthemen zur Klausur:


Boolesches Retrieval
Indexerstellung
Preprocessing
Effiziente Indextechniken
Vektorraummodell
Evaluation
XML Retrieval
Latent Semantic Indexing
Websuche


 



Information Retrieval

SS 2011, Christoph Ringlstetter

Bachelor CL 9 ETCS, INFORMATIK 9 ECTS, Magister CL Hauptseminar

 

Zeit und Raum:
Vorlesung: Mo 12-14 Uhr Raum 227 (Schellingstr. 3)
Vorlesung + Übung: Mi 12-13 Uhr Raum 109 13-14 Uhr Raum 103 (Richard-Wagnerstr. 10)

Tutorin: Yan Yao (Übung, Korrektur)

Inhalt und Ziel der Veranstaltung :


Dieses Modul gibt einen Einblick in die wichtigsten Themen der Information Retrieval und Suchmaschinen. Die Grundlagen der wichtigsten Modelle aus dem Bereich der Information Retrieval werden in dieser Vorlesung vermittelt. Außerdem werden Techniken und Verfahren wie Termgewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, Benutzerinteraktion und Feedbackmechanismen sowie Indexierung und linguistische Hilfsmittel aus dem Bereich der Information Retrieval detailliert behandelt. Als Spezialthemen werden das Information Retrieval auf XML-Dokumenten, die Websuche und die Verwendung von Metadaten diskutiert. Lernziele: Kenntnis der zugrunde gelegten Moduln, Techniken und Verfahren von Information Retrieval Systemen und Suchmaschinen. Verständnis der benötigten Datenstrukturen und Algorithmen.

Literatur

  1. An Introduction to Information Retrieval, Christopher D. Manning/Prabhakar Raghavan/Hinrich Schütze
  2. Information Retrieval, Reginald Ferber
  3. Modern Information Retrieval, Ricardo Baeza-Yates/Berthier Ribero-Neto

Skripten:

Skript Fragment Prof. Klaus U. Schulz

Papers zur Websuche

Searching the Web: Arasu, Cho, Garcia-Molina, Paepcke, Raghavan

The Anatomy of a Search Engine: Brin, Page

Vorlesungsfolien, übersetzt angepasst bzw. ergänzt nach Prabhakar Raghavan/Pandu Nayak/Hinrich Schütze/Christina Lioma. Originalfolien

Vorlesungsfolien_1

Vorlesungsfolien_2

Vorlesungsfolien_3

Vorlesungsfolien_4

Vorlesungsfolien_5

Vorlesungsfolien_6

Vorlesungsfolien_7

Vorlesungsfolien_8

Vorlesungsfolien_9

Voraussetzungen

Gute Kenntnisse einer Programmiersprache sind notwendig

Abgabeformular für die Übungen

(hier klicken)

Erwerb des Scheines bzw. der ECTS:

Übungsaufgaben dienen nur der Übnung, müssen nicht, sollen aber abgegeben werden. Für Noten- und ETCS Vergabe ist ausschließlich die Klausur zu Vorlesung bzw. Übung relevant. Zum Erwerb eines Hauptseminarscheines ist zusätzlich eine Hausarbeit zu erstellen

Übungsaufgaben

Abgabezyklus der Aufgaben: Die Aufgaben werden am Mittwoch (diesmal 4. Mai) gestellt und sind bis zum nachfolgenden Montag 8.00 Uhr (z.B. diesmal 09.Mai lösen.
Am darauffolgenden Mittwoch wird die Lösung in der Übung erarbeitet. Die korrigierten Aufgaben werden dann eine Woche später zurückgegeben. Beachten Sie, dass es sich bei den Lösungen lediglich um Lösungsvorschläge ohne Gewähr auf Richtigkeit handelt.

Blatt1: (Abgabe: 09.05. 8:00, Besprechung am 11.05. 12:00) Aufgabe-1

Blatt1: (Lösung) Aufgabe1-Loesungsvorschlag

Blatt2: (Abgabe: 16.05. 8:00, Besprechung am 18.05. 12:00) Aufgabe-2

Blatt2: (Lösung) Aufgabe2-Loesungsvorschlag

Blatt3: (Abgabe: 23.05., 8:00, Besprechung am 25.05. 12:00) Aufgabe-3

Blatt3: (Lösung) Aufgabe-3 Loesung

Blatt4: (Abgabe: 01.06. 8:00, Besprechung am 01.06. 12:00) Aufgabe 4

Blatt4: (Lösung) Aufgabe-4 Loesung

Blatt5: (Abgabe: 08.06., 8:00, Besprechung am 08.06. 12:00) Aufgabe 5

Blatt5: (Lösung) Aufgabe-5 Loesung

Blatt6: (Abgabe: 22.06., 8:00, Besprechung am 22.06. 12:00) Aufgabe 6

Blatt6: (Lösung) Aufgabe-6 Loesung

Blatt7: (Abgabe: 29.06., 8:00, Besprechung am 29.06. 12:00) Aufgabe 7

Blatt7: (Lösung) Aufgabe-7 Loesung

Blatt8: (Abgabe: 06.07., 8:00, Besprechung am 06.07. 12:00) Aufgabe 8

Blatt8: (Lösung) Aufgabe-8 Loesung

Blatt9: (Abgabe: 13.07., 8:00, Besprechung am 13.07. 12:00) Aufgabe 9

Blatt9: (Lösung) Aufgabe 9 Loesung

Uebungsklausur  Uebungsklausur


Support:

Werke von Shakespeare zum Download