Information Retrieval
SS 2011, Christoph Ringlstetter
Bachelor CL 9 ETCS, INFORMATIK 9 ECTS, Magister CL Hauptseminar
Zeit und Raum:
Vorlesung: Mo 12-14 Uhr Raum 227 (Schellingstr. 3)
Vorlesung + Übung: Mi 12-13 Uhr Raum 109 13-14 Uhr Raum 103
(Richard-Wagnerstr. 10)
Tutorin: Yan Yao (Übung, Korrektur)
Inhalt und Ziel der Veranstaltung :
Dieses Modul gibt einen Einblick in die wichtigsten Themen der Information Retrieval und Suchmaschinen. Die Grundlagen der wichtigsten Modelle aus dem Bereich der Information Retrieval werden in dieser Vorlesung vermittelt. Außerdem werden Techniken und Verfahren wie Termgewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, Benutzerinteraktion und Feedbackmechanismen sowie Indexierung und linguistische Hilfsmittel aus dem Bereich der Information Retrieval detailliert behandelt. Als Spezialthemen werden das Information Retrieval auf XML-Dokumenten, die Websuche und die Verwendung von Metadaten diskutiert.
Lernziele:
Kenntnis der zugrunde gelegten Moduln, Techniken und Verfahren von Information Retrieval Systemen und Suchmaschinen. Verständnis der benötigten Datenstrukturen und Algorithmen.
Literatur
- An Introduction to Information Retrieval, Christopher
D. Manning/Prabhakar Raghavan/Hinrich Schütze
- Information Retrieval, Reginald Ferber
- Modern Information Retrieval, Ricardo Baeza-Yates/Berthier Ribero-Neto
Skripten:
Skript Fragment
Prof. Klaus U. Schulz
Papers zur Websuche
Searching the Web: Arasu, Cho, Garcia-Molina, Paepcke, Raghavan
The
Anatomy of a Search Engine: Brin, Page
Vorlesungsfolien, übersetzt angepasst bzw. ergänzt nach
Prabhakar Raghavan/Pandu Nayak/Hinrich Schütze/Christina Lioma. Originalfolien
Vorlesungsfolien_1
Vorlesungsfolien_2
Vorlesungsfolien_3
Vorlesungsfolien_4
Vorlesungsfolien_5
Vorlesungsfolien_6
Vorlesungsfolien_7
Vorlesungsfolien_8
Vorlesungsfolien_9
Voraussetzungen
Gute Kenntnisse einer Programmiersprache sind notwendig
Abgabeformular für die Übungen
(hier
klicken)
Erwerb des Scheines bzw. der ECTS:
Übungsaufgaben dienen nur der Übnung, müssen nicht, sollen aber abgegeben
werden. Für Noten- und ETCS Vergabe ist ausschließlich die Klausur
zu Vorlesung bzw. Übung relevant. Zum Erwerb eines
Hauptseminarscheines ist zusätzlich eine Hausarbeit zu erstellen
Übungsaufgaben
Abgabezyklus der Aufgaben: Die Aufgaben werden am Mittwoch
(diesmal 4. Mai) gestellt und sind bis zum nachfolgenden Montag 8.00
Uhr (z.B. diesmal 09.Mai lösen.
Am darauffolgenden Mittwoch wird die
Lösung in der Übung erarbeitet. Die korrigierten Aufgaben
werden dann eine Woche später zurückgegeben. Beachten Sie, dass es
sich bei den Lösungen lediglich um Lösungsvorschläge ohne Gewähr auf
Richtigkeit handelt.
Blatt1: (Abgabe: 09.05. 8:00, Besprechung am
11.05. 12:00) Aufgabe-1
Blatt1: (Lösung) Aufgabe1-Loesungsvorschlag
Blatt2: (Abgabe: 16.05. 8:00, Besprechung am 18.05. 12:00) Aufgabe-2
Blatt2: (Lösung) Aufgabe2-Loesungsvorschlag
Blatt3: (Abgabe: 23.05., 8:00, Besprechung am 25.05. 12:00) Aufgabe-3
Blatt3: (Lösung) Aufgabe-3 Loesung
Blatt4: (Abgabe: 01.06. 8:00, Besprechung am
01.06. 12:00) Aufgabe 4
Blatt4: (Lösung) Aufgabe-4 Loesung
Blatt5: (Abgabe: 08.06., 8:00, Besprechung am
08.06. 12:00) Aufgabe 5
Blatt5: (Lösung) Aufgabe-5 Loesung
Blatt6: (Abgabe: 22.06., 8:00, Besprechung am
22.06. 12:00) Aufgabe 6
Blatt6: (Lösung) Aufgabe-6 Loesung
Blatt7: (Abgabe: 29.06., 8:00, Besprechung am
29.06. 12:00) Aufgabe 7
Blatt7: (Lösung) Aufgabe-7 Loesung
Blatt8: (Abgabe: 06.07., 8:00, Besprechung am
06.07. 12:00) Aufgabe 8
Blatt8: (Lösung) Aufgabe-8 Loesung
Blatt9: (Abgabe: 13.07., 8:00, Besprechung am
13.07. 12:00) Aufgabe 9
Blatt9: (Lösung) Aufgabe 9 Loesung
Uebungsklausur Uebungsklausur
Support:
Werke von Shakespeare zum Download