Das Centrum für Informations- und Sprachverarbeitung (CIS) befindet sich im Gebäudekomplex der Institute am Englischen Garten, Flügel B, 1. Stock. Adresse: Oettingenstr. 67, 80538 München. Tel: (089)2180-9721; FAX: (089) 2180-9701 Das Sekretariat ist für Studenten vormittags von 10-12 geöffnet.
Veranstaltungsbeginn und Räume
Die Veranstaltungen beginnen in aller Regel in der ersten Semesterwoche. Abweichungen davon werden rechtzeitig ausgehängt. Falls nicht anders angegeben finden die Veranstaltungen im Gebäude an der Oettingenstraße statt.
Vorlesungsverzeichnis im WWW
Das kommentierte Vorlesungsverzeichnis kann auch unter folgender Adresse im WWW eingesehen werden: http://www.cis.uni-muenchen.de/kurse
Nachbardisziplinen
Hingewiesen wird auch auf die Veranstaltungen des Instituts für Informatik , des Instituts für Philosophie, Logik und Wissenschaftstheorie (Ludwigstr.31), des Instituts für Phonetik und Sprachliche Kommunikation (Schellingstr.3) und schließlich auf die Veranstaltungen zur theoretischen Linguistik des Instituts für Deutsche Philologie (Schellingstr.3).
Fachschaft
Die Fachschaft Computerlinguistik, die selbstverwaltete Interessenvertretung der Studenten am Institut, ist unter http://www.cis.uni-muenchen.de/studenten/fachschaft zu erreichen.
Studienberatung
Die Studienberatung findet (nach Voranmeldung) in den Sprechstunden von Prof.Dr.Guenthner und Prof.Dr.Schulz statt. Ferner stehen alle Dozenten gerne zur Beratung zur Verfügung. Mentorenstunden der Dozenten am CIS:
Vorlesung 2stündig (Vorlesungsfolien u.a. auf der Kursseite)
Zeit und Raum: Di. 8-10 Raum 1.05
Inhalt und Ziel der Veranstaltung
Es werden verschiedene Datenstrukturen und effiziente Algorithmen der Stringverarbeitung behandelt. Einerseits geht es um Indexierung und Suchprobleme:
Voraussetzungen
Proseminar ,,Formale Sprachen und Automaten''
Literatur
Es findet ein begleitendes Hauptseminar/Programmierpraktikum statt, in dem die Teilnehmer einige der Algorithmen implementieren sollen.
Proseminarvorlesung
Zeit und Raum: Mo. 16-18, Raum 0.05 und Mi. 8-10, Raum 1.27
Inhalt und Ziel der Veranstaltung
Im ersten Teil des Kurses wird eine Einführung in die Benutzung verschiedener Unixkommandos zur Bearbeitung von Texten gegeben. Parallel dazu gibt es eine Einführung in die Programmiersprache Python.. Es werden die Grundkonzepte von Python behandelt, wobei besonders auf die Einsatzmöglichkeiten von Python für Computerlinguisten eingegangen wird. Ferner werden wir das Korpustool Unitex für verschiedene Korpusprogramme verwenden. Der Kurs richtet sich an Studenten, die bereits Grundkenntnisse im Umgang mit UNIX-Rechnern haben. Kenntnisse einer Programmiersprache sind notwendig.
Voraussetzungen
Besuch der Veranstaltung Einführung in die Programmierung und ein Programmierkurs (Perl, Java, Prolog oder C)
Scheinkriterien
Lösen von Übungsaufgaben, Kurzreferat und Klausur
Proseminarvorlesung
Zeit und Raum: Mo. 10 - 12 , Raum 1.27 und Mi. 16-18, Raum 1.27
Inhalt und Ziel der Veranstaltung
Das Seminar ist eine Einführung in die Logik-Programmierung. Dabei geht es vor allem darum, ein Problem durch logische Formeln darzustellen und seine Lösung durch automatische Suche eines Beweises der Formel (oder einer erfüllenden Belegung ihrer Variablen) zu finden.
Der dazu geeignete Teil der Prädikatenlogik, die Beschränkung auf sogenannte Horn-Formeln, dient in der Computerlinguistik auch zur Darstellung von Grammatiken (Definite Clause Grammars). Die Beweissuche wird bei dieser Anwendung zu einer automatischen Syntaxanalyse.
PROLOG-Kenntnisse sind eine Voraussetzung für den Kurs Computerlinguistik II im folgenden Semester.
Voraussetzungen
Wünschenswert sind Kenntnisse über die Aussagenlogik und über die Terme der Prädikatenlogik aus dem Kurs Mathematische Grundlagen I.
Scheinkriterien
Lösen von Programmieraufgaben und Bestehen einer Abschlussklausur
Proseminarvorlesung
Zeit und Raum: Mo. 14-16, Raum 23 und Mi. 10-12, Raum 0.37
Inhalt und Ziel der Veranstaltung
In der Veranstaltung wird die Programmiersprache C++ gelernt. Neben dem Seminar werden Übungen abgehalten. Im Seminar werden alle wichtigen Konzepte der objektorientierten Programmierung, wie Klassen, Operatorenüberladung usw. gelehrt. Die Aufgaben in der Übung kommen aus dem Bereich der Computerlingustik.
Literatur
Voraussetzungen
Gute Kenntnisse der Programmiersprache C sind notwendig.
Scheinkriterien
Erfolgreiche Lösung der Übungsaufgaben.
Proseminarvorlesung
Zeit und Raum: Mo. 8-10, Raum 1.27 und Do. 16-18, Raum 0.33
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung wird eine Einführung in Techniken der statistischen Sprachverarbeitung gegeben. Im ersten Teil des Seminars werden die Teilnehmer mit den Grundlagen der Statistik vertraut gemacht. Der zweite Teil beschäftigt sich mit der Anwendung statistischer Methoden im Rahmen der Computer- und Korpuslinguistik - z.B. mit der Ermittlung von statistischen Assoziationspaaren, der Verwendung von Hidden-Markov-Modellen, statistischen Werten im Information Retrieval u.v.a.m.
Voraussetzungen
Mathematische und linguistische Grundkenntnisse.
Scheinkriterien
Bearbeitung von Übungsaufgaben und Referat.
Proseminarvorlesung
Zeit und Raum: Di. 14 - 16 , Raum 23 und Fr. 8-10, Raum 1.27
Inhalt und Ziel der Veranstaltung
Es wird eine Einführung in die theoretische und computerlinguistische Behandlung der Semantik natürlicher Sprachen gegeben. Behandelt werden:
Voraussetzungen
Proseminar Mathematische Grundlagen I oder II (linguistische und prädikatenlogische Grundkenntnisse)
Literatur
Scheinkriterien
Aktive Mitarbeit, Lektüre, Bearbeitung von Übungsaufgaben und Klausur.
Proseminarvorlesung
Zeit und Raum: Di. 18-20, Raum 1.27 und Do. 12-14, Raum 1.27
Inhalt und Ziel der Veranstaltung
Ziel des Kurses ist die Vermittlung der zentralen Termini der Syntax sowie die Auseinandersetzung mit den wichtigsten syntaktischen Phänomenen des Deutschen, Englischen und anderer Sprachen. Als theoretischer Rahmen dient dabei die HPSG (Head-driven Phrase Structure Grammar). Grundlage des Kurses ist das Buch von Ivan Sag und Thomas Wasow ,,Syntactic Theory''. Ergänzend werden syntaktische Phänomene des Deutschen betrachtet. Es wird erwartet, dass die Teilnehmer von Woche zu Woche etwa ein Kapitel durcharbeiten und Übungsaufgaben lösen. Die Anschaffung des Buches in aktueller Auflage wird daher dringend empfohlen.
Literatur
Sag, I., Wasow. T. & E. Bender [2003]. Syntactic Theory. 2. Auflage Chicago: CUP
Teilnahmebedingungen
Aktive Mitarbeit, Übungen und Referat
Scheinkriterien
Teilnahmebedingungen und Klausur
K. Schulz
Proseminarvorlesung
Zeit und Raum: Mo. 12 -14 , Raum 1.27 und Do. 14-16, Raum 0.13
Inhalt und Ziel der Veranstaltung
Die Veranstaltung gibt eine Einführung in die Syntax und Semantik der Aussagen- und Prädikatenlogik. Insbesondere wird der Begriff des formalen Beweises behandelt, der u.a. eine Grundlage der Logikprogrammierung (Prolog) ist. Außerdem wird die Semantik der Prädikatenlogik behandelt, auf der die logische Semantik natürlicher Sprachen aufbaut. Weiter werden Übersetzungen zwischen umgangssprachlichen und prädikatenlogischen Aussagen eingeübt.
Literatur
Voraussetzungen
Erfolgreiche Teilnahme der Veranstaltung Mathematische Grundlagen I
Scheinkriterien
Aktive Teilnahme, Bearbeitung von Übungsaufgaben + Klausur am Ende des Semesters
Proseminar
Zeit und Raum: Do. 8 - 10 , Raum 1.43
Inhalt und Ziel der Veranstaltung
Hyper- und Multi-Media sind die aktuellen Schlagworte in der Diskussion über neue Medien. In diesem Proseminar werden zuerst die Begriffe Hyper- und Multi-Media definiert und anhand einiger Beispiele (HyperTexte, Multi-Media CD-ROMs, World Wide Web) erläutert. Dann werden die technischen Grundlagen vorgestellt: Standards zur Speicherung von Multi-Media Daten, zum Transfer von Daten, zur Verknüpfung von Multi-Media Dokumenten, und Programme zur Erstellung von Hypertexten und Multi-Media Dokumenten. Im Anschluß daran werden mögliche Einsatzgebiete diskutiert und eines davon als Projekt ausgewählt. Für dieses Projekt wird eine Bedarfsanalyse durchgeführt und es werden erste Versionen implementiert - die dann in den Hausarbeiten ausgearbeitet werden können. Es besteht die Möglichkeit, im Rahmen praktischer Arbeiten mit verschiedenen Multi-Media- und Hypermedia-Systemen am Computer zu arbeiten. Stichworte:
Teilnahmebedingungen
Bereitschaft zu praktischer Arbeit
Scheinkriterien
Referat, Hausarbeit und aktive Teilnahme im Seminar.
Proseminar
Zeit und Raum: Do. 15-17, Schellingstraße 3, Raum K13 (CIP-Pool
Inhalt und Ziel der Veranstaltung
Java ist eine moderne objektorientierte und plattformunabhängige Programmiersprache, die sowohl zur Programmierung von eigenständigen Applikationen als auch von Applets, das sind Programme, die innerhalb eines WWW-Browsers laufen, verwendet wird.
Der Javakurs besteht aus zwei Teilen: eine Einführung ins Programmieren in Java im Wintersemester, und fortgeschrittenes Programmieren in Java im Sommersemester.
Themen im Wintersemester sind: objektorientiertes Programmieren, elementare Programmierkonstrukte wie Schleifen, Fallunterscheidungen und Rekursion sowie der Aufbau eigener Datenstrukturen und elementare Ein- und Ausgabe. Themen des Sommersemesters sind grafische Oberflächen, Multimedia, das WWW sowie Datenbankzugriffe von Java aus.
Die Programmierbeispiele stammen größtenteils aus dem Bereich der Phonetik bzw. Linguistik. Im Kurs stelle ich Programmfragmente vor, die in eigener Arbeit dann vervollständigt werden müssen.
Literatur
Voraussetzungen
Programmiererfahrung in einer anderen Programmiersprache wünschenswert, selbstständiges Arbeiten während der Woche.
Scheinkriterien
auf Wunsch stelle ich einen Teilnahmeschein aus. Einen Schein mit Leistungsnachweis gibt es für ein selbstständig ausprogrammiertes Anwendungsprogramm.
Proseminar
Zeit und Raum: Do. 16-18, Raum 0.41
Inhalt und Ziel der Veranstaltung
Sprachakustik befaßt sich mit der Wahrnehmung, Erzeugung, Übertragung und Verarbeitung von Sprachschall aus psychologischer, physiologischer, physikalischer und technischer Sicht. Der Kurs gibt eine allgemeinverständliche Einführung, indem einige hundert grundlegende Fachbegriffe möglichst anschaulich und beispielreich erläutert werden, im Sinne einer didaktisch geordneten Enzyklopädie.
Voraussetzungen
keine
Scheinkriterien
mündliche Prüfung
Vorlesung / Hauptseminar
Zeit und Raum: Mi. 10-12, Raum 1.13
Inhalt und Ziel der Veranstaltung
Lokale Grammatiken sind eine interessante Alternative zur herkömmlichen Syntaxanalyse, die hauptsächlich auf semantisch neutralen syntaktischen Kategorien basiert und vor allem den Aspekt der ,,festen'' Formulierungen in sehr grossen Teilen der Sprache systematisch ausser Acht lässt. Die Veranstaltung umfasst die Geschichte von ,,lokalen Grammatiken'' von Z. Harris bis heute und beschreibt die Grundprinzipien der Analyse natürlicher Sprachen anhand von lokalen Grammatiken für sehr spezielle Konstruktionen des Deutschen (z.B. Nominalphrasen, welche verschiedene Typen von Entitäten bezeichnen, temporale und lokative Ausdrücke, feste Wendungen, komplexe Verben, usw.)
Anmeldung
Beim Dozenten während der Semesterferien
Voraussetzungen
Zwischenprüfung in CL
Scheinkriterien
Mit Erstellung einer Hausarbeit kann ein HS-Schein für diese Veranstaltung erworben werden.
Hauptseminar
Zeit und Raum: Mi. 14-16, Raum 1.13
Inhalt und Ziel der Veranstaltung
Diese Veranstaltung gibt einen Überblick über die Struktur und die Anwendungen von Suchmaschinen mit besonderer Berücksichtigung der maschinellen Analyse von Webseiten. Im Vordergrund steht der Begriff einer "Seitentransformation", welche aus jeder Seite eine Art von Zusammenfassung generiert, die für die Indexierung dieser Seite zugrunde gelegt werden soll.
Wir werden verschiedene Verfahren zur Informationsextraktion genauer untersuchen und sie auf die Analyse deutscher Webseiten anwenden.
Anmeldung
Beim Dozenten in den Semesterferien
Voraussetzungen
Zwischenprüfung, gute Kenntnisse in einer Programmiersprache (z.B. Perl, Python oder C, C++).
Scheinkriterien
Erarbeitung eines Informationsexktraktionsmodul für einen Entititstyp (in Absprache mit dem Dozenten)
Hauptseminar
Zeit und Raum: Do. 16-18, Raum 0.15
Inhalt und Ziel der Veranstaltung
Ziel der Veranstaltung ist der Aufbau einer Programmbibliothek für Stringalgorithmen. Die Auswahl der Algorithmen orientiert sich am Vorlesungsteil ,,Algorithmen und Datenstrukturen zur Stringverarbeitung'' und soll deren Verständnis vertiefen helfen. Hauptanliegen des Kurses ist es, Erfahrung in der Implementierung ganzer Softwaremodule, einschließlich Design und Optimierung, zu vermitteln. Weiteres Ziel ist ein experimenteller Vergleich zwischen funktionaler und objektorientierter Programmentwicklung. Studenten auch mit SML-Kenntnissen sind daher sehr willkommen. Der Kurs gliedert sich in folgende Abschnitte:
Voraussetzungen
Kenntnisse in C++ oder SML sowie der begleitende Besuch der Vorlesung über Stringalgorithmen. Bei Unsicherheit über die genauen Anforderungen bzgl. der Programmiersprache ist vorherige Abklärung mit dem Dozenten zu empfehlen. Vorausgesetzt wird ferner die Bereitschaft, wöchentlich ca. 6 Stunden über den Besuch der Übungsstunde hinaus für die Arbeit an Übungsaufgaben bzw. die Projektarbeit zu verwenden.
Scheinkriterien
Anfangs werden wöchtenliche Hausaufgaben gestellt, die in Phase (E) in die Projektarbeit übergehen. Hausaufgaben sowie der Fortgang der Projekte werden jede Woche in den ersten 30 Minuten der Veranstaltung vorgestellt. Diese Kurzreferate sowie die erfolgreiche Implementierung ausgewählter Algorithmen dienen als Kriterium für die Vergabe eines Scheines.
Kursseite: hier
Hauptseminar
Zeit und Raum: Mi. 12-14, Raum 1.05, Do. 12-14, Raum 1.31
Inhalt und Ziel der Veranstaltung
Im Rahmen dieser Veranstaltung werden verschiedene maschinelle Lernverfahren im Hinblick auf ihre Anwendung fuer die automatische Textklassifikation betrachtet. Automatische Textklassifikation basiert in der Regel darauf, dass aus einer Menge von vorklassifizierten Daten, den Trainingsdaten, ein Klassifikator fuer die jeweilige Anwendung abgeleitet werden muss. Hierzu werden maschinelle Lernverfahren angewendet. Es werden folgende Themenschwerpunkte behandelt:
Literatur
Voraussetzungen
Kenntnisse im Umfang des Grundstudiums "Computerlinguistik", insbesondere Grundkenntnisse in statistischen Methoden.
Scheinkriterien
Referat und Hausarbeit
Hauptseminar
Zeit und Raum: 12.05. - 15.05.2004, Venedig
Inhalt und Ziel der Veranstaltung
In Venedig findet ein Blockseminar mit dem Titel ,,Dialog systems in Spoken Language
Processing (SLP)'' statt. Dazu folgende Erläuterung:
In most natural situations speech is produced in dialogs between speakers and hearers reacting to each other. Therefore also in many technical applications of spoken languages processing (SLP) the development of appropriate dialog systems plays an increasingly important role. Our seminar will deal with some of the central questions of this new research field.
The question we address on the first two days is what are the specific phonetic features that so clearly distinguish speech dialog situations from speech produced in a monolog (such as read speech, dictated utterances, recitations etc.
On the the third day we look at those features that can be automatically processed by the methods of digital signal processing. Here we are mainly interested in dealing with features that can be parametrically controlled in analysing and modifying naturally produced utterances for automatic speech synthesis systems.
On the following days we will be concerned with applications. First we present and discuss the possibilities of making phonetic use of some technical solutions that are publically available (such as Voice XML). Secondly, we have to deal with the linguistic, semantic and pragmatic aspects of constructing technical questioning- and answering systems for specific applications. Finally there will be a general discussion with the aim of producing a concluding summary which will be published in the ,,Forschungsberichte des Instituts für Phonetik und Sprachliche Kommunikation''.
Voraussetzungen
Abgeschlossenes Grundstudium
Teilnahmebedingungen
Bewerbungen beim Sekretariat des Instituts für Phonetik und Sprachliche Kommunikation, Schellingstraße 3
Hauptseminar
Zeit und Raum: Di. 10-12, Raum 23
Inhalt und Ziel der Veranstaltung
Ziel des Hauptseminars ist es, die aus der Vorlesung "Formale Sprachen" bekannten einfachsten Automatenkonzepte und Automatenalgorithmen zu verallgemeinern und in unterschiedliche Anwendungskontexte zu stellen. Neben den klassischen endlichen Automaten sollen auch n-Band Automaten, Finite State Transducer und Hidden Markov-Modelle vorgestellt werden. Die für klassische Automaten bekannten Verfahren und Konstruktionen (etwa: Elimination von leeren Übergängen, Determinisierung, Produktbildung) sollen entsprechend verallgemeinert werden. Als Anwendungsbereiche werden Pattern Matching, Text- und Dokumentenprocessing, Lexikon, Morphologie und Parsing betrachtet.
Literatur
Voraussetzungen
Gute Kenntnis endlicher Automaten und der zugehörigen Verfahren sowie die Bereitschaft, sich in formale Zusammenhänge einzuarbeiten.
Scheinkriterien
Regelmäßiger Besuch aller Veranstaltungen, Übernahme eines Referats mit schriftlicher Ausarbeitung und/oder Implementierungsaufgaben.
Oberseminar
Zeit und Raum: Do. 12-13, Raum B110
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung werden laufende Projekte im Bereich Lexikon und Grammatik am CIS vorgestellt und besprochen.
Teilnahmebedingungen
persönliche Einladung
Oberseminar
Zeit und Raum: Mo. 10 - 12, Raum Z 1.09
Inhalt und Ziel der Veranstaltung
Erläuterungen am Institut für Informatik unter http://www.pms.informatik.uni-muenchen.de/lehre/oberseminar/
Teilnahmebedingungen
persönliche Einladung
Oberseminar
Zeit und Raum: Di. 16-18, Raum 1.13
Inhalt und Ziel der Veranstaltung
In diesem Oberseminar zunächst eine am CIS entwickelte Systematik zur Organisation von enzyklopädischem Konzepten und Entitäten dargestellt. Im Hauptteil sollen vorgegebene Gebiete allgemeinen Wissens von den Teilnehmnern in die Systematik abgebildet werden. Im weiteren Verlauf werden verwandte Wissensrepräsentationsformalismen im Umfeld des ,,semantischen Webs'' besprochen.
Voraussetzungen
Logikkenntnisse
Teilnahmebedingungen
persönliche Einladung
Scheinkriterien
Ein Schein kann nicht erworben werden.
Arbeitsgemeinschaft
Zeit und Raum: Di. 18-20, Raum 0.43
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung werden wir neue Teilprojekte, die das bestehende CISLEX-System erweitern sollen, besprechen. Nach einer Bestandsaufnahme der aktuellen CISLEX-Datenbank werden neue Komponenten wie Kompositalexika, Multiwortlexeme, prädikative Nomen, Verbesserung des semantischen Kategoriensystems, Junktorenlexikon, usw. behandelt.
Teilnahmebedingungen
Anmeldung beim Dozenten während der Semesterferien ist erforderlich.
Arbeitsgemeinschaft
Zeit und Raum: Do. 10-12, Raum 0.05
Inhalt und Ziel der Veranstaltung
Im Hauptseminar ,,Satzgrammatik'' des WS 2003/04 wurden Grammatikregeln für ein Fragment des Deutschen besprochen und teilweise implementiert. Die Arbeitsgemeinschaft hat zum Ziel, Entwurf und Implementierung von Grammatik und Parser im Detail zu besprechen und gemeinsam weiterzuentwickeln. U.a. ist an folgende Erweiterungen gedacht:
Die Arbeitsgemeinschaft soll auch dazu dienen, die Teilnehmer auf Magisterarbeiten im Bereich der Grammatikimplementierung vorzubereiten.
Voraussetzungen
Prolog-Programmierkenntnisse, Proseminar Syntax oder Hauptseminar Satzgrammatik WS 2003/04
Literatur
Dokumentation der bisherigen Teilgrammatik und Parser
Kolloquium
Zeit und Raum: Fr. 10 -12, Raum 1.35
Inhalt und Ziel der Veranstaltung
Das Kolloquium findet jeweils nach Ankündigung statt. Hier berichten Mitarbeiter des Instituts, Studenten und Gäste über ihre laufenden Arbeiten.
Teilnahmebedingungen
Die Teilnahme am Kolloquium steht jedem offen.
Kolloquium
Zeit und Raum: nach Ankündigung Mi. 18 -20, Schellingstraße
Inhalt und Ziel der Veranstaltung
Gäste des Instituts für Deutsche Philologie halten Vorträge zu sprachwissenschaftlichen Themen.
Teilnahmebedingungen
Die Teilnahme steht jedem offen.