Centrum für Informations- und Sprachverarbeitung
print


Breadcrumb Navigation


Content

Computerlinguistik als Studienfach

Die Computerlinguistik ist die Wissenschaft rund um die maschinelle Verarbeitung natürlicher Sprachen. Ihre Methoden durchziehen heute fast alle Bereiche unserer digitalen Welt, von Textverarbeitung und Rechtschreibkorrektur über Spracherkennung, Websuchen und Informationsextraktion bis hin zur maschinellen Übersetzung, Bedeutungsanalyse und künstlichen Intelligenz. Das moderne Internet, Suchmaschinen, Smartphones und jede Art von textverarbeitender Technologie wären ohne die Erkenntnisse dieser jungen Wissenschaft undenkbar.

Woher kommt sie?

Als eigenständige Forschungsrichtung schlug die Computerlinguistik erstmals in den sechziger Jahren eine Brücke zwischen der Linguistik, der Mathematik und der Informatik. In folgenden Jahrzehnten entwickelte sich die computerlinguistische Forschung zu einem zentralen Bestandteil zahlreicher wissenschaftlicher Disziplinen, die sich mit der Implementierung von sprachlicher Intelligenz in Maschinen befassen.

Mit der Gründung des Centrums für Informations- und Sprachverarbeitung (CIS) im Jahr 1987 fasste die Computerlinguistik auch an der Ludwig-Maximilians-Universität in München Fuß. Durch innovative Forschungen und ihren verschiedensten Teildisziplinen hat sich das Institut als eine der führenden Einrichtungen in Deutschland etabliert.

Was bietet sie?

Wer lernen will, wie unterschiedlichste geisteswissenschaftliche und technische Disziplinen produktiv miteinander verbunden werden können, findet in der Computerlinguistik ein ideales Forschungsfeld vor. Die effiziente Kombination von Theorie und Praxis ist einer der Grundsätze, die am CIS besonders hoch gehalten werden.

Der fachübergreifende Geist setzt sich auch in der Zeit nach dem Studium fort. Absolventen des CIS erwartet ein Arbeitsbereich, der sich mit der Weiterentwicklung der Informationstechnologie stetig ausdehnt und vor allem auffächert. Der wachsende Bedarf nach intelligenter Software zur Interaktion zwischen Mensch und Maschine verlangt nach interdisziplinär versierten Akademikern, die für die Lösung von Problemen der Sprachverarbeitung verschiedene technische und geisteswissenschaftliche Aspekte ihres Studiums kreativ verknüpfen können. Computerlinguisten machen sich in der freien Wirtschaft einen Namen als Sprachtechniker oder Softwareentwickler.

Auch in der Wissenschaft stehen den Absolventen verschiedene Wege offen, entweder an einem dedizierten computerlinguistischen Institut oder als innovativer Quereinsteiger in einem der Fächer, die ursprünglich als Ausgangswissenschaften der Computerlinguistik dienten.

Was bietet das CIS?

Der Bachelor-Studiengang besteht aus sechs Semestern, in denen alle Grundlagen und eine sorgfältige Auswahl an fortgeschrittenen Themen des Fachs vermittelt werden.

Das erste Semester besteht aus einer Einführung in die Programmierung und die Sprachwissenschaft. Die Studenten lernen die Grundkonzepte der Programmierung anhand der Programmiersprache Python und kommen bereits mit ersten praktischen Anwendungen und grundlegender Textverarbeitung in Kontakt. Dazu wird ein Überblick über die linguistischen Grundbegriffe und Ideen gegeben, die sie während des weiteren Studiums begleiten werden.

Im zweiten Semester erhalten die Studenten einen Einblick in die Wortformenlehre (bzw. Morphologie) nebst praktischen Anwendungen in der fortgeschrittenen Programmierung in C++. Zusätzlich werden mathematisch-logische Grundlagen vermittelt, die für die weiteren Kurse essentiell sind.

Das dritte Semester führt die Dreiheit aus Linguistik, Informatik und Mathematik auf die nächste Stufe. In der Satzlehre (oder Syntax) werden die wichtigsten grammatischen Theorien präsentiert, parallel zu einer Vertiefung der Sprache Python und dem objektorientierten Programmierparadigma. Die Studenten implementieren auf der Basis der Natural-Language-Toolkit-Bibliothek (NLTK) erste Anwendungen zur Lösung konkreter computerlinguistischer Probleme. Aufbauend auf den mathematischen Grundlagen lernen die Studenten außerdem die Prinzipien formaler Sprachen kennen.

Das vierte Semester teilt sich auf in die Fortsetzung logischer Ansätze im Kontext der Satzbedeutung (bzw. Semantik) und der fortgeschrittenen Programmierung in Python. Im Fokus stehen hier Methoden des maschinellen Lernens, die in vielen Bereichen der Sprachverarbeitung eingesetzt werden, wie in der Korpuslinguistik, dem Text Mining und der maschinellen Übersetzung.

Im fünften Semester findet eine systematische Einführung in Theorie und Praxis des maschinellen Lernens in der Sprachverarbeitung statt. Insbesondere werden stochastische Verfahren zur Wortartendisambiguierung und robuste Schätzverfahren für die Parameter statistischer Modelle behandelt, die in Anwendungen wie Spracherkennung oder maschineller Übersetzung zum Tragen kommen. Parallel dazu stellt die Vorlesung Informationsextraktion die wichtigsten Methoden vor, mit denen strukturierte Information aus Textdokumenten gewonnen werden kann.

Im letzten Semester des Bachelorstudiums erlernen die Studenten schließlich die Grundlagen von Suchmaschinen (bzw. Information-Retrieval-Systeme) sowie verschiedener praktischer Anwendungen im Rahmen fortgeschrittener computerlinguistischer Programmierung.