Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.
Inhalte:
Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.
Lernziele:
Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.
Here is a link to the Lecture
Email Address: SubstituteMyLastName@cis.uni-muenchen.de
Tutor: Fabian Dreer
Email Address: SubstituteFabiansLastName@cip.ifi.lmu.de
There are *two separate seminars*. You EITHER go on Wednesdays, OR you go on Thursdays, NOT BOTH!
Wed: 12:00 c.t., Room L155
Thurs: 10:00 c.t., Room U127
IMPORTANT: Class is in *Gobi computer lab* on December 2nd and 3rd!
If this web page does not seem to be up to date, use the refresh button in your browser.
Date | Topic | Materials |
October 15th and October 21st | Information on Participants, Ungraded/Anonymous Quiz | |
October 22nd and October 28th | Referatsthemen presentation, with registration for topics October 29th at 19:00 by email | pptx pdf |
October 29th and November 4th | Practical Exercise (Manual Rules) *** in Gobi *** | tar.gz (See included slides) |
December 2nd and December 3rd | Machine Learning Exercise *** in Gobi *** | tar.gz (See included slides) |
February 3rd and February 4th | Machine Learning Exercise on Sequences *** in Kalahari (NOT Gobi!) *** | tar.gz (See included slides) |
WESNESDAY Referatsthemen (name: topic)
Date | Topic | Materials | Hausarbeit Received |
November 11th | Beilmann: Focused Web Crawling | slides | yes |
November 11th | Papadatos: Fine-grained NER classes | slides | yes |
November 18th | Vila Leiva: Distant Supervision for NER | slides | yes |
November 25th | Maier: NER Amazon Mechanical Turk | slides | yes |
November 25th | Zap: Domain Adaptation | slides | yes |
December 9th | Fuchs: NER Twitter | slides | yes |
December 9th | Pelyak: Stanford NER Pipeline | slides | yes |
December 16th | Ullrich: OpenNLP NER Pipeline | slides | yes |
December 16th | Preißner: Coreference (Literature) | slides | yes |
December 23rd | Akhaladze: Disasters in Social | slides | yes |
December 23rd | Greth: IE Epidemics | slides | yes |
January 13th | CANCELLED (by presenters) | ||
January 20th | Göze: Multilingual | slides | yes |
January 20th | Kellner: Summarization | slides | yes |
THURSDAY Referatsthemen (name: topic)
Date | Topic | Materials | Hausarbeit Received |
November 5th | Baatarkhuu: History of IE | slides | yes |
November 5th | Bilan: Web Scraping, a Practical Example | slides | yes |
November 19th | Plötz: Fine-grained NER classes | slides | yes |
November 19th | Braß: Distant Supervision for NER | slides | yes |
November 26th | Mironova: Rule-based IE vs. Statistical | slides | yes |
November 26th | Glazkova: NER Amazon Mechanical Turk | slides | yes |
December 10th | Jacob: Domain Adaptation | slides | yes |
December 10th | Falkner: NER Twitter | slides | yes |
December 17th | Pham: NER Bio | slides | yes |
January 14th | Ivshina: IE Epidemics | slides | yes |
January 14th | Taranenko: IE multilingual applications | slides | yes |
January 21st | Markovych: Stanford Coref Pipeline | slides | yes |
January 21st | Schick: Disasters in Social | slides | yes |