Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.
Inhalte:
Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.
Lernziele:
Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.
Here is a link to the Lecture
Email Address: SubstituteMyLastName@cis.uni-muenchen.de
There are *two separate seminars*. You EITHER go on Wednesdays, OR you go on Thursdays, NOT BOTH!
Wed: 10:00 c.t., ZOOM ONLINE (was previously 061)
Thurs: 10:00 c.t., ZOOM ONLINE (was previously changed to 061)
For a LaTeX template for the Hausarbeit, click here.
If this web page does not seem to be up to date, use the refresh button in your browser.
Date | Topic | Materials |
November 3rd | Referat Topics |
Alexander Fraser Viktor Hangya Jindrich Libovicky Katharina Hämmerl Alexandra Chronopoulou (slides) Alexandra Chronopoulou (video) |
November 10th and 11th | Exercise: CMU Seminars (Annotation and Manual Rules) | IE_1_example1.txt IE_1_example2.txt IE_1_annotate.txt IE_exercise1.tar.xz IE_exercise1_README.txt Best F1 so far in WS21: 41% |
November 17th and 18th | Sentiment Analysis and a few comments on the Referat |
sentiment Referat |
December 15th and January 27th | Sentiment Analysis Part 2 | sentiment part 2 |
WEDNESDAY Referatsthemen (name: topic)
Date | Topic | Language | Materials | Hausarbeit Received |
November 24th | Kateryna Hamii, Iana Makhonina, Daniil Kirillov: Toxic Span Detection (VH) | EN | yes//yes | |
December 1st | Serif Hamzic, Monica Riedler, Nina Schmierer: Fake Reviews (JL) | EN | yes/yes/yes | |
December 8th | Sophie Schuhbauer, Anna Pably: Bias in Toxic Language (AC) | EN | yes/yes | |
December 15th | (See above) | |||
January 12th | -, Van Nguyen: Song Lyric Segmentation (KH) | DE | yes/yes | |
January 19th | Lazaros Koutsianos, Yusuf Arigboga, Ioannis Partalas: Open IE (AF) | EN | yes/yes/yes | |
January 26th | Fabian Woll, Lucia Guerrero, Jonas Engesser: Language Models as Domain Experts (AC) | EN | yes/yes/yes | |
February 2nd | Office Hours |
THURSDAY Referatsthemen (name: topic)
Date | Topic | Language | Materials | Hausarbeit Received |
November 25th | Annika Haase, Julius Kroiß, Tatiana Shulga: History of IE (AF) | EN | yes/yes/yes | |
December 2nd | Clara Görlach, Karen Luna, Sebastian Loftus: Multilingual NER (JL) | EN | yes/yes/yes | |
December 9th | Shuqi Wang, Anna Masiuta, and Marko Bierlich: Depressions in Online Forums (JL) | EN | yes/yes/yes | |
December 16th | Martin Ivanov, Tatev Gevorgyan, Rukiye Duran: Human-in-the-loop IE (KH) | DE | yes/yes/yes | |
January 13th | Antoaneta Mihaljevich, Stefan Volk, Barbara Kovacic: IE from Code-switched Data (VH) | EN | yes//yes | |
January 20th | Lea Hirlimann, Xaver Krückl, Simon Stürzebecher: Creating Training Data with Weak Supervision (AF) | EN | yes/yes/yes | |
January 27th | (see above) | |||
February 3rd | Office Hours |