Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.
Inhalte:
Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.
Lernziele:
Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.
Here is a link to the Lecture
Email Address: SubstituteMyLastName@cis.uni-muenchen.de
Tutor: Tobias Eder
Email Address: tobias.eder@in.tum.de
There are *two separate seminars*. You EITHER go on Mondays, OR you go on Thursdays, NOT BOTH!
Mon: 16:00 c.t., Room 061
Thurs: 10:00 c.t., Room 061
For a LaTeX template for the Hausarbeit, click here.
If this web page does not seem to be up to date, use the refresh button in your browser.
Date | Topic | Materials |
October 14th and October 17th | Introduction, Information on Participants | |
October 21st and October 24th | Referat Topics |
Alexander Fraser Viktor Hangya Simon Riess Matthias Huck Jindrich Libovicky Dario Stojanovski Alexandra Chronopoulou |
October 28th and October 31st | Cancelled (Vorlesung on October 30th is not cancelled!) | |
November 4th and November 7th | First Exercise (in Gobi) | IE_exercise1.tar.xz IE_exercise1_notes.txt |
December 2nd and December 5th | Second Exercise (in Gobi) | IE_exercise2.tgz |
February 3rd and February 6th (Feb 6th starting early at 9:45am!) | Third Exercise (in Gobi) | IE_exercise3.tar.gz |
MONDAY Referatsthemen (name: topic)
Date | Topic | Language | Materials | Hausarbeit Received |
11.11 | (AF) Gege Ruan: NER for Twitter | EN | ||
11.11 | (VH) Kateryna Chernysh: IE from CVs | EN | ||
18.11 | (MH) Sahar Zahidi: Structural Segmentation of Email | EN | ||
18.11 | (MH) Luise Schulz: Automatic Intent Identification in Emails | EN | ||
18.11 | (AC) Suteera Seeha: Named Entity Recognition using Joint Word- and Character-level Embeddings | EN | ||
25.11 | (SR) Claudia Müller: QA Systems | DE | ||
25.11 | (SR) Dianora Herashchenko: Hate Speech Detection | DE | ||
25.11 | (SR) Markus Pfaffl: Propaganda Detection | DE | ||
09.12 | (VH) Mochamet Machmout: User Opinion Extraction | EN | ||
09.12 | (JL) Huy Nguyen: Word attributes from large amount of text | EN | ||
09.12 | (JL) Laura Lehmann: Depression and Self-Harm Risk Assessment in Online Forums | EN | ||
16.12 | (DS) Haotian Ye: Cross-lingual NER | EN | ||
16.12 | (DS) Paulina Zahlbaum: Hyperpartisan News Detection | EN | ||
16.12 | (JL) Alina Fastowski: Extractive and Abstractive Text Summarization | EN | ||
13.01 | (JL) Nadja Seeberg: Fake Reviews Detection | EN | ||
13.01 | (AC) Jessica Schleiermacher: Relation extraction from clinical texts | EN | ||
20.01 | (DS) Thang Pham: Automatically Labeled Data for Event Extraction | EN | ||
20.01 | (AC) Andrej Vershynin: Event Detection using Recurrent Neural Networks | EN | ||
27.01 | (MH) Halyna Tonkoshkura: Semantic Role Labeling | DE | ||
27.01 | (MH) Natalia Amelina: Neural Open IE | DE | ||
06.02 um 9:45 s.t. | (AF) Khanh-Van Zenz: Chatbots | DE |
THURSDAY Referatsthemen (name: topic)
Date | Topic | Language | Materials | Hausarbeit Received |
14.11 | (AF) Alexandru Porfir: History of IE | EN | ||
14.11 | (AF) Vlora Murselji: Rule-based vs. Statistical | EN | ||
14.11 | (AF) Leonard Kassow: NER German | EN | ||
21.11 | (VH) Julia Eppler: IE from CVs | EN | ||
21.11 | (SR) Sinem Demiraslan: Question Generation | EN | ||
28.11 | (AF) Anna Pugina: NER for Twitter | DE | ||
28.11 | (SR) Merve Erkoc: QA systems | DE | ||
28.11 | (SR) Marcella Valente: Hate Speech Detection | DE | ||
12.12 | (SR) Benno Krojer: Fake News Detection | EN | ||
12.12 | (AC) Aylin Dedek: Fake News - FEVER | EN | ||
19.12 | (MH) Dominik Kisiala: Event Historical | DE | ||
19.12 | (MH) Olha Syplyvets: Semantic Role Labeling | DE | ||
09.01 | (AF) Laurin Gerhardt: Coreference | EN | ||
09.01 | (VH) Thomas Grieb: Clinical Temporal Relation Extraction with Neural Networks | EN | ||
16.01 | (JL) Anna Kohler: Word attributes from large amount of text | EN | ||
16.01 | (JL) Nam Hoang: Unsupervised Text Summarization | EN | ||
16.01 | (MH) Leonhard Wabro: Automatic Intent Identification in Emails | EN | ||
21.01 at 11:00 s.t. in C105 | (AC) Michael Anzer: Event Detection using RNNs | EN | ||
23.01 | (AF) Frank Pöhlmann: Disaster Events in Social Media | EN | ||
23.01 | (AF) Ann-Kathrin Fochler: Creating Training Data with Weak Supervision for Relation Extraction | EN | ||
23.01 | (JL) Andrea Augustin: Fake Reviews Detection | EN |