Information Extraction - Seminar (WS 2018-2019)

Summary

Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.

Inhalte:

Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.

Lernziele:

Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.

Here is a link to the Lecture

Instructor

Alexander Fraser

Email Address: SubstituteMyLastName@cis.uni-muenchen.de

CIS, LMU Munich

Tutor: Tobias Eder

Email Address: tobias.eder@in.tum.de

Schedule

There are *two separate seminars*. You EITHER go on Wednesdays, OR you go on Thursdays, NOT BOTH!

Wed: 10:00 c.t., Room U139

Thurs: 10:00 c.t., Room U139

For a LaTeX template for the Hausarbeit, click here.

If this web page does not seem to be up to date, use the refresh button in your browser.

Date Topic Materials

October 17th and October 18th Introduction, Information on Participants

October 24th and October 25th Referat Topics fraser.pdf
hangya.pdf
huck.pdf
stojanovski.pdf

October 31st and November 1st Cancelled (EMNLP and WMT conferences) and holiday

November 7th and November 8th Only office hours - (Nov 7th Lecture will take place!)

November 14th and November 15th First Exercise - in Gobi IE_exercise1.tgz IE_exercise1_notes.txt

December 19th and December 20th Second Exercise - in Gobi IE_exercise2.tar.xz IE_exercise2_notes.txt

February 6th (starting early at 9:30am s.t. ! ) and February 7th Third Exercise - in Gobi IE_exercise3.tar.gz IE_exercise3_notes.txt

WEDNESDAY Referatsthemen (name: topic)

Date Topic Language Materials Hausarbeit Received

21.11 (AF) History of IE EN see Thursday (Möller)

21.11 (AF) Florian Babl: Rule-based vs. Statistical EN slides yes

28.11 (AF) Stefanos Potamianakis: Annotating for NER with Amazon Mechanical Turk DE slides yes

5.12 (MH) Jing Hu: NER E-Commerce DE slides yes

5.12 (MH) Cornelia Dekinger: Biomed NER Deep Learning DE slides yes

12.12 (MH) Wilma Hampl: Rule-based Relation Extraction DE slides yes

12.12 (MH) Phuong-Anh Tran: Relation Extraction Using Dependency Trees DE slides yes

12.12 (MH) Andreas Maier: Relation Extraction and Scoring for Question Answering DE slides yes

19.12 EXERCISE IN GOBI (SEE ABOVE)!

9.1 (DS) Mingfei Cui: Multilingual NER EN slides yes

9.1 (DS) Viktoriia Mokriak: Aspect-based Sentiment EN slides yes

16.1 (DS) Wei Hong: Twitter Sentiment EN slides yes

16.1 (VH) Yi-Chen Liu: Cross-lingual Sentiment EN slides yes

16.1 (VH) Adrian Reitz: Joint aspect and sentiment classification EN slides yes

23.1 (AF) Dorian David: Detecting Social Spambots DE slides yes

23.1 (MH) Olga Melnikova: Automatic Biomed Knowledge Extraction DE slides yes

23.1 (AF) Miriam Rupprecht: Event Extraction - Disasters DE slides yes

30.1 (DS) Elisabeth Busse: Document Event Extraction EN slides yes

30.1 (AF) Simone Glück: Fake News EN slides yes

6.2 at 9:30am (AF) Hanna Razumava: Never-ending Learning (Open IE) DE slides yes

20.02 (AF) Robert Gruber: Fine-Grained Entity Recognition DE slides yes

20.02 (AF) Irina Trefilova: NER Twitter DE slides yes

THURSDAY Referatsthemen (name: topic)

Date Topic Language Materials Hausarbeit Received

22.11 (AF) Yannic Möller: History of IE EN slides yes

22.11 (AF) Son Tien Nguyen: Rule-based vs. Statistical EN slides yes

29.11 (AF) Olesia Melnychuk: NER Twitter DE slides yes

29.11 (MH) Angelina Koltsova: NER E-Commerce DE slides yes

29.11 (AF) Behzat Cinar: Entity Linking in the Digital Humanities DE slides yes

6.12 (MH) Valiantsina Vauraniuk: Relation Extraction and Scoring for Question Answering DE slides yes

6.12 (AF) Marika Rionidze: Event Extraction - Disasters DE slides yes

13.12 (DS) Korbinian Schmidhuber: Multilingual NER EN slides yes

13.12 (MH) Erik Weber: Biomed NER Deep Learning EN slides yes

13.12 (VH) Daniel Teplan: Parallel Sentence Extraction - BUCC Shared Task EN slides yes

20.12 EXERCISE IN GOBI (SEE ABOVE)!

10.1 (VH) Johanna Strebl: Parallel Sentence Extraction - Sentence Representation EN slides yes

10.1 (DS) Leopold Martin: Twitter Sentiment EN slides yes

17.1 (VH) Andreas Wassermayr: Cross-lingual Sentiment EN slides yes

17.1 (VH) Dominik Braun: Joint aspect and sentiment classification EN slides yes

17.1 (VH) Manuel Pleier: Abstractive Neural Text Summarization EN slides yes

24.1 (DS) Manja Faulhaber: Document Event Extraction EN slides yes

24.1 (DS) Tianqi Bao: Coreference EN slides yes

24.1 (VH) Ario Cecchettini: Document Classification with Hierarchical Attention EN slides yes

31.1 (AF) Mischan Malek: IE from Audio EN slides yes

31.1 (AF) Jakob Jungmaier: Incomplete Knowledge Bases EN slides yes

31.1 (AF) Leah Michel: Fake News EN slides yes

Date	Topic	Materials
October 17th and October 18th	Introduction, Information on Participants
October 24th and October 25th	Referat Topics	fraser.pdf hangya.pdf huck.pdf stojanovski.pdf
October 31st and November 1st	Cancelled (EMNLP and WMT conferences) and holiday
November 7th and November 8th	Only office hours - (Nov 7th Lecture will take place!)
November 14th and November 15th	First Exercise - in Gobi	IE_exercise1.tgz IE_exercise1_notes.txt
December 19th and December 20th	Second Exercise - in Gobi	IE_exercise2.tar.xz IE_exercise2_notes.txt
February 6th (starting early at 9:30am s.t. ! ) and February 7th	Third Exercise - in Gobi	IE_exercise3.tar.gz IE_exercise3_notes.txt

Date	Topic	Language	Materials	Hausarbeit Received
21.11	(AF) History of IE	EN	see Thursday (Möller)
21.11	(AF) Florian Babl: Rule-based vs. Statistical	EN	slides	yes
28.11	(AF) Stefanos Potamianakis: Annotating for NER with Amazon Mechanical Turk	DE	slides	yes
5.12	(MH) Jing Hu: NER E-Commerce	DE	slides	yes
5.12	(MH) Cornelia Dekinger: Biomed NER Deep Learning	DE	slides	yes
12.12	(MH) Wilma Hampl: Rule-based Relation Extraction	DE	slides	yes
12.12	(MH) Phuong-Anh Tran: Relation Extraction Using Dependency Trees	DE	slides	yes
12.12	(MH) Andreas Maier: Relation Extraction and Scoring for Question Answering	DE	slides	yes
19.12	EXERCISE IN GOBI (SEE ABOVE)!
9.1	(DS) Mingfei Cui: Multilingual NER	EN	slides	yes
9.1	(DS) Viktoriia Mokriak: Aspect-based Sentiment	EN	slides	yes
16.1	(DS) Wei Hong: Twitter Sentiment	EN	slides	yes
16.1	(VH) Yi-Chen Liu: Cross-lingual Sentiment	EN	slides	yes
16.1	(VH) Adrian Reitz: Joint aspect and sentiment classification	EN	slides	yes
23.1	(AF) Dorian David: Detecting Social Spambots	DE	slides	yes
23.1	(MH) Olga Melnikova: Automatic Biomed Knowledge Extraction	DE	slides	yes
23.1	(AF) Miriam Rupprecht: Event Extraction - Disasters	DE	slides	yes
30.1	(DS) Elisabeth Busse: Document Event Extraction	EN	slides	yes
30.1	(AF) Simone Glück: Fake News	EN	slides	yes
6.2 at 9:30am	(AF) Hanna Razumava: Never-ending Learning (Open IE)	DE	slides	yes
20.02	(AF) Robert Gruber: Fine-Grained Entity Recognition	DE	slides	yes
20.02	(AF) Irina Trefilova: NER Twitter	DE	slides	yes