Statistische Methoden in der Sprachverarbeitung
Wintersemester 2024/25
Dozent: Helmut Schmid



  Termine
    VorlesungMontag12:00 - 14:00 Uhr c.t. Hörsaal BU101
    ÜbungenMontag14:00 - 16:00 Uhr c.t. Raum U151
    RepetitoriumDienstag12:00 - 14:00 Uhr c.t. Raum C003 ab der 2. Vorlesungswoche
    TutoriumMontag9:00 - 10:30Zoom ab der 3. Vorlesungswoche


  Inhalt der Vorlesung

    Das Seminar bietet eine Einführung in wichtige Methoden und Modelle der statistischen maschinellen Sprachverarbeitung und ihre Anwendungen.
    Behandelt werden die Themen:
    • statistische Tests und Kollokationsextraktion
    • Markowmodelle und Sprachidentifizierer
    • Naive Bayes und Wortbedeutungsdesambiguierung
    • Hidden-Markov-Modelle und Wortartannotierung
    • Probabilistische kontextfreie Grammatiken und Parsebaum-Desambiguierung
    • Perzeptron-Algorithmus
    • Conditional Random Fields

  Übungsaufgaben
  Begleitmaterial zur Vorlesung
  Weiterführende Literatur
  • Chris Manning und Hinrich Schütze: Foundations of Statistical Natural Language Processing, MIT Press
  • Daniel Jurafsky and James Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall

  Prüfungstermine
    Übung:  27. Januar 2024, 12 Uhr c.t., im Hörsaal BU101
    Vorlesung:  3. Februar 2024, 12 Uhr c.t., im Hörsaal BU101

    Bei den Prüfungen sind keine Hilfsmittel erlaubt.

    Die Vorlesungsklausur wird eine mehrteilige Aufgabe mit 10 von 30 Punkten umfassen, die sich an diesem Beispiel orientiert.

    Wiederholungstermine

    Vorlesung:  25 März 2025, 10:15 Uhr, im Hörsaal B106 (Hauptgebäude)
    Übung:  26 März 2025, 10:15 Uhr, im Hörsaal B106 (Hauptgebäude)

Centrum für Informations- und Sprachverarbeitung (CIS)