Dieser Workshop war Teil des CLARIN-D Projekts "Ausbau und Erweiterung eines Open-Source-Tools zur Nachkorrektur historischer OCR-erfasster Texte" (CLARIN-DE-FAG4-KP3, Laufzeit April 2015 - März 2016) und ist mit Ende März 2016 abgeschlossen. Diese Seite ist daher historisch und wird nicht mehr aktualisiert.
Der Abschlussbericht ist hier einsehbar.
Der aktuelle Projektstand ist auf Github unter CIS OCR Group verfügbar.
Referenz:
Uwe Springmann & Florian Fink (2016). CIS OCR Workshop v1.0: OCR and postcorrection of early printings for digital humanities. Zenodo. 10.5281/zenodo.46571
Monday 2015-09-14 10h to Tuesday 2015-09-15 17h
Hauptgebäude der Ludwig-Maximilians-Universität München, Geschwister-Scholl-Platz 1, 80539 München, Hörsaal A022
Monday, 2015-09-14 | Tuesday, 2015-09-15 | ||
---|---|---|---|
10:00-10:20 | Welcome, overview | 09:00-10:00 | M7: Tesseract: Practice |
10:20-11:00 | M1: Challenges & methods | 10:00-11:00 | M8: Abbyy Finereader: Practice |
11:00-11:30 | M2: Image acquisition & preprocessing | 11:00-12:00 | M9: The CIS error profiling technology |
11:30-12:00 | M3: Preprocessing: Practice | ||
12:00-13:30 | Lunch time | 12:00-13:30 | Lunch time |
13:30-14:30 | M4: How to transform incunabula: Theory | 13:30-14:30 | M10: PoCoTo: Theory |
14:30-15:00 | Break | 14:30-15:00 | Break |
15:00-16:00 | M5: How to transform incunabula: Practice | 15:00-16:00 | M11: PoCoTo: Practice |
16:00-16:30 | M6: Other OCR engines: Tesseract, ABBYY | 16:00-16:15 | Feedback & discussion |
16:30-17:00 | Wrap-up: day 1 | 16:15-16:30 | Wrap-up |
18:30- ?? | Dinner, evening sessions ad lib. |
Software to install on your laptop before the workshop to enable an active participation in the practice sessions
You can browse and download the presentation slides, manuals, and data needed for the practice sessions here.