3.10. Die Seitensegmentierung der Faksimile innerhalb der WAST-Tools¶
Teilprojekte:
- 3.10.1. Optical Character Recognition (OCR): Begleitblatt und Aufgabenstellung
- 3.10.1.1. Softwaretechnologien und computerlinguistische Methoden der Software-Infrastruktur um die FinderApp WiTTFind
- 3.10.1.2. Florian Landes, Marcel Eisterhues
- 3.10.1.3. Was ist OCR?
- 3.10.1.4. Anwendung von OCR in WiTTFind
- 3.10.1.5. Aufgabe im Workshop: Texterkennung von Beispielbildern mit Tesseract
- 3.10.2. OCR bei WiTTFind: Überblick und Einführung
- 3.10.2.1. Daria Pigasova, Fabian Drach, Florian Landes, Marcel Eisterhues
- 3.10.2.1.1. Dokumentation des aktuellen Ist-Zustands
- 3.10.2.1.2. Ziel
- 3.10.2.1.3. Datenvorbereitung
- 3.10.2.1.4. Initialisierung
- 3.10.2.1.5. Seitendurchlauf
- 3.10.2.1.6. Binarisierung
- 3.10.2.1.7. Texterkennung
- 3.10.2.1.8. Hervorhebung
- 3.10.2.1.9. Koordinatenbestimmung
- 3.10.2.1.10. HTML-Tag-Integration
- 3.10.2.1. Daria Pigasova, Fabian Drach, Florian Landes, Marcel Eisterhues