Wittfind-Docs

Inhaltsangabe

  • 1. Das Projekt Wittgenstein Advanced Search Tools (WAST)
  • 2. Edition des Nachlasses von Ludwig Wittgenstein
  • 3. Wittgenstein Advanced Search Tools (WAST)
    • 3.1. Einführung
    • 3.2. Infrastruktur der WAST
    • 3.3. Docker für die WAST-Tools
    • 3.4. Wittgensteins Lexikon
    • 3.5. Doppelseitger Reader
    • 3.6. Symmetrische Autovervollständigung sis:
    • 3.7. FinderApp Wittfind: wf
    • 3.8. Frontend: Wittfind-Web
    • 3.9. Ähnlichkeitssuche mit NLP Tools
    • 3.10. Seitensegmentierung der Faksimile mit OCR
      • 3.10.1. Optical Character Recognition (OCR): Begleitblatt und Aufgabenstellung
      • 3.10.2. OCR bei WiTTFind: Überblick und Einführung
  • 4. Workshop DHD 2020 in Paderborn
  • 5. Tutorials
  • 6. Aufgaben zu WAST
Wittfind-Docs
  • Docs »
  • 3. Die Wittgenstein Advanced Search Tools »
  • 3.10. Die Seitensegmentierung der Faksimile innerhalb der WAST-Tools
  • View page source

3.10. Die Seitensegmentierung der Faksimile innerhalb der WAST-Tools¶

Teilprojekte:

  • 3.10.1. Optical Character Recognition (OCR): Begleitblatt und Aufgabenstellung
    • 3.10.1.1. Softwaretechnologien und computerlinguistische Methoden der Software-Infrastruktur um die FinderApp WiTTFind
    • 3.10.1.2. Florian Landes, Marcel Eisterhues
    • 3.10.1.3. Was ist OCR?
    • 3.10.1.4. Anwendung von OCR in WiTTFind
    • 3.10.1.5. Aufgabe im Workshop: Texterkennung von Beispielbildern mit Tesseract
      • 3.10.1.5.1. Vorbereitung
      • 3.10.1.5.2. Docker starten
      • 3.10.1.5.3. Aufgabe: Texterkennung von Typoskripten mit Tesseract
      • 3.10.1.5.4. Zusatzaufgabe: Erkennung von handgeschriebenen Texten
  • 3.10.2. OCR bei WiTTFind: Überblick und Einführung
    • 3.10.2.1. Daria Pigasova, Fabian Drach, Florian Landes, Marcel Eisterhues
      • 3.10.2.1.1. Dokumentation des aktuellen Ist-Zustands
      • 3.10.2.1.2. Ziel
      • 3.10.2.1.3. Datenvorbereitung
      • 3.10.2.1.4. Initialisierung
      • 3.10.2.1.5. Seitendurchlauf
      • 3.10.2.1.6. Binarisierung
      • 3.10.2.1.7. Texterkennung
      • 3.10.2.1.8. Hervorhebung
      • 3.10.2.1.9. Koordinatenbestimmung
      • 3.10.2.1.10. HTML-Tag-Integration
Next Previous

© Copyright 2019, Centrum für Informationsverarbeitung, Max Hadersbeck et.al

Built with Sphinx using a theme provided by Read the Docs.