VIRTUELLE FACHBIBLIOTHEK GERMANISTIK Germanistik im Netz Logo

Wer-Was-Wo - Detailanzeige

Ergebnisanzeige "Umfrage zur Verwendung von OCR-Text im Rahmen von OCR-D"
RessourcentypAußer der Reihe
TitelUmfrage zur Verwendung von OCR-Text im Rahmen von OCR-D
BeschreibungDas DFG-Koordinierungsprojekt OCR-D (www.ocr-d.de) ist auf die Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) für historische Drucke ausgerichtet. An diesem Vorhaben beteiligen sich die Herzog August Bibliothek Wolfenbüttel, die Bayerische Staatsbibliothek sowie die Berlin-Brandenburgische Akademie der Wissenschaften, im Besonderen das Deutsche Textarchiv (DTA) in Berlin.
Arbeitsschwerpunkte sind u.a. Standards, Verfahren zur Optimierung der Bilddigitalisate, Analyse vorhandener Tools und Workflows, Verfahren zur Nachkorrektur und Qualitätssicherung. Im Mittelpunkt stehen auch Langzeitverfügbarkeit und Persistenz des zu gewinnenden Textmaterials. Dabei stellen sich besondere Herausforderungen. Denn Text, der mittels OCR-Techniken erkannt wird, ist Veränderungen ausgesetzt. Im überwiegenden Fall handelt es sich dabei um Korrekturen. Diese erfolgen durch:
- automatische bzw. halbautomatische Nachkorrektur mittels Sprachmodellen, historischen Wörterbüchern etc.
- intellektuelle Nachkorrektur, z. B. durch Crowdsourcing
- Neuprozessierungen: Eine Weiterentwicklung und Verbesserung der OCR-Techniken lassen eine erneute Texterkennung eines bereits erkannten Textes sinnvoll erscheinen
Wissenschaftliche Arbeitsergebnisse, die auf der Auswertung umfangreicherer, maschinell gewonnener Texte und Textkorpora beruhen, würden ohne Archivierung der verwendeten Zustände, ihre Nachweisgrundlage verlieren und nicht mehr nachvollzogen werden können.
In diesem Zusammenhang möchten wir Nutzer/innen unterschiedlichster Disziplinen über die Bedeutung von OCR-Text und dessen Archivierung für die eigene Forschung befragen. Wir würden uns freuen, wenn Sie sich 3 Minuten Zeit nähmen, um die folgenden neun Fragen zu beantworten: http://www.ocr-d.de/?q=node/7

Mit freundlichen Grüßen

Sebastian Mangold
für das DFG-Koordinierungsprojekt zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR)
Quelle der BeschreibungInformation des Anbieters
Internetadressehttp://www.ocr-d.de/?q=node/7
PersonName: Mangold, Sebastian 
Funktion: Projektmitarbeiter 
E-Mail: sebastian.mangold@bsb-muenchen.de 
KontaktdatenName/Institution: Bayerische Staatsbibliothek 
Strasse/Postfach: Ludwigstraße 16 
Postleitzahl: 80539 
Stadt: München 
Internetadresse: http://www.bsb-muenchen.de; www.ocr-d.de 
LandDeutschland
BenutzerführungDeutsch
Zusätzliches SuchwortOCR, Optical Character Recognition, Texterkennung, VD16, VD17, VD18, Langzeitarchivierung, Persistenz
Ediert von  H-Germanistik
Ein Angebot vonGermanistik im Netz
URL dieses Wer-Was-Wo-Datensatzeshttp://www.germanistik-im-netz.de/wer-was-wo/54155

© Virtuelle Fachbibliothek Germanistik | Letzte Änderung 28.04.2016 | Impressum | Intern