Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen (ePub)
Auf Grundlage der n-Gramm Häufigkeitstabellen von Wolfgang Schönpflug
Studienarbeit aus dem Jahr 2010 im Fachbereich Informatik - Internet, neue Technologien, Note: 2,0, Universität zu Köln (Sprachliche Informationsverarbeitung), Veranstaltung: Angewandte Linguistische Datenverarbeitung, Sprache: Deutsch, Abstract: Die...
Leider schon ausverkauft
eBook (ePub)
- Lastschrift, Kreditkarte, Paypal, Rechnung
- Kostenloser tolino webreader
Produktdetails
Produktinformationen zu „Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen (ePub)“
Studienarbeit aus dem Jahr 2010 im Fachbereich Informatik - Internet, neue Technologien, Note: 2,0, Universität zu Köln (Sprachliche Informationsverarbeitung), Veranstaltung: Angewandte Linguistische Datenverarbeitung, Sprache: Deutsch, Abstract: Die vorliegende Verschriftlichung ist eine Hauptseminararbeit für die Lehrveranstaltung "Angewandte linguistische Datenverarbeitung" und beschäftigt sich mit den Erkennungsfehlern, die während einer Texterkennung (OCR) entstehen können. Solche Fehler können die Unterschlagung einiger Buchstaben innerhalb eines Wortes, die falsche Reihenfolge der Zeichen in einer Zeichenkette oder solche sein, die den Sinn des Satzes durch Fehlinformationen entstellen. In der Texterkennungstechnik werden heutzutage mehrere Methoden und Verfahren angewendet, um diesen Problemen entgegenzuwirken, die sich in ihrer Effizienz, Schnelligkeit, Korrektheit und Bedienerfreundlichkeit stark unterscheiden. Diese Arbeit wird sich deshalb nur auf den statistikbasierten Lösungsansatz wenden, dessen Grundlage die aufgestellten Mono-, Di-, Tri- und n-Gramm Tabellen von Wolfgang Schönpflug bilden. Es wird erst auf die typischen OCR-Fehler und ihre Ursachen eingegangen, um danach die Häufigkeitstabellen von Wolfgang Schönpflug auf ihren Aufbau hin zu analysieren. In Kapitel 2 geht es um den Lösungsansatz mit den Häufigkeitstabellen, ihre Implementierung, Form der Darstellung und Vorgehensweise. Die Diskussion über eine Internationalisierung des Verfahrens und die mögliche Erweiterbarkeit schließt die Arbeit ab.
Zur Lektüre werden zur leichten Verständlichkeit Grundkenntnisse in der Programmiersprache Java und ihren Funktionen vorausgesetzt. Die Überlegungen für bestimmte Lösungsrealisierungen nehmen Bezug auf einige Java-spezifische Datenstrukturen und in Java bekannten Algorithmen.
Zur Lektüre werden zur leichten Verständlichkeit Grundkenntnisse in der Programmiersprache Java und ihren Funktionen vorausgesetzt. Die Überlegungen für bestimmte Lösungsrealisierungen nehmen Bezug auf einige Java-spezifische Datenstrukturen und in Java bekannten Algorithmen.
Bibliographische Angaben
- Autor: Bilal Erkin
- 2010, 1. Auflage, 15 Seiten, Deutsch
- Verlag: GRIN Verlag
- ISBN-10: 3640731298
- ISBN-13: 9783640731299
- Erscheinungsdatum: 21.10.2010
Abhängig von Bildschirmgröße und eingestellter Schriftgröße kann die Seitenzahl auf Ihrem Lesegerät variieren.
eBook Informationen
- Dateiformat: ePub
- Größe: 0.43 MB
- Ohne Kopierschutz
- Vorlesefunktion
Kommentar zu "Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen"
0 Gebrauchte Artikel zu „Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen“
Zustand | Preis | Porto | Zahlung | Verkäufer | Rating |
---|
Schreiben Sie einen Kommentar zu "Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen".
Kommentar verfassen