Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]
Groups > de.comp.text.misc > #22
| From | Michael Bäuerle <michael.baeuerle@gmx.net> |
|---|---|
| Newsgroups | de.comp.text.misc |
| Subject | Re: Wie macht man es einem OCR-Pogramm einfach? |
| Date | 2016-08-13 14:22 +0000 |
| Message-ID | <AABXry0YfLkAAAta.A1.flnews@Server4.micha.freeshell.org> (permalink) |
| References | <nndg8r$te9$1@news1.tnib.de> <AABXmxXkEgwAAAkF.A1.flnews@WStation5.stz-e.de> <nnhva3$b9e$1@news1.tnib.de> <AABXnNO1o1oAAAb4.A1.flnews@WStation1.micha.freeshell.org> <nokqmd$m3k$3@news1.tnib.de> |
Marc Haber wrote: > Michael Bäuerle <michael.baeuerle@gmx.net> wrote: > > > > [...] > > Mein Erklärungsversuch wäre: > > Die heutige OCR-Software nutzt die vorhandenen Ressourcen vor allem > > um besser raten zu können, wenn etwas unklar ist. Zum Beispiel in dem > > sie den Kontext mit einbezieht (Unser Gehirn versucht ja auch ganze > > Wörter als Bilder zu interpretieren). > > Das funktioniert aber vmtl. nur mit bestimmtem Text, auf den sie aus- > > gelegt ist, besonders gut. Ob Zahlenkolonnen oder Base64-Daten ohne > > "Wörter" da dazugehören, möchte ich eher anzweifeln. > > Da hast Du freilich recht. > > > Wenn es durch einen geeigneten Font aber gar nicht nötig ist zu raten, > > dann werden diese Fähigkeiten nicht benötigt (oder haben mehr Marge). > > Richtig. Was hältst Du in diesem Kontext von OCR-B? Da die OCR-B ja mehr für das menschliche Auge entworfen wurde als OCR-A, dürfte sie weniger Sicherheitsmarge bei der Erkennung bieten. Wenn ich mir die Glyphen so anschaue, dann liegt die Schwachstelle IMHO bei O/0. Diese beiden Glyphen sehen dort deutlich weniger verschieden aus als bei OCR-A. > > Ungeeignete Fonts zu verwenden und die schlechte Lesbarkeit dann mit > > Rechenleistung zu kompensieren wäre allerdings in der Tat der > > "modernere" Lösungsansatz. > > Du hattest aber explizit gefragt, wie man es der OCR-Software möglichst > > einfach machen kann, nicht wie man ihre Fähigkeiten bis zum Limit > > ausreizt weil CPU-Power brach liegt. > > Die Frage ist halt, ob heutige Software mit so "künstlichen" Fonts wie > OCR-A überhaupt klar kommt bzw ob sie jemals mit sowas getestet wurde. Ja. Wenn das nicht der Fall ist, könnte das Ergebnis auch grotten- schlecht sein (wegen des "ungewöhnlichen" Aussehens von OCR-A). Da dieser Font aber offiziell genormt wurde, darf man wohl schon davon ausgehen, dass OCR-Software ihn kennt ... Gerade mal einen Verrechnungsscheck-Vordruck meiner Bank herausgezogen: Für die Beschriftung wurde OCR-A verwendet. Das wird also nach über 40 Jahren auch wirklich noch verwendet. Es kann dafür doch eigentlich nur zwei Gründe geben: Es wurde seither kein besserer Font erfunden oder die Software-Unterstützung für OCR-A ist besonders gut. BTW: Es wäre schön, wenn du die Ergebnisse deiner Tests hier posten könntest. Das dürfte sicher noch mehr Leute interessieren.
Back to de.comp.text.misc | Previous | Next — Previous in thread | Next in thread | Find similar
Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-07-28 19:43 +0200
Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@stz-e.de> - 2016-07-29 10:37 +0200
Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-07-30 12:25 +0200
Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@gmx.net> - 2016-07-30 16:20 +0000
Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-08-12 17:40 +0200
Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@gmx.net> - 2016-08-13 14:22 +0000
Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-08-13 17:40 +0200
Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@gmx.net> - 2016-08-14 09:04 +0000
Re: Wie macht man es einem OCR-Pogramm einfach? Florian Weimer <fw@deneb.enyo.de> - 2016-07-30 20:55 +0200
Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-08-12 17:40 +0200
csiph-web