Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > de.comp.text.misc > #22

Re: Wie macht man es einem OCR-Pogramm einfach?

Path csiph.com!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail
From Michael Bäuerle <michael.baeuerle@gmx.net>
Newsgroups de.comp.text.misc
Subject Re: Wie macht man es einem OCR-Pogramm einfach?
Date Sat, 13 Aug 2016 14:22:16 -0000
Lines 50
Message-ID <AABXry0YfLkAAAta.A1.flnews@Server4.micha.freeshell.org> (permalink)
References <nndg8r$te9$1@news1.tnib.de> <AABXmxXkEgwAAAkF.A1.flnews@WStation5.stz-e.de> <nnhva3$b9e$1@news1.tnib.de> <AABXnNO1o1oAAAb4.A1.flnews@WStation1.micha.freeshell.org> <nokqmd$m3k$3@news1.tnib.de>
Mime-Version 1.0
Content-Type text/plain; charset=ISO-8859-1; format=fixed
Content-Transfer-Encoding 8bit
X-Trace individual.net 2wsqZl/ZAIwZVSieLowFkgJckyQlxBbSb15vA+YJGigAjKd0uC
X-Orig-Path not-for-mail
Cancel-Lock sha1:Nv3MF7UKSuwSc4KWUQ1k/P2SzOA=
Injection-Date Sat, 13 Aug 2016 14:22:16 -0000
User-Agent flnews/0.14pre38 (for HP-UX)
Xref csiph.com de.comp.text.misc:22

Show key headers only | View raw


Marc Haber wrote:
> Michael Bäuerle <michael.baeuerle@gmx.net> wrote:
> > 
> > [...]
> > Mein Erklärungsversuch wäre:
> > Die heutige OCR-Software nutzt die vorhandenen Ressourcen vor allem
> > um besser raten zu können, wenn etwas unklar ist. Zum Beispiel in dem
> > sie den Kontext mit einbezieht (Unser Gehirn versucht ja auch ganze
> > Wörter als Bilder zu interpretieren). 
> > Das funktioniert aber vmtl. nur mit bestimmtem Text, auf den sie aus-
> > gelegt ist, besonders gut. Ob Zahlenkolonnen oder Base64-Daten ohne
> > "Wörter" da dazugehören, möchte ich eher anzweifeln.
> 
> Da hast Du freilich recht.
> 
> > Wenn es durch einen geeigneten Font aber gar nicht nötig ist zu raten,
> > dann werden diese Fähigkeiten nicht benötigt (oder haben mehr Marge).
> 
> Richtig. Was hältst Du in diesem Kontext von OCR-B?

Da die OCR-B ja mehr für das menschliche Auge entworfen wurde als OCR-A,
dürfte sie weniger Sicherheitsmarge bei der Erkennung bieten. Wenn ich
mir die Glyphen so anschaue, dann liegt die Schwachstelle IMHO bei O/0.
Diese beiden Glyphen sehen dort deutlich weniger verschieden aus als bei
OCR-A.

> > Ungeeignete Fonts zu verwenden und die schlechte Lesbarkeit dann mit
> > Rechenleistung zu kompensieren wäre allerdings in der Tat der
> > "modernere" Lösungsansatz.
> > Du hattest aber explizit gefragt, wie man es der OCR-Software möglichst
> > einfach machen kann, nicht wie man ihre Fähigkeiten bis zum Limit
> > ausreizt weil CPU-Power brach liegt.
> 
> Die Frage ist halt, ob heutige Software mit so "künstlichen" Fonts wie
> OCR-A überhaupt klar kommt bzw ob sie jemals mit sowas getestet wurde.

Ja. Wenn das nicht der Fall ist, könnte das Ergebnis auch grotten-
schlecht sein (wegen des "ungewöhnlichen" Aussehens von OCR-A).
Da dieser Font aber offiziell genormt wurde, darf man wohl schon davon
ausgehen, dass OCR-Software ihn kennt ...

Gerade mal einen Verrechnungsscheck-Vordruck meiner Bank herausgezogen:
Für die Beschriftung wurde OCR-A verwendet. Das wird also nach über 40
Jahren auch wirklich noch verwendet. Es kann dafür doch eigentlich nur
zwei Gründe geben: Es wurde seither kein besserer Font erfunden oder
die Software-Unterstützung für OCR-A ist besonders gut.

BTW:
Es wäre schön, wenn du die Ergebnisse deiner Tests hier posten könntest.
Das dürfte sicher noch mehr Leute interessieren.

Back to de.comp.text.misc | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-07-28 19:43 +0200
  Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@stz-e.de> - 2016-07-29 10:37 +0200
    Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-07-30 12:25 +0200
      Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@gmx.net> - 2016-07-30 16:20 +0000
        Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-08-12 17:40 +0200
          Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@gmx.net> - 2016-08-13 14:22 +0000
            Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-08-13 17:40 +0200
              Re: Wie macht man es einem OCR-Pogramm einfach? Michael Bäuerle <michael.baeuerle@gmx.net> - 2016-08-14 09:04 +0000
  Re: Wie macht man es einem OCR-Pogramm einfach? Florian Weimer <fw@deneb.enyo.de> - 2016-07-30 20:55 +0200
    Re: Wie macht man es einem OCR-Pogramm einfach? Marc Haber <mh+usenetspam1118@zugschl.us> - 2016-08-12 17:40 +0200

csiph-web