Discussion:
OCR bzw. Handschrifterkennung aus Java
(zu alt für eine Antwort)
Jochen Böhringer
2006-03-17 16:18:56 UTC
Permalink
Hallo zusammen,

wir wollen in einer Java Applikation handschriftlich erfasste Texte und
gedruckte Texte (die in der Applikation als Image vorliegen) verarbeiten.

Kennt jemand ein gutes Modul (gerne auch kostenpflichtig), das ein Java API
hat um die Erkennung zu steuern?

Ich habe schon etwas gesucht und bin dabei auf ein paar Kandidaten gestoßen
(z.B. www.javaocr.com) bei denen ich mir aber nicht sicher bin, ob nur
gedruckter Text, oder auch Handschrift erkannt wird. Außerdem interessiert
mich vor allem euer Eindruck über die Qualität der API und der
Erkennungsrate.

Gruß
Jochen
Ingo R. Homann
2006-03-20 10:11:11 UTC
Permalink
Hi,
Post by Jochen Böhringer
wir wollen in einer Java Applikation handschriftlich erfasste Texte und
gedruckte Texte (die in der Applikation als Image vorliegen) verarbeiten.
Kennt jemand ein gutes Modul (gerne auch kostenpflichtig), das ein Java API
hat um die Erkennung zu steuern?
Ich habe schon etwas gesucht und bin dabei auf ein paar Kandidaten gestoßen
(z.B. www.javaocr.com) bei denen ich mir aber nicht sicher bin, ob nur
gedruckter Text, oder auch Handschrift erkannt wird. Außerdem interessiert
mich vor allem euer Eindruck über die Qualität der API und der
Erkennungsrate.
Ohne den Kandidaten genauer zu kennen:

(Hand-)Schrifterkennung ist (fast so schlimm wie Spracherkennung)
keineswegs ein gelöstes Problem, für das es in allen Programmiersprachen
Standard-Lösungen gibt!

Je nachdem wie qualitativ hochwertig das sein soll, würde ich mich da
keineswegs auf die Sprache Java festlegen und stattdessen eine den
qualitativen Anforderungen genügende Komponente irgendwie an das
Java-Programm anflanschen. Angesichts der Tatsache, dass so eine
Komponente sicherlich ohnehin einen hohen Konfigurations-Aufwand mit
sich bringt, dürfte die Ankoppelung an Java so oder so das kleinere
Problem sein - zumal eine gute Software definitiv eine Schnittstelle zur
Verfügung stellen sollte.

Falls Du davor zurückschrecken solltes, würde ich mir ernsthafte
Gedanken über das Projekt machen - wenn die Schrifterkennung da eine
zentrale Komponente ist, habe ich da mächtige Zweifel.

Worum geht es genau, wenn man fragen darf?

Ciao,
Ingo
Jochen Böhringer
2006-03-20 15:02:27 UTC
Permalink
Post by Ingo R. Homann
Je nachdem wie qualitativ hochwertig das sein soll, würde ich mich da
keineswegs auf die Sprache Java festlegen und stattdessen eine den
qualitativen Anforderungen genügende Komponente irgendwie an das
Java-Programm anflanschen. Angesichts der Tatsache, dass so eine
Komponente sicherlich ohnehin einen hohen Konfigurations-Aufwand mit sich
bringt, dürfte die Ankoppelung an Java so oder so das kleinere Problem
sein - zumal eine gute Software definitiv eine Schnittstelle zur Verfügung
stellen sollte.
Falls Du davor zurückschrecken solltes, würde ich mir ernsthafte Gedanken
über das Projekt machen - wenn die Schrifterkennung da eine zentrale
Komponente ist, habe ich da mächtige Zweifel.
Es muss auch nicht zwingend ein Java API zur Verfügung stehen, ein COM
Interface oder eine andere Schnittstelle, die man dann eben über JNI
ansprechen müsste würde mir auch schon genügen. Allerdings macht es mir auch
nichts aus, wenn bereits ein fertiges Java API dabei wäre. Und wenn es nur
ein Wrapper für die plattformabhänge Implementierung ist.
Post by Ingo R. Homann
Worum geht es genau, wenn man fragen darf?
Es geht kurz gesagt darum, Formulardaten, die über einen digitalen Stift
erfasst werden in einer Datenbank abzulegen. Dazu wollen wir die Daten über
eine OCR/ICR Software "parsen" und dann in unserem Modul weiterverarbeiten.

Gruß
Jochen
Ingo R. Homann
2006-03-21 07:41:03 UTC
Permalink
Hi,
Post by Jochen Böhringer
Es muss auch nicht zwingend ein Java API zur Verfügung stehen, ein COM
Interface oder eine andere Schnittstelle, die man dann eben über JNI
ansprechen müsste würde mir auch schon genügen. Allerdings macht es mir auch
nichts aus, wenn bereits ein fertiges Java API dabei wäre. Und wenn es nur
ein Wrapper für die plattformabhänge Implementierung ist.
Post by Ingo R. Homann
Worum geht es genau, wenn man fragen darf?
Es geht kurz gesagt darum, Formulardaten, die über einen digitalen Stift
erfasst werden in einer Datenbank abzulegen. Dazu wollen wir die Daten über
eine OCR/ICR Software "parsen" und dann in unserem Modul weiterverarbeiten.
D.h., es steht pro Buchstabe ein Kästchen zur Verfügung?

Dann scheint mir das Ganze in der Tat doch einigermaßen gut lösbar.

Allerdings habe ich keinen Überblick über entsprechende Produkte, meine
Einschätzung ist also eher akademischer Natur! ;-/

Ciao,
Ingo

Loading...