Die Ausgangsqualität ist für ein aussagekräftiges Ergebnis nicht ausreichend:
(links Original, rechts Bitmap 600 dpi mit 50% Schwellenwert)
Eine gute Vorlage sollte 300 dpi und möglichst keine Artefakte haben.
Das wäre ja wirklich eine gute Nachricht für Viele. Die Pressemeldung kam mit Version 9 raus. Inzwischen sind die bei V 12. Aber man hat keine einschlägigen Tests gesehen.
Die Ausgangsqualität ist für ein aussagekräftiges Ergebnis nicht ausreichend:
(links Original, rechts Bitmap 600 dpi mit 50% Schwellenwert)
Eine gute Vorlage sollte 300 dpi und möglichst keine Artefakte haben.
Ersatzweise ein scan direkt aus dem Buch mit 600dpi.
Bei mir wurden die zwei Strings in thailändisch so gelesen: (zunächst in Word gespeichert und nun via Zwischenablage in diese Foren-Software kopiert)
นั่งคุยกันหนอย
เลกยืมเทปไปฟัง
Rein zufällig hatte ich die Version 10 irgendwo gefunden:
http://binsearch.info/?q=Abbyy+FineR...e=1100&server=
Ich verstehe den Aufwand nicht, den ihr da treibt.
Einfach scannen reicht aus und ein jpg erzeugen, das kann man dann beliebig vergroessen.
Eben nicht, weil das Ausgangs-jpeg in einer fixierten Aufloesung erstellt wird und dann später bei Vergroeßerungen immer unschärfer wird.
Lese ich die Schrift via OCR richtig ein, kann ich damit sehr viel mehr machen, als nur angucken oder wegsehen. Z.B. editieren und kommentieren. Für den Lernenden ja oftmals sehr wichtig.
Nur sind noch nicht alle Einzelheiten geklärt. Die zwei von mir oben eingestellten Textstrings in thailändischer Sprache erscheinen im Ausgabeformat Word zunächst als in CordiaUPC
CordiaUPC
นั่งคุยกันหนอย
เลกยืมเทปไปฟัง
นั่งคุยกันหนอย
เลกยืมเทปไปฟัง
Aber ist denn die 2. Silbe im 2. String nach OCR-Einlesen überhaupt richtig geschrieben?
Auch nicht.
Und es gibt wohl noch Versions-Unterschiede.
Bye Bye FineReader
Es führt vielleicht zu weit, aber von Lehrbüchern und Dictionaries erwarte ich mir, dass die thailändischen Buchstaben wenigstens derartig deutlich lesbar sind, wie der normale Text in thailändischen Zeitungen, weder besonders dünn, noch besonders klein. Wenn ich zb. das 'Taschenwörterbuch Deutsch-Thai' von Josef Rohrer erwähnen darf, haben die Thaibuchstaben dort eine Höhe von 2 mm, aber in der 'Daily News' sind es mindestens 4 mm beim normalen Text. Ich brauche keine Riesenbuchstaben, aber Unterschiede wie zwischen 'too tau' und 'doo dek' möchte ich ohne Lupe erkennen. Ich verstehe Autoren derartiger Bücher, die viele Seiten so eng wie möglich mit umständlichen Beipielsätzen füllen, bei Rohrer sind es Sätze wie 'ich war kaum 10 km gefahren, als der linke Hinterreifen platzte' als Beispiel für das Wort 'sein' (S.393), oder 'der Tiger wurde von einem Polizisten erschossen' als Beispiel für das Wort 'von' (S.508). Aber praktische Hilfe für den Sprachschüler liegt nicht in solchen Sätzen, wenn die kleinen Buchstaben dann für Nicht-Thais nahezu unlesbar sind. Und man sollte in Lehrbüchern und Lexika nach meiner Meinung auch die Erklärung der Grundbedeutung von 'schwierigen Worten' liefern, zb. 'nangsü-döön-tang' für den Pass. Ein einfach zusammengesetztes Wort, wie wir wissen, was zwar im Wörterbuch oder Dictionary zwar aufgeführt, aber nicht erklärt wird. Eine Erklärung würde helfen, das thailändische System der Wortkombination zu verstehen. Es gibt viele längere Worte, die ich umständlich isoliert lernte und verwendete, weil sie in Lexika nur isoliert zu finden waren. Fast alle sind Zusammensetzungen. Das ist in keiner Grammatik erklärt.