Navigation Content
Ihr Warenkorb ist leer

OmniPage Capture SDK

Leistungsfähige Bildgebungs-, Erkennungs- und PDF-Funktionen
für Ihre Anwendungen

OmniPage Capture Software Developers Kit (SDK – Softwareentwicklungs-Kit)

Das OmniPage Capture SDK, dessen renommierte Kerntechnologie sämtlichen Nuance-Bildbearbeitungsprodukten zugrunde liegt, hat sich weltweit als eines der marktführenden Entwicklerkits für Bildbearbeitungs- und OCR-Lösungen durchgesetzt. Es hat alles, was Sie brauchen, um Ihre Anwendungen mit leistungsstarken Bildbearbeitungs-, OCR- und PDF-Funktionen auszustatten.

Neben herausragender Geschwindigkeit und Genauigkeit, zahlreichen Optionen zur Leistungsoptimierung und erstklassigen PDF-Funktionen unterstützt das OmniPage Capture SDK 18 die .NET-Umgebung, bietet Steuerungselemente für Arbeitsprozesse sowie ausgefeilte Formularerkennungstechnologien, die Ihre Entwicklungsabläufe straffen und Ihren Produkten einen reellen Mehrwert verschaffen.

Kommerziellen Software-Anbietern, denen es auf hohe OCR-Genauigkeit und hochwertige Bildbearbeitungsfunktionen ankommt, bietet das OmniPage Capture SDK skalierbare Voting Recognition Engines, erweiterte PDFUnterstützung und eine vereinfachte API, die es Entwicklern ermöglicht, wettbewerbsfähige Produkte zu entwickeln, mit denen sich die Produktivität steigern und bereits getätigte Investitionen maximieren lassen.

DIE WICHTIGSTEN VORTEILE FÜR ENTWICKLER

  • Hat alles, was Sie für Scans, OCR, ICR, OMR, PDF und Dokumentkonvertierung brauchen
  • Texterkennung höchster Genauigkeit verfügbar in 123 Sprachen, darunter Chinesisch, Japanisch und Koreanisch
  • Integriertes PDF-Toolkit mit Funktionen für durchsuchbares PDF und PDF-MRC mit achtfacher Komprimierung
  • Unterstützt Windows, Linux*, Macintosh* und mobile* Anwendungen

      * API teilweise mit Windows-Version kompatibel

Neuheiten

Neu in Version 18

Für Entwickler, die ihre Anwendungen einfach und schnell mit anspruchsvollen Funktionen für Texterkennung (OCR), Bildbearbeitung, PDF-Erstellung und -Konvertierung ausstatten möchten, gehört OmniPage Capture Software Development Kit (SDK) schon seit langem zur ersten Wahl.

Und mit der neuen Version 18 wurde das OmniPage Capture SDK noch einmal besser.

Signifikante Steigerungen bei Genauigkeit und Geschwindigkeit, clevere neue Entwicklungsfunktionen und kontinuierliche Innovation machen das OmniPage Capture SDK zum umfassendsten Entwicklertoolkit im Bereich der Dokumenten- und Bildbearbeitungssoftware.

Dank umfangreicher Aktualisierungen und Neuerungen – jedoch unter Beibehaltung der API aus Version 16 – ist die funktionale Erweiterung von Softwareanwendungen jetzt einfacher als je zuvor. Nicht zu vergessen eine bedeutende allgemeine Leistungssteigerung.

Kein Wunder, dass das OmniPage Entwicklertoolkit bei Entwicklern kommerzieller Bildbearbeitungssoftware oft bevorzugt wird.

GESCHWINDIGKEIT UND GENAUIGKEIT

Ihre Kunden wollen beides, Geschwindigkeit UND Genauigkeit, kein Entweder-oder. Als Entwickler wissen Sie, dass die OCR-Qualität von zahlreichen Faktoren abhängt, die von Anwendung zu Anwendung stark variieren. Mit dem neuen OmniPage SDK können Sie das Verhältnis zwischen Geschwindigkeit und Genauigkeit optimal auf Ihre Anforderungen abstimmen.

Bei der Entwicklung unserer eigenen Applikationen konnte wir folgende Verbesserungen feststellen*:

  • 48 % genauere OCR bei „normalen“ PDF-Dateien in westlichen Sprachen
  • 69 % genauere OCR bei „normalen“ PDF-Dateien in asiatischen Sprachen
  • 34 % genauere Zeichenerkennung bei gescannten Rasterbildern dank neuer Bereinigungsalgorithmen
  • Bis zu 78 % genauere Extraktion von Formulardaten
  • 10 % genauere Zeichenerkennung bei Digitalkamerabildern
  • 10 % bessere Layoutgenauigkeit in asiatischen Dokumenten
  • 20 % genauere Erkennung japanischer Schriftzeichen
  • 32 % bis 45 % schnellere Verarbeitung von mehrseitigen PDF-Dateien mit Multi-Core-Prozessoren (abhängig von Engine-Konfiguration)
  • 62 % verbesserte Komprimierung bei durchsuchbaren PDF-MRC-Dateien, ohne Einbußen bei der Zeichenerkennungsgenauigkeit

* Ergebnisse variieren je nach Testdokumenten, Anwendung und Verarbeitungseinstellungen

PDFs UNBEKANNTEN URSPRUNGS DURCHSUCHBAR MACHEN

Das Arbeiten mit PDF-Dateien ist für Softwareentwickler oft eine verzwickte und langwierige Angelegenheit. Es gibt viele Mittel und Wege PDF-Dateien zu erstellen und die Dateien enthalten darüber hinaus nicht immer indizierbaren oder durchsuchbaren Text. Da bei der OCR in der Regel alle PDF-Dateien als Bilder verarbeitet werden, kann es vorkommen, dass Ihre Anwendung OCR-Vorgänge ausführt, die gar nicht notwendig sind oder sogar mehr Schaden anrichten als dass sie nützen. Mit einigem Aufwand an Programmierzeit und Ressourcen lässt sich dieses Problem sicher lösen. Es gibt jedoch eine viel einfachere Methode: die neue API zur PDF-Verarbeitung. Das OmniPage Capture SDK unterscheidet damit automatisch zwischen Bild- und Textelementen in PDFs und führt die OCR nur dort aus, wo eine Texterkennung auch wirklich erforderlich ist. Die Verarbeitung wird schneller und genauer und bestehende Textelemente bleiben vor Änderungen, Beschädigungen oder sogar Verlust geschützt.

Überdies ermöglicht diese neue PDF-Verarbeitungs-Komponente eine seitenbasierte Verarbeitung: Seiten können gelöscht, kopiert und innerhalb einer Datei oder zwischen PDF-Dateien verschoben werden. Seiten aus Bilddateien (TIFF oder JPEG) können in PDF-Dateien eingefügt werden. Wird auf diesen Seiten vor dem Einfügen eine Texterkennung durchgeführt, dann können sie innerhalb der PDF-Datei durchsucht werden. Die Verarbeitungs-Komponente registriert alle angeforderten Änderungen und führt sie, sobald alle Befehle vollständig zusammengestellt sind, in einem nahtlosen Vorgang aus.

Diese PDF-Vorgänge lassen sich in zahlreichen Bildverarbeitungsanwendungen einsetzen, die Textextraktions- und Indizierungsfunktionen benötigen, z. B. in folgenden Bereichen: Dokumentenmanagement, Cloud-Speicherdienste, sowie PDF-Dokumentenzusammenstellung in Scan-Arbeitsprozessen mit textbasierten PDF-Dateien. Die Einsatzmöglichkeiten sind nahezu unbegrenzt und bieten Ihnen hervorragende Lösungen, Ihre Produkte wettbewerbsfähiger zu machen, indem Sie maximale Kundenzufriedenheit, optimale Leistungen und höchste Zuverlässigkeit unter einen Hut bringen.

MAXIMALE PRODUKTIVITÄT DANK AUTOMATISCHER SPRACHERKENNUNG

Qualität und Genauigkeit der OCR hängen aus unterschiedlichen Gründen von der Sprache ab. Aber Ihre Applikation mittendrin abzubrechen, um die Sprachauswahl zur Verbesserung des OCR-Ergebnisses zu ändern, ist schlicht und einfach unproduktiv. Das OmniPage Entwicklerkit löst dieses Problem mit der neuen vollautomatischen Spracherkennung. Sie ermöglicht unbeaufsichtigte Scan- und Eingabeszenarien, bei denen Dokumente oder sogar Seiten in wechselnden Sprachen verarbeitet werden müssen.

NEU: ZEITSPARENDE UND GENAUIGKEITSSTEIGERNDE BILDBEARBEITUNGSFUNKTIONEN

Randnotizen, Scanschatten und Rasterbilder können unerwünschte oder „Phantom“- Zeichen erzeugen und die OCR-Genauigkeit stark beeinträchtigen. Das OmniPage Capture SDK bietet neue clevere Bildbearbeitungsfunktionen, die gescannte Bilder bereinigen und die Dokumentqualität verbessern. Eine Funktion zum automatischen Zuschneiden prüft die Randgröße aller eingehenden Bilder. Zu große Ränder werden so zugeschnitten, dass sie der vordefinierten Randgröße entsprechen. Lochstellen und Scanschatten können jetzt automatisch aus den Bildrändern entfernt werden. Die Palette der Bereinigungsfunktionen wurde außerdem um neue Funktionen erweitert. Durch „Erosion“ und „Dilatation“ lassen sich Schwarzweißbilder noch besser für die OCR vorbereiten. Dabei wird ein bestimmter Pixelwert im Bild in Abhängigkeit von den benachbarten Pixelwerten angepasst. Erosion bewirkt, dass Zeichenformen schwächer dargestellt werden, während sie bei einer Dilatation verstärkt werden. Eine neue Whiteboard-Funktion verbessert die Lesbarkeit von mit der Digitalkamera abfotografierten Texten.

VISUELL ANSPRECHENDE UND NÜTZLICHE ANWENDUNGEN MIT VORDEFINIERTEN KOMPONENTEN

Das Besondere am OmniPage Capture SDK sind seine vordefinierten Komponenten, die auch in unseren eigenen Anwendungen zum Einsatz kommen. Wir haben nicht nur die Implementierung dieser Komponenten vereinfacht, sondern auch ihr Aussehen verbessert. Es gibt jetzt sogar eine Beispielanwendung, die zeigt, wie diese Komponenten den Bedienkomfort verbessern können.

VERBESSERTE NICHT-VORLAGENBASIERTE ERKENNUNG VON FORMULAREN MIT TABELLENSTRUKTUR

Die Formularerkennung ohne Vorlage wird zur Stapelverarbeitung von Formularen verwendet, die ein unterschiedliches Layout aufweisen und deshalb ohne Vorlagen verarbeitet werden müssen. Mit dem OmniPage Capture SDK können Sie wichtige Daten, wie Kontonummern, Rechnungsbeträge, Telefonnummern usw., aus Formularen extrahieren und zur Weiterverwendung in Datenbanken zur Verfügung stellen. Die Algorithmen für die Bereichseinteilung in Formularen mit Tabellenstruktur wurden zur Verbesserung der OCR-Genauigkeit überarbeitet.

Merkmale

DURCHSUCHBARE PDF-DOKUMENTE

Mit seinen vielseitigen Ausgabeoptionen sowie seiner herausragenden Genauigkeit, Geschwindigkeit und Komprimierungsleistung bietet das OmniPage Capture SDK in puncto Erstellung durchsuchbarer PDFs Flexibilität und Qualität die ihresgleichen sucht. Darüber hinaus bietet das OmniPage Capture SDK 18 neue bahnbrechende Funktionen zur Konvertierung einzelner oder mehrerer PDFs, auch unterschiedlicher Typen, in komplett durchsuchbare Dokumente, ohne bereits vorhandene Textinhalte zu verändern.

LEISTUNGSSTARKE ERKENNUNGSENGINES

Das OmniPage Capture SDK 18 enthält Erkennungsengines, deren innovatives Dreiwege-Voting-Schema für höchste Genauigkeit sorgt. Jede der im Toolkit enthaltenen Engines wurde separat entwickelt, um maximale Zuverlässigkeit und die Verarbeitung unterschiedlichster Dokumenttypen zu gewährleisten. Das OmniPage Capture SDK bietet Flexibilität ohnegleichen: Es erkennt Maschinenschrift (OCR, OCR-A, OCR-B und MICR), Handschrift (ICR), optische Markierungen (OMR) und Barcodes (1D und 2D).

OCR IN ASIATISCHEN SPRACHEN

Das asiatische OCR-Modul des OmniPage Capture SDK unterstützt vereinfachtes und traditionelles Chinesisch, Japanisch und Koreanisch mit eingebettetem englischem Text. Es verwendet die gleiche API wie das OCR-Kit für westliche Sprachen und folglich ist die Entwicklung genauso schnell und unkompliziert. Neben gesteigerter Worterkennungsgenauigkeit bietet das asiatische OCR-Modul eine verbesserte Layoutbeibehaltung und Ausgabe in den Formaten durchsuchbares PDF, RTF, Excel, XML, TXT und HTML.

EFFIZIENTES DURCHSATZMANAGEMENT*

Drei individuell konfigurierbare Analysemodi und Einstellungen für jede Voting-Engine zur genauen Anpassung der Erkennungsabläufe an Ihre Anforderungen ermöglichen eine maßgeschneiderte Leistungsanpassung.

  • Genauer Modus: für die genaueste Ganzseiten-Desegmentierung
  • Kombinierter Modus: Genaue Ganzseiten-Desegmentierung mit Schwerpunkt auf Bildverarbeitungsgeschwindigkeit
  • Schneller Modus: optimiert für OCR von reinen Textdokumenten ohne Tabellen oder Grafiken

* Ergebnisse können je nach Anwendung und/oder verwendeter Hardware variieren.

VORDEFINIERTE BENUTZERSCHNITTSTELLEN

In der Professional Toolbox von OmniPage Capture SDK stehen Ihnen vordefinierte Schnittstellen zur Bildwiedergabe, Bearbeitung der OCR-Ergebnisse und Steuerung von Scangeräten zur Verfügung. Sie enthält zudem visuelle Steuerelemente für erweiterte Bildbearbeitungswerkzeuge. Die Toolbox ermöglicht außerdem die Erstellung OmniPagekompatibler Arbeitsprozesse sowie die Überwachung ihrer Ausführung und die Anzeige und Bearbeitung von Formularattributen.

UMFASSENDE PDF-AUSGABE

Das PDF-Ausgabemodul ist ein optionales Add-on, das gescannte Bilder und/oder OCR-Ergebnisse in unterschiedlichen PDF-Formaten ausgibt.

Unterstützte PDF-Ausgabetypen

  • Komplett strukturiertes (normales) PDF: Komplett konfigurierbares PDF mit Text und Bildern.
  • Nur-Bild-PDF: Gescanntes Bild oder Digitalfoto im PDF-Format.
  • Durchsuchbares PDF (mit Bild über Text): Bild-PDF mit OCR-Text unterhalb des Textbilds. Bei diesem Format sieht die Seite genau so aus wie das gescannte Bild. Sie können den Text unterhalb des Textabbilds jedoch auswählen, kopieren/einfügen und durchsuchen.
  • PDF mit Bildplatzhaltern: Komplett strukturierte PDF-Datei, in der nicht zuverlässig erkannte Wörter durch ihre Bilder ersetzt werden.

AUTOMATISIERTE FORMULARVERARBEITUNG

Unsere patentierte LFR-Technik (Logical Form Recognition – logische Formularerkennung) automatisiert die Erstellung von Formularvorlagen aus gescannten Formularen. Formulare können so mit minimalem Aufwand automatisch begradigt und skaliert werden. Für bestmögliche Leistungen wird die optionale Professional Toolbox empfohlen.

OMNIPAGE-ARBEITSPROZESSE

Automatisierte Arbeitsprozesse helfen Ihnen, die von Ihrer Anwendung ausgeführten Verarbeitungsschritte zu optimieren. Komplexe OCR- und Bildbearbeitungsprozesse für gleichartige Dokumente lassen sich schnell und einfach implementieren, was die Leistung Ihrer Anwendung weiter steigert.

ERKENNUNG VON HANDGESCHRIEBENEM TEXT (ICR)*

Versehen Sie Ihre Anwendung mit Erkennungsfunktionen für handgeschriebene Buchstaben und Zahlen. Das ICR-Modul nur für Zahlen unterstützt gängige Symbole zur Darstellung von numerischen Werten. Das alphanumerische ICR-Modul erkennt zusätzlich zu Ziffern auch handgeschriebene Groß- und Kleinbuchstaben in fast 100 Sprachen.

ERKENNUNG VON AUSWAHLMARKIERUNGEN (OMR)*

Zur Erkennung optischer Markierungen, wie Ankreuzkästchen in Fragebögen, Bestellscheinen oder Formularen sowie auszumalende Felder in Multiple-Choice- Tests, stehen vier Empfindlichkeitsebenen zur Verfügung.

ERKENNUNG VON BARCODES*

Drei separate Barcode-Erkennungsmodule bieten Unterstützung für achtzehn 1-D- und zwei 2-D-Barcode-Standards (PDF-417 und Data Matrix). Die Unterstützung lässt sich um Erkennungsfunktionen für Farb- und Graustufen-Barcodes erweitern.

* Professional Recognition Kit erforderlich.

 

Technische Daten

Entwicklungsumgebung

  • Windows XP SP3, Vista SP2 x86-x64, Windows 7 SP1 x86-x64
  • Windows Server 2003 x86-x64, Windows Server 2008 x86-x64/R2
  • Intel und AMD 32 und 64 Bit Prozessoren
  • Microsoft Visual C/C++ Version .NET 2003/7.1, .NET 2005/8.0, 2008, 2010
  • Microsoft Visual Basic .NET

Laufzeitumgebung

  • Windows XP SP3, Vista SP2 x86-x64, Windows 7 SP1 x86-x64
  • Windows Server 2003 x86-x64, Windows Server 2008 x86-x64/R2
  • Intel und AMD 32 und 64 Bit Prozessoren

Architektur

Die Architektur des OmniPage Capture SDK ist für unterschiedliche Bildverarbeitungstechniken ausgelegt und in vier Subsysteme aufgeteilt:

  • Ein Bildeingabe-Subsystem zum Scannen oder Importieren von Bildern
  • Ein Bildvorverarbeitungs-Subsystem zur Verbesserung der Bildqualität vor der Erkennung
  • Ein Erkennungs-Subsystem, das verschiedene Erkennungstechnologien für die Bildverarbeitung bietet
  • Ein Export-Subsystem, das die aus den verschiedenen Erkennungstechnologien resultierende Ausgabe in ein einheitliches Format bringt, das sich in gängige Textverarbeitungsformate oder ASCII konvertieren lässt

Schnittstellen

OmniPage Capture SDK unterstützt zwei Programmierschnittstellen:

  • C API: Diese Schnittstelle steuert die Bildeingabe, Bildvorverarbeitung, Erkennung und Ausgabe und unterstützt die Bildbearbeitung auf Seitenbasis.
  • Professional Toolbox: Die Professional Toolbox vereint einen Satz Steuerelemente mit der ActiveX-Schnittstelle und ist als Zusatzmodul verfügbar. Vorgefertigte Steuerelemente ermöglichen die Bereitstellung von Plug-in-Schnittstellen für Ihre Anwendungen und somit eine Verkürzung der Entwicklungsund Markteinführungszeiten.
      ActiveX: Für Visual C++- und Visual-Basic-Programmierer steht eine ActiveX-Schnittstelle zur Verfügung. Diese Schnittstelle bietet den gesamten Funktionsumfang der C-Schnittstelle sowie Dokumentverarbeitungsfunktionen, mit denen Programmierer ihre Lösungen um effizientes Dokumentenmanagement erweitern können. Diese Schnittstelle erweitert auch die Unterstützung für moderne Entwicklungsumgebungen, einschließlich verwalteter Umgebungen wie VB.NET oder C#.
    • Bereitgestellte Steuerelemente:
      • Bildansicht
      • Zoneninhaltsprüfung
      • Miniaturbildansicht
      • Textprüfung und -bearbeitung
      • Anzeige von Statistiken und Dokumententwürfen
      • Bereitstellung von Details und Fortschrittsanzeige zum Arbeitsprozess, der auf dem System ausgeführt wird
      • Erstellen OmniPage-kompatibler Arbeitsprozesse
      • Zugriff auf und Änderung von Ausgabekonverter-Einstellungen
      • Anzeige und Bearbeitung von Formularfeldern und Attributen

Produktkonfigurationen

Produktkonfigurationen:

Das OmniPage Capture SDK ist in drei Produktkonfigurationen mit zwei optionalen Add-on-Komponenten erhältlich:

Entwickler-Kits:

Professional OCR Kit

  • Unterstützt lateinische, griechische und kyrillische Alphabete
  • C/C++-Bibliotheken und AcitveX-Schnittstelle
  • Zwei voreingestellte Voting-OCR-Erkennungsmodule
  • Zugriff auf drei individuelle OCR-Engines für die Anwendungsoptimierung
  • OCR-A, OCR-B, E-13B (MICR), CMC-7 Schriftartunterstützung

Professional Recognition Kit

  • Alle Module und Funktionen des Professional OCR Kits
  • Erkennungs-Module für Handschrift (ICR), optische Markierungen (OMR) und Barcodes (1D und 2D)
  • Unterstützt Chinesisch (vereinfacht und traditionell), Japanisch und Koreanisch
  • C/C++-Bibliotheken mit integrierter Unterstützung für Ausgabe als Bild und durchsuchbares PDF

OPTIONALE ADD-ONs

PDF-Ausgabemodul

Dieses optionale Add-on bietet Unterstützung für PDFVersionen bis 1.7 und PDF/A sowie Ausgabe in die Formate Normales PDF, PDF mit Bildplatzhaltern, Nur-Bild-PDF, PDF mit Bild über Text und hochkomprimiertes MRC-PDF.

Professional Toolbox

Die Toolbox bietet sämtliche visuelle Steuerfunktionen, die zur Erstellung und Anpassung von GUI-Elementen in Windows-basierten Anwendungen erforderlich sind, darunter Funktionen für Bildansicht, Textbearbeitung und Textkorrektur. Ebenfalls enthalten sind visuelle Steuer- und Anzeigefunktionen für Arbeitsprozesse.