2009-07-03 8 views

Antwort

0

Ich glaube, das ist Teil der Adobe Reader-Software und ist nicht über eine API zugänglich. Es gibt eine API und Bibliotheken zum Erstellen von PDF-Dokumenten gemäß den Formatspezifikationen, aber OCR betrifft den Leser und nicht das Format. Ich fürchte, Sie müssten entweder eine andere Bibliothek verwenden oder sie selbst implementieren.

+0

Sure? weil ich es nur in Form von: makeOCR (Datei) brauche; Dann öffnet er die Datei und macht eine OCR – subprime

+0

@Salvo jede Idee können wir konvertieren HTML zu PDF mit acrobat.Kannst du mir nützliche Link.Ich plane, es in .Net-Anwendung zu verwenden – shreesha

0

Es gibt keine direkte Adobe OCR API, die für .net geeignet ist. Es gibt jedoch einige Alternativen für das, was Sie erreichen möchten. Es gibt einen Open-Source-Wrapper für Googles Open-Source-Code Tesseract OCR, der hier auf GitHub verfügbar ist: https://github.com/charlesw/tesseract. Dies sollte Ihnen OCR-Fähigkeit innerhalb von C# bringen.

Aus der Dokumentation:

Erste, indem Sie Install-Package Tesseract vom Package Manager Console schnell

  1. Fügen Sie den Tesseract NuGet Paket gestartet.
  2. Stellen Sie sicher, Sie
  3. herunterladen Sprachdatendateien für tesseract 3.02 aus tesseract-ocr und fügen Sie sie zu einem Projekt, sicherzustellen, ‚kopieren Ausgabeverzeichnis‘ gesetzt ist immer installiert Visual Studio 2012 x86 & x64 Runtimes haben.
  4. Überprüfen Sie die Proben-Lösung ~/Samples/Tesseract.Samples.sln für ein funktionierendes Beispiel aus