Ich möchte eine C# -Anwendung schreiben, die die OCR-Funktion in Adobe Acrobat verwenden kann. Wie kann ich das nennen? Gibt es eine öffentliche API?Wie kann ich die Acrobat-Funktion OCR von C# aufrufen?
Antwort
Ich glaube, das ist Teil der Adobe Reader-Software und ist nicht über eine API zugänglich. Es gibt eine API und Bibliotheken zum Erstellen von PDF-Dokumenten gemäß den Formatspezifikationen, aber OCR betrifft den Leser und nicht das Format. Ich fürchte, Sie müssten entweder eine andere Bibliothek verwenden oder sie selbst implementieren.
Es gibt keine direkte Adobe OCR API, die für .net geeignet ist. Es gibt jedoch einige Alternativen für das, was Sie erreichen möchten. Es gibt einen Open-Source-Wrapper für Googles Open-Source-Code Tesseract OCR, der hier auf GitHub verfügbar ist: https://github.com/charlesw/tesseract. Dies sollte Ihnen OCR-Fähigkeit innerhalb von C# bringen.
Aus der Dokumentation:
Erste, indem Sie
Install-Package Tesseract
vom Package Manager Console schnell
- Fügen Sie den
Tesseract
NuGet Paket gestartet.- Stellen Sie sicher, Sie
- herunterladen Sprachdatendateien für tesseract 3.02 aus tesseract-ocr und fügen Sie sie zu einem Projekt, sicherzustellen, ‚kopieren Ausgabeverzeichnis‘ gesetzt ist immer installiert Visual Studio 2012 x86 & x64 Runtimes haben.
- Überprüfen Sie die Proben-Lösung
~/Samples/Tesseract.Samples.sln
für ein funktionierendes Beispiel aus
Sure? weil ich es nur in Form von: makeOCR (Datei) brauche; Dann öffnet er die Datei und macht eine OCR – subprime
@Salvo jede Idee können wir konvertieren HTML zu PDF mit acrobat.Kannst du mir nützliche Link.Ich plane, es in .Net-Anwendung zu verwenden – shreesha