Ich arbeite an Dokumentenmanagement-Projekt und ich möchte Text aus PDF extrahieren. Wie kann ich das erreichen? Ich verwende Itextsharp, um pdf auf lokalem System zu extrahierenExtrahieren Sie die PDF-Datei auf FTP-Server mit itextsharp
Dieses ist eine Funktion, die ich für diesen Zweck verwende. Path ist ein FTP-Server-Pfad
public static string ExtractTextFromPdf(string path)
{
using (PdfReader reader = new PdfReader(path))
{
StringBuilder text = new StringBuilder();
for (int i = 1; i <= reader.NumberOfPages; i++)
{
text.Append(PdfTextExtractor.GetTextFromPage(reader, i));
}
return text.ToString();
}
}
Es löst eine Ausnahme
'ftp:\\###\index\500199.pdf not found as file or resource.'
[### ist mein ftp server]
Bitte klären Sie Ihr spezifisches Problem. –
Willst du Text von pdf auf ftp extrahieren. Problem ist, wenn ich PdfReaderleser schreibe = neuer PdfReader (Pfad) er thowsausnahme "Datei nicht gefunden als Datei oder Betriebsmittel" – Munavvar
Setzen Sie zusätzliche Informationen in die Frage. –