Ich brauche Seiten zählen aus Word-Dokumenten. Ich habe viele Bibliotheken und Skripte (Apache Poi, Perl-Skripte, einige Anwendungen für Linux und einige mehr) getestet und die einzige funktionierende Lösung war, Microsoft Office mit Wine zu installieren und mit Perl auf OLE zuzugreifen. Ich habe es geschafft, aber es scheint, ich kann es nicht auf dem Server aufgrund von Lizenzproblemen verwenden ...Programmatisch erhalten Seiten zählen in Microsoft Word-Dokumente unter Linux
Das Problem mit ApachePoi und anderen Lösungen, die Zugriff auf Word-Dokumente Info ist mit Unvollständigkeit einiger Dokumente verbunden. Die pageCount -Eigenschaft in der Dokumentzusammenfassung fehlt manchmal (dies ist häufig der Fall, wenn OdT-Dokumente als Dokument und ältere Dokumente gespeichert werden).
Gibt es eine Möglichkeit, Seiten zu zählen (nicht nur Informationen aus der Zusammenfassung), ohne Microsoft Office auf dem Server zu installieren?
Ich habe vwSummary versucht und ja, es verwendet Dokument Zusammenfassung. Ich habe vergessen, OpenOffice zu erwähnen, es gibt Python und Java API und es ist ziemlich einfach, die tatsächlichen Seitenzahlen zu erhalten. Das einzige Problem bei diesem Ansatz ist das Öffnen von Doc-Dateien in OpenOffice - manchmal kann es sich unterscheiden, dass die gleiche Datei mit MS Office geöffnet wurde. –
Ja, OpenOffice unterscheidet sich manchmal. Denken Sie daran, dass es keinen Standard für .doc gibt. Also wirklich die Antwort ist, es gibt keine Antwort. Es gibt keine Standardmethode zum Zählen von Seiten, da es keine Standardmethode zum Rendern einer Dokumentdatei gibt. Wenn Sie die gleiche Anzahl von Seiten Word benötigen, müssen Sie natürlich Word verwenden. –