2016-06-25 6 views
0

Ich habe diesenUmwandlung von PDF zu HTML-Seite wiese Python mit

for root, dirnames, filenames in os.walk('FilePath'): 
    for filename in fnmatch.filter(filenames, 'page-*.pdf'): 
    # matches.append(os.path.join(root, filename)) 
    subprocess.call('pdf2txt.py > myoutput.html', shell = True) 

Ich brauche subprocess für jedes Mal zu schreiben, eine Datei von bestimmten Mustern [Gefiltert Bedingung] tue subProzess von PDF in HTML diese Datei zu finden ist.

Wie kann ich die dem Subprozess übergebene Eingabe dynamisch ändern?

Bearbeitungen sind willkommen.

Antwort

0

Betrachten glob mit os Modul sowohl mit den PDF- Muster und vollständigen absoluten Pfad der Eingabe und Ausgabe PDF-HTML-Dateien zu erfassen:

import os 
import glob 

# CURRENT DIRECTORY OF SCRIPT 
cd = os.path.dirname(os.path.abspath(__file__)) 

for pdf in glob.glob(cd+'/*.pdf'): 
    file = pdf.replace('.pdf', '') 
    subprocess.call('python path/to/pdf2txt.py -o {0}.html -t html {1}'.format(file, pdf), 
        shell = True)