Ich sende Code zu Amazon EMR über die Mrjob/Boto-Module. Ich habe einige externe Python-Abhängigkeiten (zB. numpy, boto, etc) und muss jetzt die Quelle der Python-Pakete herunterladen und sie als Tarball im Feld "python_archives" der mrjob.config-Datei senden.Python Dependency Management auf EMR
Dies macht Abhängigkeitsverwaltung unordentlicher als ich möchte, und frage mich, ob ich irgendwie die gleiche requirements.txt-Datei verwenden kann, die ich für mein virtualenv-Setup verwende, um die emr-Instanz mit meinen Abhängigkeiten zu starten. ist es möglich, virtualenv auf EMR-Instanzen einzurichten und so etwas zu tun:
pip install -r requirements.txt
wie ich lokal wäre?