Wie kann ich automatisch Python-Bibliotheken in meinem Dataproc-Cluster installieren, wenn der Cluster startet? Dies würde mir die Mühe ersparen, mich manuell bei den Master- und/oder Arbeiterknoten anzumelden, um die Bibliotheken, die ich brauche, manuell zu installieren.Wie installiere ich Python-Bibliotheken automatisch beim Start des Dataproc-Clusters?
Es wäre großartig, auch zu wissen, ob diese automatisierte Installation Dinge installieren könnte nur auf dem Master und nicht die Arbeiter.
Dataproc Dokumentation ein bisschen veraltet ist. Sie müssen '' '/ usr/share/google/get_metadata_value attributes/dataproc-role''' ausführen, um die Zeichenfolge" Master "zu erhalten. Command '' '/ usr/share/google/get_metadata_value Attribute /' '' gibt eine Liste der verfügbaren Attribute. – dzejdzej