Ich bin in der Lage, Tabellen mit pyspark und hivecontext zu erstellen, zu löschen, zu ändern. Ich lade eine Liste mit Befehlen I, in String-Format gesendet werden sollen, und in diese Funktion übergeben:PySpark Hive-Abfragen zeigen keine Ausgabe
def hiveCommands(commands, database):
conf = SparkConf().setAppName(database + 'project').setMaster('local')
sc = SparkContext(conf=conf)
df = HiveContext(sc)
f = df.sql('use ' + database)
for command in commands:
f = df.sql(command)
f.collect()
Es funktioniert für die Wartung gut, aber ich versuche, meine Zehen in Analyse zu tauchen, und ich don Wenn ich versuche, einen Befehl wie "Tabelle beschreiben" zu senden, sehe ich keine Ausgabe.
Ich nur, dass es den Befehl übernimmt und führt es ohne Fehler aus, aber ich sehe nicht, was die tatsächliche Ausgabe der Abfrage ist. Ich muss mich vielleicht mit meinem .profile oder .bashrc herumschlagen, nicht wirklich sicher. Etwas von einem Linux-Neuling. Jede Hilfe wäre willkommen.
Warum eine Ausgabe erwarten? Es gibt hier keine einzige Methode, die es erzeugen kann. – zero323
Nun, ich habe "print f" am Ende meiner Schleife ausprobiert und es hat nichts produziert, also dachte ich, dass es vielleicht eine spezielle Methode gibt, die gebraucht wird. – firestreak
Ich würde vorschlagen, zurück zu den Dokumenten zu gehen und zu überprüfen, was genau 'SQLContext.sql' tut. Es gibt nichts nützliches, um dort zu drucken. – zero323