Ich habe eine Tabelle HCatalog
Tabelle mit Partitionen Zuordnung zu einigen Zip-Dateien in S3 erstellt.pyspark mit HCatalog Tabelle in Zeppelin
In Zeppelin, habe ich einen Absatz die %pyspark
Modul mit folgenden Codes:
Absatz 1:
%pyspark
from pyspark.sql import HiveContext
hc = HiveContext(sc)
f_req_2h = hc.table("default.f_req_2h") # a HCatalog table in the default schema"
print f_req_sh.count()
f_req_2h.registerTempTable("f_req_2h")
Als ich es lief, so weit so gut. Dann habe ich einen zweiten Absatz die f_req_2h Tabelle abzufragen, die in Absatz 1 registriert wurde, wie folgt:
Ziffer 2:
%sql
select * from f_req_2h limit 1;
Ich habe eine "table not found"
Fehler. Jede Hilfe oder Zeiger wird geschätzt.