Ich habe versucht, ein Dataframe-Objekt auf einer hdfs-Datei mit Funken csv lib wie gezeigt in this tutorial zu erstellen.DataFrame-Objekt zeigt keine Daten an
Aber als ich versuchte, die Anzahl der Datenrahmen-Objekt zu erhalten, es zeigt als 0
Hier ist meine Datei Blick ist wie,
employee.csv:
empid,empname
1000,Tom
2000,Jerry
ich die geladen über Datei,
val empDf = sqlContext.read.format("com.databricks.spark.csv").option("header","true").option("delimiter",",").load("hdfs:///user/.../employee.csv");
Wenn ich abgefragt wie, empDf object.printSchema() schenkt richtiges Schema mit empid, empname als String-Felder und ich konnte sehen, dass das Trennzeichen richtig gelesen wurde.
Aber wenn ich versuchte, den Datenrahmen mit, empDf.show geben nur Spaltenüberschrift und keine Daten in es und wenn ich empDf.count gebe 0 Datensätze.
Bitte korrigieren Sie mich, wenn ich etwas zu tun verpasst habe, was hier sehr nötig ist.
Vielen Dank. Es ist mein Problem gelöst ... !! Meine Scala-Version ist 2.10, aber ich habe 2.11-Version von Spark csv Problem. Mit 2.10 Funken csv-Bibliothek hat es gelöst ...! –
Sie sind herzlich willkommen – desertnaut