Ich habe einen Datenrahmen Spark-df
mit folgendem Schema:bestimmte Spalten auswählen in Spark-Datenrahmen von Array von Struct
root
|-- k: integer (nullable = false)
|-- v: array (nullable = true)
| |-- element: struct (containsNull = true)
| | |-- a: integer (nullable = false)
| | |-- b: double (nullable = false)
| | |-- c: string (nullable = true)
Ist es möglich, nur wählen a, c
in v
von df
ohne map
zu tun? Insbesondere wird df
aus einer Parquet-Datei geladen und ich möchte nicht, dass die Werte für c
sogar geladen/gelesen werden.