2016-07-14 18 views
0
df: 

-----------+ 
|  word| 
+-----------+ 
|  1609| 
|   | 
|  the| 
| sonnets| 
|   | 
|   by| 
| william| 
|shakespeare| 
|   | 
|   fg| 

Dies ist mein Datenrahmen. So entfernen Sie die leeren Zeilen (um die Zeilen zu entfernen, die '' enthalten) mithilfe der Where-Klausel.'wo' in Apache Funken

code: 

df.where(trim(df.word) == "").show() 

output: 

----+ 
|word| 
+----+ 
| | 
| | 
| | 
| | 
| | 
| | 
| | 
| | 
| | 

Jede Hilfe wird geschätzt.

Antwort

1

können Sie trimmen und prüfen, ob Ergebnis leer ist:

>>> from pyspark.sql.functions import trim 
>>> df.where(trim(df.word) != "") 
+0

Dank für die Zeit. Die Lösung hat nicht funktioniert. Es hat alle Zeilen im Datenrahmen leer gemacht. Ich werde den Frageteil aktualisieren, um das Ergebnis anzuzeigen. –

+0

Sorry, Tippfehler im Operator. –

+0

danke es hat funktioniert. –