19
Ich habe eine einfache Linie:eine einfache Linie Zeichenfolge RDD in Spark-
line = "Hello, world"
Ich mag würde es zu einer RDD konvertieren mit nur einem Element. Ich habe
versuchtsc.parallelize(line)
Aber es bekommen:
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
Irgendwelche Ideen?
Eigentlich gibt, sc.parallelize ([line]) unter Verwendung sammeln() gearbeitet. – poiuytrez
in meiner Umgebung (scala 2.10.3 spark-1.0.0) sc.parallelize ([line]). Collect() funktioniert nicht – michaeltang
Ich habe vergessen anzugeben, dass ich die Python-API verwende. – poiuytrez