Ich habe eine RDD mit Tuple wieErste erste n verschiedene Schlüssel Tupeln in Scala Spark-
folgt(a, 1), (a, 2), (b,1)
Wie kann ich die ersten beiden Tupeln mit verschiedene Schlüssel bekommen können. Wenn ich einen Take (2) mache, bekomme ich (a, 1) und (a, 2)
Was ich brauche ist (a, 1), (b, 1) (Schlüssel sind verschieden). Werte sind irrelevant.
Das Beispiel am unteren Rand des Dieser Beitrag sollte helfen. http://StackOverflow.com/a/30960114/2308683 –
@ cricket_007 distinct wird das gesamte Tupel vergleichen. Was ich vergleichen muss, ist nur der Schlüssel für das Tupel. –