Wie kann ich einen bestimmten Datensatz an alle meine Reduzierstücke senden? Ich kenne die Partitioner-Klasse und was sie tut, aber ich sehe keinen einfachen Weg, um sicherzustellen, dass ein Datensat
Ich verwende Hadoop, um eine sehr ungleiche Verteilung von Daten zu analysieren. Einige Schlüssel haben Tausende von Werten, aber die meisten haben nur einen Wert. Zum Beispiel würde Netzwerkverkehr,
Hallo ich wollte lernen, wie man die Wortzählung nach Wert in hadoop.I wissen, Hadoop dauert die Sortierung von Schlüsseln, aber nicht nach Werten. ich weiß, die Werte sortieren wir , aber ich bin etw