Was sind die Unterschiede zwischen Sortierkomparator und Gruppenkomparator in Hadoop?Was sind die Unterschiede zwischen Sort Comparator und Group Comparator in Hadoop?
Antwort
GroupComparator, Um zu verstehen, meine Antwort auf diese Frage sehen -
What is the use of grouping comparator in hadoop map reduce
SortComparator: Wird verwendet, um festzulegen, wie Schlüssel Karte Ausgabe
Auszüge aus dem Buch Hadoop sortiert werden - Definitive Leitfaden:
Sortierreihenfolge für Schlüssel wird wie folgt gefunden:
Wenn die Eigenschaft
mapred.output.key.comparator.class
gesetzt, entweder explizit oder durchsetSortComparatorClass()
auf Job aufrufen, dann wird eine Instanz dieser Klasse verwendet wird. (In der alten API die äquivalente Methode istsetOutputKeyComparatorClass()
aufJobConf
.)Andernfalls Schlüssel müssen eine Unterklasse von
WritableComparable
sein, und der registrierten Komparator für die Schlüsselklasse verwendet wird.Wenn kein registrierter Komparator ist, wird ein
RawComparator
verwendet, das deserialisiert die Byteströme in Objekte und Delegierten derWritableComparable
‚scompareTo()
Verfahren verglichen wird.
SortComparator Vs GroupComparator in einem Motto: SortComparator
entscheidet, wie Tasten Karte sortiert ausgegeben werden, während GroupComparator
entscheidet, welche innerhalb der Reducer Kartenausgabe Schlüssel zur gleichen gehen Methodenaufruf reduzieren.
Gruppe Vergleicher entscheidet, welche Karte Ausgang Schlüssel vereinigt wird (gruppiert) in einen Schlüssel, und natürlich alle Sammlungen von Werten zu gruppieren. Normalerweise wird ein erster Schlüssel als einziger für die Zusammenfassungssammlung benötigt.
SortComparator entscheidet, wie Schlüssel werden von verringern in Eingang sortiert werden. Standardmäßig verwendet es natürliche Reihenfolge.