2014-04-03 4 views
7

bin ein bisschen verwirrt mit diesem Begriff Byte Offset-Wert wird als Map-Taste in Hadoop Map Programm zu reduzieren behandelt. Zunächst einmal, was ist der Byte-Offset-Wert?Was ist der Byte-Offset-Wert in Hadoop oder in Java?

Zweitens werfen Sie bitte einige Lichter auf, wie es generiert wird und wie dieser Byte-Offset-Wert angezeigt wird?

Dank Raj

Antwort

4

Byte-Offset ist die Anzahl der Zeichen, die von dem Beginn einer Zeile vorhanden zu zählen.

beispielsweise diese Leitung

what is byte offset? 

wird ein Byte-Offset 19 haben dies als Schlüsselwert in hadoop verwendet wird

0

Der Byte-Offset ist die Anzahl von Bytes, beginnend bei Null. Ein Zeichen oder Leerzeichen ist normalerweise ein Byte, wenn über Hadoop gesprochen wird. Aber sehen Sie sich diese Frage, wenn Sie wollen mehr wissen: How many bits in a character?

0

Grundsätzlich ein Offset ist eine ganze Zahl, die verwendet wird, um den Abstand (absolute Adresse) in Bezug auf die Basisadresse zu finden.

Nehmen Sie eine Textdatei mit den folgenden Daten

Informatik-Welt
Quantum Computing

jetzt den Offset für die erste Zeile 0 und der Eingang in den hadoop Job < 0, Computer Science World> für die zweite Zeile versetzt die sein < 23, Quantum Computing>

, wenn wir die Textdatei Hadoop Job übergeben. Es berechnet intern den Byte-Offset.