Wenn Sie eine externe Tabelle in Hive (auf Hadoop) mit einer Amazon S3 Quellenort erstellen, sind die an den lokalen Hadoop HDFS übertrugen Daten über:Wenn Sie eine externe Tabelle in Hive mit einem S3-Speicherort erstellen, werden die Daten übertragen?
- externe Tabellenerstellung
- wenn dert (MR Jobs) ist auf der externen Tabelle laufen
- nie (keine Daten werden jemals übertragen) und MR-Jobs lesen S3-Daten.
Welche Kosten entstehen hier für S3-Lesevorgänge? Gibt es eine einzige Kosten für die Übertragung von Daten zu HDFS oder gibt es keine Datenübertragungskosten, aber wenn der von Hive erstellte MapReduce-Job auf dieser externen Tabelle ausgeführt wird, entstehen die Lesekosten.
Ein Beispiel wäre externe Tabellendefinition sein: auf die Daten zugreifen
CREATE EXTERNAL TABLE mydata (key STRING, value INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '='
LOCATION 's3n://mys3bucket/';
(vorausgesetzt, Sie meinen finanzielle Kosten) Ich glaube nicht, dass Sie für Transfers zwischen S3 und EC2 innerhalb derselben AWS-Region berechnet werden http://aws.amazon.com/s3/pricing/ –