die Eingabedatei ist wie folgt zu verwendenHIVE SERDE REGEX: Ausgabeformat - wollen nur wenige der Ausgangs Strings
eno :: ename :: dept :: sal
101 :: ang1 :: comp1 :: 2800000
201 :: EMP2 :: comp2 :: 2800000
301 :: EMP3 :: comp3 :: 3400000
401 :: EMP4 :: COMP4 :: 3600000
501 :: emp5 :: COMP5 :: 400000
>create table emp(ename string,edept string)
> row format serde 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
> WITH SERDEPROPERTIES(
> "input.regex"="^([^\\::]+)\\::([^\\::]+)\\::([^\\::]+)\\::([^\\::]+)$",
> "output.format.string"="%2$s%3$s")
> ;
>load data local inpath '/home/cloudera/test/emp.txt' into table emp;
i nur die 2. und 3. Literale in die Tabelle ziehen wollen. Also mit "output.format.string" = "% 2 $ s% 3 $ s" - ist das richtig?
Aber meine Tabelle wird nur mit eno & ename geladen.