2016-07-19 12 views
0

Ich habe Datenquellen von überall mit mysql, Oracle, etc. Jede Datenquelle speichert das Datum als Datensatz in einer Tabelle, aber das Format ist nicht Standard und kann sogar von Tabelle zu Tabelle in der gleichen Datenquelle variieren (JJJJ-MM-dd, JJJJ-TT-MM, MM-TT-JJJJ, JJJJ-MMM-TT HH: mm: SS: ss, usw.).Hive - Möglichkeiten zur Standardisierung von eingehenden Datumsfeldern n Bienenstock?

Welche Optionen gibt es, um diese verschiedenen Datumsfelder zu standardisieren, um sie in einem Stock zu speichern? Schwein?

+0

Dies ist ein ETL-Problem. Speichern Sie sie mit nativen Hive-Datumsformaten. –

+0

Ja, wenn man genauer hinschaut, ist dies ein ETL-Problem. Ich gehe mit Pig voran. – Rick

Antwort

0

Wenn Sie Sqoop zum Ziehen von Daten in Hive verwenden, können Sie eine eigene Abfrage erstellen, um das Datum in einem bestimmten Standardformat abzurufen.

sqoop --options-file <Source RDMS options file> 
--query "select to_char(start_date,'mm/dd/yyyy') as my_date from SALES"