2012-04-03 4 views
4

Ich möchte ähnliche Werte in einer Map zählen, wobei key der Wert in der Hive-Tabellenspalte wäre und der entsprechende Wert die Anzahl.Zählen in Hadoop Hive

Zum Beispiel für die Tabelle unten:

+-------+-------+ 
| Col 1 | Col 2 | 
+-------+-------+ 
| Key1 | Val1 | 
| Key1 | Val2 | 
| Key2 | Val1 | 
+-------+-------+ 

So der Stock Abfrage so etwas wie

Key1=2 
Key2=1 

Antwort

9

zurückkehren soll Es sieht aus wie Sie für eine einfache Gruppe von suchen.

SELECT Col1, COUNT(*) FROM Table GROUP BY Col1

+0

Gibt es eine Möglichkeit, eine zweite Ebene der Gruppierung zu tun. Ich bekomme die obige Ausgabe tatsächlich nur als gruppierte Abfrage. – divinedragon

+0

Sie meinen Gruppe mit 2 Spalten? Sie können einfach mehrere Spalten in die Gruppe einfügen. –