2016-03-31 13 views
0

Wie konfigurieren Sie Cassandra, so dass einige Tabellen überhaupt nicht repliziert werden, aber andere sind? Ist das wirklich ein guter Anwendungsfall für Cassandra?Cassandra Replikation - replizieren Sie einige Daten, aber behalten Sie einige lokale

Ich habe eine Gruppe von Kunden (max. 50), die alle Daten auf einer täglichen Basis liefern (~ 50.000 Datensätze pro Kunde pro Tag, ~ 200 Felder pro Datensatz). Ich muss die Daten vorverarbeiten, um vertrauliche Informationen lokal zu verschleiern, und dann die Daten zentral für die Analyse kombinieren und dann das Reporting für den kombinierten Datensatz ermöglichen. Ich plane, dass jeder Kunde einen lokalen Cassandra-Knoten für die Rohdatenladung (mehrere flache Dateien) hat, aber ich möchte nicht, dass dies repliziert wird, bis die Verschleierung abgeschlossen ist. Kann ich dies mit verschiedenen Tabellenbereichen und Replikationsfaktoren tun? Die Daten können unter Verwendung der Kunden-ID als PK verschlüsselt werden, wenn dies hilft.

Antwort

2

Sie einen Schlüsselraum mit einem Replikationsfaktor> 1.

für den Kunden Rohdaten mit einem Replikationsfaktor von 1 und halten Sie die Rohdaten-Tabellen in dort und dann hat die verschleierten Datentabellen in einem separaten Schlüsselraum haben könnte