2016-03-28 13 views
0

Wir diskutieren aus einer Reihe von Gründen über die Umstellung unserer physischen Infrastruktur auf eine cloudbasierte Lösung, aber eine der wichtigsten ist, dass wir viel einfacher skalieren können, zusammen mit allen anderen, die nicht gehostet/gewartet werden müssen physische Hardware "profitieren Sie mit einer Cloud-Lösung.Gefahren, die mit dem Verschieben eines physischen Cassandra-Clusters in einen Cloud-basierten Cluster verbunden sind?

Das heißt, mit Cassandra eine Shared-Nothing-Architektur, welche Art von Performance-Hits werden wir höchstwahrscheinlich erleben? Für den Anfang würden wir physische Ressourcen am wahrscheinlichsten Speicher teilen, usw., also wie groß könnte dies möglicherweise sein?

Ich weiß, dass Unternehmen wie NetFlix große Cloud-basierte Cassandra-Cluster haben, aber ich nehme an, mit ihrem Budget können sie es sich leisten, ihre Sachen auf ihrer eigenen Hardware zu haben und nichts mit anderen Firmen zu teilen ... offensichtlich nicht Ich habe kein Budget.

Nur versuchen, eine Vorstellung von irgendwelchen großen Fallstricken zu bekommen, nach denen Sie jetzt suchen, besonders von jedem, der eine Migration wie diese erfolgreich gemacht hat.

Antwort

1

Sie wollen auf zwei Dinge achten (Denn was ich kenne):

Encryption

Diese sichere sein muss. Ihre Daten im Cassandra-System sind wahrscheinlich nicht alle verschlüsselt, und es wäre auch nicht sicher, die zwischen Knoten übertragenen Daten nicht zu verschlüsseln. Möglicherweise können Sie einen Cloud-Anbieter finden, mit dem Sie diesen Schritt überspringen können. Wenn Sie das nicht können, hat das einen großen Einfluss auf die Geschwindigkeit. Die Verschlüsselung ist nicht billig, CPU-weise.

Bandbreite

Sie möchten die Menge des Verkehrs Sie zwischen Ihren vorhandenen Knoten haben zu messen. Sie in einer Cloud zu haben, ist alles in Ordnung, solange Ihre Computer geschlossen sind und eine lokale Netzwerkverbindung haben.

Wenn Sie ein Cloud-System verwenden, bei dem der gesamte Datenverkehr über den Internet-Port anstatt über einen lokalen Port läuft, kostet das eine riesige Menge an Bandbreite. Nach dem, was ich bei Cassandra gesehen habe, steigt der Datenverkehr dramatisch an, wenn ein Knoten ausfällt, bis dieser Knoten zurückkommt. Dieses Problem kann in neueren Versionen von Cassandra behoben werden. Ich habe das in letzter Zeit nicht mehr getestet ...