Ich bin auf der Suche nach einem schließlich konsistenten Datenspeicher und es sieht so aus, als könnte es auf Riak oder Cassandra kommen. Hat jemand Erfahrungen damit?Cassandra vs Riak
Antwort
Wie Sie wahrscheinlich wissen, sind beide architektonisch stark von Dynamo beeinflusst (schließlich konsistent, keine einzelnen Fehlerquellen, usw.). Beide gehen auch über Dynamo hinaus, indem sie ein "reicheres als reines K/V" -Datenmodell zur Verfügung stellen - in Cassandras Fall einen Bigtable-artigen ColumnFamily-Modus, in Riaks Dokument-orientiertem. Ich habe gesunde Leute gesehen, die beides gewählt haben.
Ich glaube, Punkte, die Cassandra favorisieren
- Geschwindigkeit
- Unterstützung umfassen für Cluster mehrere Rechenzentren
- großen Namen Spanning es mit (digg, twitter, facebook, webex, ... - http://n2.nabble.com/Cassandra-users-survey-tp4040068p4040393.html )
Punkte, die Riak bevorzugen sind
- Karte/reduzieren Unterstützung aus der Box
/Cassandra Entwickler, FWIW
Riak von
- Mozilla Foundation
- Ask.com sponsored listings
- Comcast verwendet wird
- Citigroup
- Bet365
Ich denke, dass beide den Test von glaubwürdigen Referenzkunden/Benutzern bestehen.
Cassandra scheint reifer zu sein, und es geht derzeit besser in den Benchmarks. Es scheint einfacher zu sein, einen Knoten hinzuzufügen, wenn der Cluster wächst.
Verwendung und Download sind unterschiedlich. Am besten, um Referenzen zu bekommen.
Vielleicht könnte ein privates Gespräch gehabt werden, wo Riak Referenzen in diesen Unternehmen geteilt werden könnten? Ich bin mir nicht sicher, wie ich mit Cassandra so etwas erreichen kann, aber es gibt eine Gemeinschaft von Unternehmen, die Cassandra unterstützen, die wie ein guter Anfang erscheinen. Da diese wahrscheinlich Community-Teilnehmer in Cassandra-Entwicklung haben, kann es ein wirklich vernünftiger Ort sein, um zu beginnen.
Ich würde Riaks Antwort auf die jüngsten und großen Bereitstellungen hören, wo Kunden glücklich sind.
Ich möchte auch die Roadmap für jedes Produkt sehen. Cassandra ist meiner Meinung nach etwas leichter zu verfolgen als Riak, da Cassandras Wiki über Grenzen und Dinge spricht, die sich wahrscheinlich in Zukunft ändern werden, aber die Zukunft nicht gut darstellen. Ich könnte das von einer Open-Source-Community verstehen ... vielleicht ... aber ich kann nicht für ein Produkt, für das ich bezahlen muss.
Ich würde auch Forschung von Cloudant vorschlagen, die eine sehr schöne Schichtung von Fähigkeiten zu haben scheint. Es sieht auch so aus, als ob es die Fähigkeiten anderswo in Apache Land zur Geltung bringt.CouchDB ist die Apache-Plattform, auf der Cloudant basiert. Aber die Indizierung mit Lucene scheint nur die Spitze des Eisbergs zu sein, wenn es darum geht, wohin Cloudant gehen könnte. Das Erstellen und Verwalten eines Indexes ist ein sehr systematischer Prozess, eine Art Datenpipeline, die mit anderen Apache-Community-Assets geschrieben werden kann. AND-Funktionen wie NLP können auch indirekt über Lucene oder direkt in das, was beibehalten wird, hinzugefügt werden.
Es wäre schön, eine vorgeschlagene Cloudant-Roadmap zu sehen, zumal das Team die Reichtümer der Apache-Community abbauen und in Cloudant integrieren könnte. Dies ist wahrscheinlich der Fall, da es eine betriebliche Komponente für das Cloudant-Erlösmodell gibt, die dies erfordert, und dies aus keinem anderen Grund.
Ein weiterer Bereich von Interesse ... Cloudants Preismodell ... es ist klar, dass ihr Umsatzmodell nicht auf Software basiert, sondern auf Service. Das ist ziemlich attraktiv und scheint mit dem Ökosystem, das Cassandra umgibt, übereinzustimmen. Ich weiß nicht, ob die Basho-Leute bisher genug von der Nosql-Community gewonnen haben ... sehe das nicht von irgendeinem Buzz rund um ihre Website oder ihr Produkt.
Ich mag diese Cloudant-Webseite (https://cloudant.com/the-data-layer/). Ich war überrascht, die eingebettete Erlang-Fähigkeit zu sehen ... Ich wusste nicht, dass CouchDB in Erlang geschrieben wurde, da dies für mich in der Apache-Community ungewöhnlich erscheint (meine Ignoranz); CouchDB scheint älter zu sein als andere Nosql-Produkte, die ich (jetzt) in Erlang schreiben kann. Unabhängig von ihrer Strategie zählen Amazon EC2 und Microsoft Azure als Hosting-Partner, was auf eine Wertschätzung von Microsoft- und Microsoft-Welten hindeutet - alles sehr wichtig, wenn das Middleware-Wertpotential (über Cache- oder Hash-Tabellen-Anwendungen) dieser Datentypen richtig erkannt wird Geschäfte könnten haben.
Schließlich, während ich die Platine nicht gut kenne, sieht Andy Palmers Anleitung so aus, als wäre es wertvoll. Er kann mit strukturierten Daten (über VoltDB) eine Orientierung in eine Welt bringen, die zu Recht oder zu Unrecht als KVP-Hash-Tabellen unstrukturierter Daten gebrandmarkt wird. Der Bedarf an Struktur und Ökosystem rund um die Nosql- "Datenbanken" wird erkannt ... Zeuge der Bemühungen von Google mit Spanner ... KVP/wenig Struktur/Bedarf an Suchmöglichkeiten motivierte Googles Investition in den Spanner-Bereich. Während wir alle vielleicht nicht so etwas wie Spanner benötigen, benötigen wir wahrscheinlich eine verbesserte und robuste "Unternehmens" -Management- und Interoperabilitätsfähigkeit in diesen Nosql-Datenbanken, um es vernünftig zu machen, sie in moderne Cloud-Architekturen zu integrieren. Die benötigte Struktur kann durch einfache Interoperabilität und Funktionsvielfalt erreicht werden. Es kann auch von neuen Funktionen kommen, die die Umwandlung von unstrukturierten Daten in strukturierte Daten unterstützen (zB Indizes, Verwendung von NLP zur Erzeugung strukturierter und geparster Renderings von Dingen innerhalb eines KVP-Blobs und viele andere Dinge, die in eine Roadmap und veröffentlicht, könnte eine Benutzerbasis locken und wachsen). Cloudant sieht aus wie es eine gute Chance auf Erfolg hat ... Ich werde es einen genaueren Blick ...
Und schau, was ich über CouchDB gefunden ...
CouchDB ist mit einer Reihe von Funktionen kommt, So wie die sofortige Umwandlung von Dokumenten und Benachrichtigungen in Echtzeit, die die Entwicklung von Web-Apps zum Kinderspiel machen. Es kommt sogar mit einer einfach zu bedienenden Web-Administrationskonsole. Sie haben es erraten, direkt aus CouchDB bedient! Uns liegt viel an verteilter Skalierung. CouchDB ist hochverfügbar und partitionstolerant, aber auch konsistent. Und wir kümmern uns sehr um Ihre Daten. CouchDB hat eine fehlertolerante Speicher-Engine, die die Sicherheit Ihrer Daten an erste Stelle setzt.
Riak wird auch in erlang geschrieben https://github.com/basho/riak – Mainguy
Der Vollständigkeit halber: Ein gutes (wahrscheinlich voreingenommen) Vergleich zwischen den beiden kann bei http://docs.basho.com/riak/1.3.2/references/appendices/comparisons/Riak-Compared-to-Cassandra/
Dieser Artikel ist von Basho, die eine Firma ist, die Riak entwickelt, nur zu sagen ... – user2003470
Ja finden, ich bin immer noch auf den Zaun zu dieser. Das größte Problem, das ich bisher mit Riak hatte, ist der Mangel an Dokumentation, wie es auf dem Papier perfekt klingt. Gibt es Ihrer Meinung nach eine große Gemeinschaft um Cassandra? – Zubair
Auch dort scheinen keine großen Einsätze von Riak zu sein. – Zubair
Die Cassandra-Gemeinschaft ist ausgezeichnet; Der IRC-Kanal erreicht in der Regel jeden Tag über 110 Besucher, und die Teilnahme an der Mailingliste ist ebenfalls gut. – jbellis