2016-04-05 8 views
0

Wir haben ein Problem mit unserer Datastax Enterprise-Suchauslastung festgestellt. Unsere Version ist [cqlsh 5.0.1 | Cassandra 2.1.9.791 | DSE 4.8.0 | CQL spec 3.2.0 | Native protocol v3]. Wir haben ein Cassandra-Schema für diese Tabelle mit einer Kartensammlung properties map<text, text> und in der solr schema.xml haben wir <dynamicField name="properties*" type="text" indexed="true" stored="true" />.datastax solr dynamicField Volltextsuche

Das Problem ist, dass wir Daten falsch eingefügt haben, ohne das Präfix wie beschrieben here zu verwenden. Gibt es eine Möglichkeit, diese Daten durchsuchbar zu machen, ohne alle Daten zu verlieren, die sich bereits in der Tabelle befinden?

Antwort

1

Ich schrieb eine ganze Blog-Post über sie:

http://www.sestevez.com/brians-loader-unloader-for-search/

TL; DR Sie die Daten wieder einsetzen, aber die Post hat einen Einzeiler auf, wie es mit cassandra-loader zu tun und awk.

+0

In Ihrem Blog warnen Sie vor der Verwendung von Sammlungen für große Datenmengen. Wie groß ist "groß"? Mit 'nodetool cfstats' sehe ich' Space used (total): 83112983', das nicht zu groß erscheint. – LHWizard

+0

wie ich darüber nachdenke, was sind einige vernünftige Alternativen, Kartensammlungen zu vermeiden, um das gleiche zu erreichen? – LHWizard

+0

Groß wie in zu vielen vales in einer Karte. Nicht Gesamtgröße. Ich würde auf 10s zielen – phact