2016-04-07 5 views
1

Ich habe eine Datenbank mit mehr als 1 Million Dokumente darin. Ich muss 'dreistellige Wortpositionen' aktivieren und einige neue Indizes erstellen. Nach der Durchführung wird die Neuindizierung automatisch ausgelöst.Vermeiden Sie das erneute Auslesen von vollständigen Daten beim Wiederherstellen der inkrementellen Sicherung in Marklogic 8

Bis zu diesem Moment ist es sehr einfach.

Jetzt ist der schwierige Teil, ich habe eine inkrementelle Sicherung und während der Wiederherstellung möchte ich reindexing nur für aktualisierte Daten (Daten durch inkrementelle Sicherung hinzugefügt), aber es wird für vollständige Daten ausgelöst (dh Daten in inkrementellen Backups + Daten vorher vorhanden).

Gibt es einen Ausweg, um nur inkrementelle Daten neu zu indizieren?

PS: An die Datenbanken sind Replikate (aktiv und passiv) angehängt. Wir können sie auch für diesen Zweck verwenden

Antwort

1

Wenn Sie Daten aus der Sicherung neu indizieren und später wiederherstellen, verlieren Sie alle neu indizierten Daten. Dies ist, was dir passiert.

Bei der Wiederherstellung können Sie entweder eine vollständige Sicherung oder eine vollständige Sicherung und inkrementelle Sicherungen wiederherstellen. Es gibt keine Option, nur inkrementelle Sicherungen wiederherzustellen.

Wenn Sie Indizes hinzufügen und nachdem die Neuindizierung abgeschlossen ist, müssen Sie eine vollständige Sicherung oder Teilsicherung durchführen (sie kann den gesamten Datensatz enthalten, wenn sich die Neuindizierung auf alle Daten ausgewirkt hat).

Wenn sich die Neuindizierung auf Sie auswirkt, stehen Ihnen je nach Geschäftsfall mehrere Optionen zur Verfügung: 1. Implementieren einer Tiered-Storage-Bereichspartition: Dies hilft beim Trennen der Daten und beim Zuweisen der Daten zu bestimmten Gesamtstrukturen. Sie können nach Bedarf beim Hinzufügen und Ablegen von Gesamtstrukturen Gesamtstrukturen hinzufügen und entfernen. Die Daten für abgesetzte Gesamtstrukturen sind möglicherweise erst wieder für die Anwendung verfügbar, wenn sie erneut zugeordnet werden. Eine erneute Indizierung für den gesamten Datensatz wird jedoch vermieden, wenn sie nicht benötigt wird. 2. Implementieren Tiered-Storage - Sub-Datenbanken: Dies hilft, Daten auf Basis einer Klassifizierung zu trennen und nur die benötigten Sub-Datenbanken neu zu indizieren. 3. Datenbankreplikation - Richten Sie einen fremden Replikatcluster ein und fügen Sie Indizes im fremden Replikatcluster hinzu zuerst und aktivieren Sie den Indexer. Wenn die Neuindizierung abgeschlossen ist, nehmen Sie ein Backup und stellen Sie es im primären Cluster wieder her, wenn Sie einen Ausfall haben. Fügen Sie Indizes im primären Cluster hinzu, nachdem die Datenbankwiederherstellung abgeschlossen ist.

+0

Können Sie bitte einige marklogic Dokumente zur Verfügung stellen, die besagt, dass die Wiederherstellung wird voll + inkrementelle –

+0

http://docs.marklogic.com/guide/admin/backup_restore –