2012-10-18 15 views
13

Ich versuche herauszufinden, gow das folgende in ES zu indizieren.Wie mehrere Sprachen in ElasticSearch indiziert und gespeichert werden

Ich habe viele Dokumente, die Crawler von der Website sind mit verschiedene Sprache. Jedes Dokument hat eine Kategorie wie Flughafen, Restaurant, Fluss, Strand etc, und es ist die Sprache wie Arabisch, Englisch .. wie

doc {Sprache:. „Eng“, Inhalt: „hier etwas“ Kategorie: "Strand"}

doc {Sprache: "vn", Inhalt: "Xin chao", Kategorie: "Strand"}

I mit je Sprachen zu indizieren und suchen Dokumente wollen;

I Englisch Optionen wählen, und die Suche mit Abfrage "hier" => RESUTLS

Sollte ich:

  1. -Setup jeder elastischen Kern (pro Maschine pro Sprache) für je Sprache. GERADE laufen ES COPY :)

    Beispiel: erstellen elasticsearch_ENGLISH, elastichsearch_VIETNAMESE

  2. jede Sprache mit jedem Index von Elasticsearch Eg erstellt: indexs

/Englisch/Typ erstellen/

/vietnames/type/ . Wenn ich eine Abfrage suche, suche ich nur den Index der Sprache

ODER tun Sie es auf andere Weise, die ich nicht bewusst bin :)?

Antwort

8

Nicht sicher, dass ich Ihre Bedenken vollständig verstanden habe.

Wenn Sie nach dem vollständigen Cluster suchen müssen (ich meine Suche in jeder Sprache), können Sie kein Setup pro Sprache erstellen.

Das heißt, haben Sie viele Möglichkeiten:

Es ist nicht eine vollständige Antwort, aber einige Hinweise, Ihnen zu helfen ...

+0

Dank dadoonet, :) es ein Index pro Sprache ist die beste für diese Situation – phuongdo

+0

Große Anregungen, danke. Ich habe gerade die Links in Ihrer Antwort aktualisiert, da sich die Seiten verschoben haben. – Tom

+1

gibt es einen guten Beitrag über das hier http: //gibrown.wordpress.com/2013/05/01/Drei-Prinzipien-for-multilingal-indexing-in-elasticsearch / – hellvinz