Ist Lucene.Net als Suchmaschine für häufig wechselnde Inhalte geeignet?Ist Lucene.Net als Suchmaschine für häufig wechselnde Inhalte geeignet?
Oder spezifischer, kann jemand eine subjektive Meinung darüber geben, wie schnell lucene.net Indizes aktualisiert werden können. Jeder andere Ansatz zum Suchen häufig wechselnder Inhalte wäre großartig.
Wir entwickeln ein Forum. Forenbeiträge werden häufig zum Forum-Repository hinzugefügt. Wir denken, dass wir diese Beiträge sehr schnell zum Lucene-Index hinzufügen müssen (< 0.5s), um für die Suche verfügbar zu werden. Es wird anfangs ungefähr 5E6 Posts im Repository geben. Angenommen, die Suchmaschine läuft auf einem nicht exotischen Server (ich weiß, das ist sehr vage!).
Weitere Vorschläge in Bezug auf das Problem der Suche nach häufig wechselnden Inhalt geschätzt. Die Forenbeiträge müssen nach einer variablen Anzahl von benannten Tags durchsuchbar sein (Tag-Name und Wert müssen übereinstimmen). Ein SQL-basierter Ansatz (basierend auf dem Toxi-Schema) gibt uns nicht die Leistung, die wir gerne hätten.
Auch wenn die Frage bereits beantwortet wurde, sollten Sie einen Server in Betracht ziehen, der die Suche unterstützt (wenn Out-of-Process eine Option ist), etwa [Solr] (http://lucene.apache.org/ solr /) oder [elasticsearch] (http://www.elasticsearch.org/); Beide kümmern sich sehr gut um die Erstellung und Verwaltung von Indizes und kümmern sich um Dinge wie Replikation, Sharding usw., die für den Umgang mit großen/mehreren Indizes wichtig sind. – casperOne