Ich möchte Lucene verwenden, um einen Stream zu indizieren, während er gelesen wird. Aufgrund der Größe der Daten und des begrenzten RAM kann ich das Ganze nicht in einen Puffer packen; stattdessen möchte ich, dass Lucene aus dem Stream konsumiert, indexiert wird, bis weitere Daten verfügbar sind, mehr konsumieren, bis EOF.Lucene: Indizieren eines Streams (nicht in einem Puffer verfügbar)
Lucene sollte nur das puffern, was es benötigt: das sind Teil-Tokens, bis genug Zeichen erworben wurden, um das Token zu beenden.
Kann ich das mit Lucene machen? Wie?