18
Lucene haben einen Standard-Stopfilter (http://lucene.apache.org/core/4_0_0/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html), weiß jemand, welche Wörter in der Liste sind?Wie lautet die Standardliste der Stoppwörter in Lucenes StopFilter?
Ich benutze 'Lucene' 5.5.0 für ein Schlüsselwort holen. Ich spezifiziere den Stopword-Filter mit 'tokenStream = new StopFilter (new ClassicFilter (new LowerCaseFilter (stdToken)), StopAnalyzer.ENGLISH_STOP_WORDS_SET);' aber 'Lucene' filtert keine Stoppwörter. Gibt es etwas, was ich vermisse? –
Tatsächliche Quelle Link: http://alvinalexander.com/java/jwarehouse/lucene/src/java/org/apache/lucene/analysis/StopAnalyzer.java.shtml –
Die Liste kann in der aktuellen Elasticsearch: The Definitive Guide gefunden werden , [Stopwords: Leistung versus Präzision] (https://www.elastic.co/guide/en/elasticsearch/guide/current/stopwords.html) – Paul