2010-12-15 5 views
0

Ich versuche, eine Suchmaschine in asp.net mit lucene.net zu entwickeln. Ich gehe durch viele Tutorials und Seiten, um die passenden Ergebnisse zu erhalten, aber ich konnte nicht. Eigentlich habe ich einen Ordner mit einigen Dateien (doc, ppt, pdf, Excel etc ..) und ich möchte in diesem Ordner nur nach Inhalten suchen und wenn die Ergebnisse nicht in diesem Ordner gefunden werden dann bitten Sie den Benutzer im Web zu suchen.Wie man einen Ordner indiziert mit lucene.net

zum Beispiel habe ich einen Ordner mit Tausenden von Dateien @ C: \ test und wenn der Benutzer nach "Miller" suchte, dann sollte es in jedes Dokument suchen. Wenn die Ergebnisse gefunden werden, dann sollte es Ergebnisse zeigen, wie die

gesuchten Textdatei nicht von Vorkommnissen Miller C: \ test \ 1 \ file.doc 5 Miller C: \ test \ 1 \ 11 \ New.doc 2

Bitte helfen Sie mir, ich bekomme keine angemessenen Ergebnisse.

+0

was haben Sie versucht, und zu welchem ​​Schritt wird es andernfalls/werden Sie unerwartete Ergebnisse zu bekommen? – BrokenGlass

Antwort

1

Lucene/Lucene.NET ist nur eine Indizierungsengine, Sie müssen immer noch den Text aus den Dateitypen extrahieren, die Sie unterstützen möchten - unter Windows können Sie die Schnittstelle IFilter für viele Dateitypen verwenden, wenn Sie Acrobat haben Der dort installierte Reader 7+ sollte IFilter für PDF-Dateien unterstützen. Was den Indizierungsteil selbst angeht, gibt es viele, viele Samples.

Siehe auch dieses Thema What's a good method for extracting text from a PDF using C# or classic ASP (VBScript)?