2016-05-01 11 views
0

Ich habe hochgeladen und extrahiert Dokument in solr 6.0.0 und ich sehe, dass es die folgende Abfrage indiziert verwendet:solr Suche in einem "Inhalt" Feld funktioniert nicht

http://localhost:8983/solr/techproducts/select?indent=on&q=id:doc1&wt=json

{ 
    "responseHeader":{ 
    "status":0, 
    "QTime":1, 
    "params":{ 
     "q":"id:doc1", 
     "indent":"on", 
     "wt":"json"}}, 
    "response":{"numFound":1,"start":0,"docs":[ 
     { 
     "links":["http://www.education.gov.yk.ca/"], 
     "id":"doc1", 
     "last_modified":"2008-06-04T22:47:36Z", 
     "title":[" PDF Test Page"], 
     "content_type":["application/pdf"], 
     "author":"Yukon Canada Yukon Department of Education", 
     "author_s":"Yukon Canada Yukon Department of Education", 
     "content":[" \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n PDF Test Page \n \n \n \n \nPDF Test File \n \nCongratulations, your computer is equipped with a PDF (Portable Document Format) \nreader! You should be able to view any of the PDF documents and forms available on \nour site. PDF forms are indicated by these icons: or . \n \nYukon Department of Education \nBox 2703 \nWhitehorse,Yukon \nCanada \nY1A 2C6 \n \nPlease visit our website at: http://www.education.gov.yk.ca/\n \n \n \n \n "], 
     "_version_":1533049305513852928}] 
    }} 

I Beachten Sie, dass der Feldinhalt eine Anzahl von Vorkommen des Worts PDF aufweist.

Warum ich mit der folgenden Abfrage kein Ergebnis bin immer, wenn ein Feldname dort content ist und es enthält PDF innen ?:

select?q=*:*&fq=content:PDF 

{ 
    "responseHeader":{ 
    "status":0, 
    "QTime":4, 
    "params":{ 
     "q":"*:*", 
     "indent":"on", 
     "fq":"content:PDF", 
     "rows":"50", 
     "wt":"json"}}, 
    "response":{"numFound":0,"start":0,"docs":[] 
    }} 

Wenn ich anderes Feld zum Beispiel unter Verwendung von Abfrage, title, dann habe ich das richtige Ergebnis:

select?q=*:*&fq=title:PDF 

{ 
    "responseHeader":{ 
    "status":0, 
    "QTime":3, 
    "params":{ 
     "q":"*:*", 
     "indent":"on", 
     "fq":"title:PDF", 
     "rows":"50", 
     "wt":"json"}}, 
    "response":{"numFound":1,"start":0,"docs":[ 
     { 
     "links":["http://www.education.gov.yk.ca/"], 
     "id":"doc1", 
     "last_modified":"2008-06-04T22:47:36Z", 
     "title":[" PDF Test Page"], 
     "content_type":["application/pdf"], 
     "author":"Yukon Canada Yukon Department of Education", 
     "author_s":"Yukon Canada Yukon Department of Education", 
     "content":[" \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n PDF Test Page \n \n \n \n \nPDF Test File \n \nCongratulations, your computer is equipped with a PDF (Portable Document Format) \nreader! You should be able to view any of the PDF documents and forms available on \nour site. PDF forms are indicated by these icons: or . \n \nYukon Department of Education \nBox 2703 \nWhitehorse,Yukon \nCanada \nY1A 2C6 \n \nPlease visit our website at: http://www.education.gov.yk.ca/\n \n \n \n \n "], 
     "_version_":1533049305513852928}] 
    }} 
+0

werden Sie bitte teilen die schema.xml abrufen ... –

Antwort

0

Überprüfen Sie Ihre schema.xml für die field type für Inhalte definiert field.

Vergleichen Sie den Feldtyp des Inhalts und Titelfeld.

Möglicherweise haben Sie nicht den richtigen Feldtyp für Ihren Feldinhalt definiert. Diese Feldtypen generieren kein Token für Ihren Text oder müssen den gesamten Text als einen Text betrachten. Dies geschieht im Fall, wenn Sie den Feldtyp keywordtokenizer oder string für Ihr Feld verwenden.

Sie können die Überprüfung der gleichen oder die Analyse in Solr Debugger-Tool überprüfen.

Hier können Sie überprüfen, wie der Text indexiert wurde und wie der Text gesucht wird.

Wenn Sie auf einen field suchen möchten, dann müssen Sie indexed=true das Attribut erwähnen und Sie wollen solr den Wert des gleichen zurückzukehren, dann müssen Sie stored=true hinzufügen.

Diese beiden attribute hilft Ihnen die Suche zu erreichen und den ursprünglichen Wert des Feldes

+0

Ich habe folgendes in Managed-Schema: und . Also sollte ich das indizierte Attribut für das Feld content auf true ändern und den Server neu starten? – user1563721

+0

Ich änderte es zu wahr und es gibt keine Änderung ... Ich bin immer noch nicht in der Lage, "Inhalt" Feld zu suchen. – user1563721

+0

Nach der Änderung .. Sie müssen den Server neu starten und die Daten neu zu indizieren. –