Wow, viele Vermutungen! Ich hoffe, ich trinke das Wasser nicht zu sehr, indem ich nicht auch rate.
Die Auto-Complete-Box wird im Wesentlichen von Freebase Suggest gespeist, die ihrerseits vom Freebase Search-Dienst versorgt wird. Zeichenfolgen, die durch den Suchdienst zum Vergleichen indiziert werden, umfassen: 1) den Namen, 2) alle Aliase in der gegebenen Sprache, 3) Verknüpfungstext aus den zugehörigen Wikipedia-Artikeln und 4) Kennungen (von Freebase als Schlüssel bezeichnet), die Dinge enthalten wie Wikipedia Artikel Titel (und Weiterleitungen).
Wie die verschiedenen Dinge gewichtet/verstärkt werden, wurde nicht bekannt gegeben, aber Sie können ein Gefühl dafür bekommen, indem Sie damit spielen. Wie Sie anhand der API sehen können, gibt es auch die Möglichkeit, Filterung/Gewichtung nach Typen und anderen Kriterien vorzunehmen, was je nach Kontext zum Tragen kommen kann. Wenn Sie beispielsweise einem Album ein Plattenlabel hinzufügen, erhalten Themen, die als Datensatzlabels eingegeben wurden, eine Anhebung im Vergleich zu Dingen, die dies nicht tun (Sie können jedoch auch andere Arten von Objekten für den Anwendungsfall verwenden) wo für Ihr Zielthema nicht der passende Typ angewendet wurde.
Das gibt Ihnen einen kleinen Einblick, wie ihr Dienst funktioniert, aber warum nicht einen Suchdienst erstellen, der was Sie braucht brauchen, da Sie sowieso von Grund auf neu starten?
BTW, Pre-Google die Metaweb-Suche Implementierung wurde auf Lucene, so dass Sie definitiv schlechter als die Verwendung als Ausgangspunkt verwendet werden könnte. Sie können einige der Details in der mailing list archive
lesen Wird dies effizient sein für Fälle, in denen das Ziel nicht das erste Wort ist? zB: "Apo Hiking Society" wo "Hiking" das 2. Wort ist – stackOverlord
Naja, ich denke, es ist etwas anderes als Lexikographie.Genau wie Google seine eigenen Kriterien für die Bestellung von Ergebnissen hat. Dies scheint eher eine semantische Suche zu sein. –