Es scheint unmöglich zu sein, eine exakte Phrasenübereinstimmung auf Milliarden von Dokumenten zu machen, wie machen Suchmaschinen das?Wie genau stimmen Suchmaschinen Millionen von Wörtern (oder Milliarden von Dokumenten) überein?
Meine einzige Vermutung ist, dass sie nicht wirklich eine echte exakte Wortgruppe übereinstimmen. Sie haben einen Wortindex, der jedes Dokument zurückgibt, das ein bestimmtes Wort enthält, und dann wählen sie Wörter aus der "exakten Phrase" heraus und überschneiden die Wortlisten. Zum Beispiel, wenn ich nach "cut down Baum" auf Google eine Seite suche, die ich bekomme, ist How to Cut Down a Tree auf Instructables, aber nirgendwo auf dieser Seite gibt es den genauen Ausdruck "Baum". Das nächste ist "Cut Down a Tree", was eine andere Phrase ist. Also, anscheinend macht Google nicht wirklich eine exakte Phrasenübereinstimmung, nur ein Pseudo-Match.
Also, macht eine echte genaue Übereinstimmung unmöglich mit einem großen Korpus?
Google hat genau passendes Wort verwendet * genau *, ohne Gehäuse und einige Buchstaben ohne Buchstaben, bis vor ein paar Jahren oder weniger (und es war eine bessere Suchmaschine ~ 2010 und früher, für mich sowieso). Ich habe es bemerkt, weil ich dieses Feature viele Jahre lang intensiv genutzt habe. Sie verwenden nicht die gleichen Methoden wie früher. Sie haben genaue Phrasenabgleiche fallen lassen und tun jetzt Annäherungen: https://www.searchenginejournal.com/google-apply-close-variant-keyword-matching-exact-phrase-keywords/114067/ – Shule
Also, wie auch immer, tue ich nicht wissen, wie sie * es * benutzt haben, aber es war nicht unmöglich. Ich könnte mir vielleicht einige Möglichkeiten vorstellen, aber ich habe nicht viel Erfahrung mit so etwas; Also, ich mache das alles nicht zur Antwort. – Shule