2010-11-23 9 views
1

Ich bin in Google AdSense bot Algorithmus und Verhalten mit Website interessant. Ich habe nicht mit AdSense gearbeitet und habe kein Konto. So brauche ich Ihre Hilfe zu verstehen:Google AdSense Bot Algorithmus und Verhalten

1) Gbot lädt von Zeit zu Zeit alle Seiten von der Website. Habe ich recht?

2) Gbot nicht verstehen dynamischen Inhalt (geladen von Ajax). Also muss ich statischen Inhalt erzeugen und ihn innerhalb der html Seite zurückgeben und diese Seiten müssen den identischen Inhalt für alle Benutzer und für Gbot zeigen?

3) Wegen (1) und (2) kann ich nicht nur Root-Pfad http://example.com mit einigen "Haupt" Widget verwenden. Ich muss eindeutige Seiten zum Beispiel http://example.com/thread?id=101 erzeugen?

4) Gbot lädt Seiten (1) herunter, um Stichwörter von ihnen zu greifen (Indexierung) und dann (auf ihren Servern) diese Informationen zum Beispiel nach Schlüssel/Wert zu speichern (wo Schlüssel Seitenpfad ist, Wert ist Tag Cloud). Habe ich recht?

5) Wenn die Website im Browser vom Benutzer geöffnet wurde. Integrierter HTML-AdSense-Code lädt etwas JavaScript. Wie ich durch "googeln" verstehe, indexiert diese Seite nicht JavaScript, sondern ruft (mit einem Parameter key == page_path) auf Googles Server auf und erhält entsprechende Anzeigenlinks. Dann werden diese Anzeigenlinks in ihrem Rahmen angezeigt. Ist es richtiges Verhalten? Vielleicht macht JavaScript eine lokale Indexierung des Seiteninhalts?

6) Wie funktioniert Gbot und AdSense-JavaScript mit Cookies? Soweit ich weiß, kann AdSense Cookies verwenden, um entsprechende Anzeigenlinks anzuzeigen. Wenn es richtig ist, bitte geben Sie mir einige Anwendungsfälle;)

Ich weiß, dass "wahre" Algorithmus nur von Ingenieuren von Google bekannt ist. Aber einige von Ihnen hatten Erfahrung mit AdSense und AdSense html/javascript. Bitte korrigieren Sie meine Vision davon;)

Vielen Dank für einen Ratschlag !!!

P.S. Diese Frage ist sehr wichtig für mich. Es ist keine Frage zum Spaß! Also Bitte schließen es nicht;)

Antwort

3

1) Ja, wenn Googlebot auf die Seiten zugreifen kann, und wenn er weiß, über die Seiten über einen Link, XMLSitemaps, Google +1 usw.

2) Googlebot wird nun machen AJAX/XHR fordert AJAX-Inhalte zu verstehen (http://googlewebmastercentral.blogspot.com/2011/11/get-post-and-safely-surfacing-more-of.html).

Ja, Sie sollten Googlebot die gleichen Inhalte zeigen wie Benutzer, ansonsten würde dies als Cloaking betrachtet, was gegen ihre Richtlinien verstößt.

3) Diese Frage ist nicht klar. Grundsätzlich ist es jedoch besser, wenn sich die URL ändert, da Google dann weiß, wie der Inhalt separat indexiert wird. Wenn Sie AJAX verwenden, sollten Sie möglicherweise Permalinks wie von Ihnen vorgeschlagen verwenden oder HTML5 popstate verwenden.

4) Ja, Google indiziert die Wörter auf der Seite. Ich bin mir nicht sicher, dass sie es als Schlüssel/Wert-Paar speichern. Ich bin mir nicht einmal sicher, ob sie immer noch Big Table (http://labs.google.com/papers/bigtable.html) verwenden ... aber wahrscheinlich verwenden sie Big Table oder ein ähnliches System, um den invertierten Index zu speichern .

5) Der AdSense-Code ist eingebettetes Javascript ... für neue Webseiten, die Google vorher nicht gesehen hat, versucht es, die relevantesten Anzeigen basierend auf den Informationen im Internet über die Website oder möglicherweise durch Anker zu liefern Text von Links, die auf diese Seite zeigen.Um jedoch einen besseren Einblick in den Inhalt der Seite zu erhalten, sendet Google einen Adsense-spezifischen Bot, um Ihre Seite zu crawlen. Manchmal sehen Sie, dass es sehr schnell geht, sogar sobald Sie die Seite für die erste Seite laden Zeit. Es verwendet einen anderen Benutzeragenten als den herkömmlichen Googlebot. Sie finden hier alle Benutzeragenten von Google (http://www.google.com/support/webmasters/bin/answer.py?answer=1061943)

6) Die Crawler von Google akzeptieren keine Cookies und geben keine Cookies an Ihren Server zurück. Es hat mit der massiv verteilten Art von Google-Crawlern zu tun, die Cookies oder Sitzungen extrem schwierig macht.