Wie behandelt man Web-Crawler in Django?

Ich habe eine Menge Fehler erhalten, die an meine E-Mail-Adresse gesendet wurden, weil Web-Crawler Teile meiner Site ohne jegliche Anfragedaten überfielen. Ich fragte mich, wie man in Django am besten mit Web-Crawlern umgehen kann. Soll ich eine Umleitung vornehmen, wenn ich auf ein leeres QueryDict stoße?Wie behandelt man Web-Crawler in Django?

Quelle

2010-12-18 john m.

Sie könnten die Implementierung eines robots.txt in Erwägung ziehen, um zu verhindern, dass Crawler auf Bereiche Ihrer Website zugreifen, die nur für Menschen gedacht sind, z. B. Formulare.

Quelle

2011-05-24 23:33:33 jathanism

-1

Gut erzogene Crawler sollten nur GET-Anfragen ausführen. Formulare sollten alles andere als GET-Anforderungen sein.

Ruby und Rails verwendet CRUD Mapping

Create -> POST, 
READ -> GET, 
Update -> PUT, 
Delete -> DELETE

Nur Dinge, ohne zusätzliche Informationen sein GET-Anfragen sollten.

Quelle

2010-12-18 20:36:54 EnabrenTane

"Formulare sollten alles andere als GET-Anfragen sein" -> Was ist mit '

Sollte entmutigt werden. Schauen Sie auf der Twitter-Homepage nach, ob es GET-Formulare gibt. – EnabrenTane

Mein Crawler benutzt immer DELETE .../s – titaniumdecoy

Ich denke, Ihre Ansichten sollten mit jeder Anfrage funktionieren, auf der Listenrückseite mit der Meldung "Falsche Anfrage". 500 ist hässlich. Sind Sie sicher, dass der Benutzer die Seite nicht ohne Anfragedaten öffnet? Die "get" -Methode von QueryDict kann bei Standardwerten helfen.

Quelle

2010-12-18 21:12:16 Alerion

Antwort

Verwandte Themen