Das Problem mit einer Scrapping-Lösung von craigslist ist, dass sie automatisch jede IP-Adresse blockieren, die auf sie zugreift - was normalerweise mehr als ein paar hundert Mal pro Tag bedeutet. Sobald dein Tool irgendeine Popularität erlangt hat, wäre es abgeschaltet worden.
Deshalb ist die einzige craigslist Suchseiten, die entweder Frames (wie searchtempest.com und crazedlist.org) oder google (wie allofcraigs.com) verwendet haben.
Was 3 taps ist craigslist Auflistung von Drittanbieter-Quellen in freier Wildbahn sammeln - Dinge wie die Google-und Bing-Caches zum Beispiel.
Bearbeiten: Diese Antwort ist nicht mehr auf dem neuesten Stand. Die meisten Kleinanzeigen-Suchmaschinen, die Ergebnisse von craigslist enthalten, verwenden jetzt Google Custom Search oder ähnliche Lösungen von Yahoo oder Bing. SearchTempest verwendet beides.Allofcraigs ist jetzt adhuntr und nutzt Google. Crazedlist ist heruntergefahren.
Ich wollte nur ein Update zu diesem Thema hinzufügen. Es scheint, dass ein Bundesrichter im Jahr 2013 festgestellt hat, dass die Umgehung eines IP-Blocks (speziell durch craigslist) die CAFA verletzt: http://en.wikipedia.org/wiki/Computer_Fraud_and_Abuse_Act#Notable_cases_and_decisions_referring_to_the_Act hic sunt dracones –
Traurig, aber wahr. Schauen Sie sich an, wie Craigslist (Art von) 3Taps heruntergefahren: http://en.wikipedia.org/wiki/Craigslist_Inc._v._3Taps_Inc. –
Ähnliche Fragen von 2015 - http://opendata.stackexchange.com/q/5883/1511 – philshem