2009-06-06 11 views
1

Also ich bin auf der Suche nach Ideen, wie Sie die Funktionalität am besten auf digg replizieren. Im Wesentlichen senden Sie eine URL Ihrer Seite von Interesse, digg dann crawl das DOM, um alle IMG-Tags (wahrscheinlich nur einige, die über einer bestimmten Höhe/Breite sind) zu finden und dann erstellt ein Miniaturbild von ihnen und fragt Sie, welche Sie möchten Ihre Einreichung darstellen.Replizieren Digg's Image-Vorschläge von übermittelte URL mit PHP

Während dort viel los ist, interessiert mich hauptsächlich die beste Methode, um die Bilder von der eingereichten Seite zu erhalten.

Antwort

1

Während Sie versuchen könnten, die Webseite zu analysieren, kann HTML so ein Durcheinander sein, dass Sie am besten mit etwas nahem aber unvollkommenem wären.

  1. Extrahieren Sie alles, was wie eine Image-Tag-Referenz aussieht.
  2. Probieren Sie die URL
  3. prüfen zu holen, wenn Sie
  4. zurück

einfach ein Bild bekommen suchen und den Inhalt von src Erfassung = „...“ würden Sie dort ankommt. Einige grundlegende Manipulationen, um mit relativen und absoluten Bildreferenzen umzugehen, und Sie sind da.

Offensichtlich jedes Mal, wenn Sie ein Web-Asset auf Abruf von einer dritten Partei holen, müssen Sie darauf achten, dass Sie nicht missbraucht werden.

0

Ich schlage vor, cURL + regexp.

0

Sie können auch PHP Simple HTML DOM Parser verwenden, mit dem Sie alle Bild-Tags durchsuchen können.

+0

Schön. Erinnert mich an PHPQuery (nach jQuery modelliert). Dies scheint jedoch genauer zu sein. Danke für den Vorschlag. – Sampson

+0

Vielleicht nicht gut, aber schnell ;-) – Shoban