Ich möchte die Benutzerseiten von SO kratzen, um den Besitzern meiner Symbolleiste die aktualisierten Informationen über ihre Fragen/Antworten/etc ...So führen Sie einen Hintergrund laden und Scraping einer Seite mit XUL/Firefox Extension
Das bedeutet, ich muss dies im Hintergrund tun, analysieren Sie die Seiten, extrahieren Sie den Inhalt, vergleichen Sie es mit dem letzten Lauf und präsentieren Sie dann die Ergebnisse entweder auf der Symbolleiste oder der Statusleiste oder alternativ in einem Popup-Fenster irgendeiner Art. Und all das muss getan werden, während der Benutzer seinen Geschäften nachgeht, ohne unterbrochen zu werden oder sogar auf SO zu sein.
Ich habe ziemlich gründlich sowohl auf Google als auch auf dem Mozilla Wiki nach einer Art Hinweis gesucht. Ich bin sogar soweit gegangen, ein paar andere Erweiterungen herunterzuladen, von denen ich denke, dass sie das Gleiche tun. Leider hatte ich nicht die Zeit, alle und die, die ich angeschaut habe, alle Daten APIs (Services, WebServices, XML) zu verwenden, nicht HTML-Verschrottung.
Alter Fragetext
Ich bin ein schönes Plätzchen suchen zu lernen, wie ich eine Seite in einer Funktion laden genannt kaufen den berüchtigten set_timeout() ein Screen-Scraping im Hintergrund zu verarbeiten.
Meine Idee ist es, die Ergebnisse von solchen Scraping in einer Statusleiste zu präsentieren, nur für den Fall, dass etwas aus dem letzten Lauf geändert wird.
Gibt es eine versteckte Überlagerung oder eine andere Täuschung?
könnte die resultierende "Seite" dann als DOM-Objekt verwendet werden? –
Ich habe versucht, dies in meinem Schnitt zu beantworten. –