2016-07-11 9 views
-1

Ich möchte Kommentare von Dawn.com sowie von Tribune.com von jedem Artikel extrahieren. Die Art, wie ich Kommentare extrahiere ist, die Klasse <div class="comment__body cf"> auf Dawn während class = "content" auf Tribune.comWie generisch Kommentare von verschiedenen Websites extrahieren?

Wie kann ich es generisch? Es bedeutet, dass es auf diesen Websites kein ähnliches Muster gibt, durch das dies von einer Klasse erreicht werden kann.

Soll ich für jede Website einen eigenen Code schreiben?

+0

Eine Klasse, die den Kommentar in Ihrem Format darstellt, aber die Methode zum Abrufen muss je nach Website unterschiedlich sein. Ich verstehe nicht, was ist das Problem hier? – CodeMonkey

+0

Es bedeutet, dass es keine generische Möglichkeit gibt, auf Kommentare von allen Websites zuzugreifen, die einen Code verwenden (unter Verwendung desselben Klassennamens für alle Websites mit anderen Worten generische Methode)? Wir müssen es verschiedenen Klassennamen auf verschiedenen Websites geben. – user3787092

+0

Sie müssen mit verschiedenen Websites mit unterschiedlichen zugrunde liegenden Strukturen leben. Die Benutzeroberfläche für die Art und Weise, wie Sie mit den Kommentaren umgehen, sollte jedoch generisch sein. Vielleicht könntest du über die Abhängigkeitsinjektion nachlesen. Sie übergeben den website-spezifischen Parsing-Code an Ihre Klasse, die alles was Sie mit Ihren Kommentaren tun möchten, verarbeitet. – CodeMonkey

Antwort

2

Alle Websites verwenden unterschiedliche html, um die Ansichten und ihre Kommentare darzustellen. Sie müssen für jede Site verschiedene Crawler implementieren. Sie können auch eine Bibliotheksdatei erstellen, um die generischen Funktionen beizubehalten und einige triviale Funktionen nicht zu wiederholen.