Ich habe einen Spider, der Daten abschabt, die nicht in einer Elementklasse gespeichert werden können.Scrapy, Python: Mehrere Item-Klassen in einer Pipeline?
Zur Veranschaulichung habe ich ein Profilelement, und jedes Profilelement kann eine unbekannte Anzahl von Kommentaren haben. Deshalb möchte ich Profil Item und Comment Item implementieren. Ich weiß, dass ich sie einfach mithilfe von Yield an meine Pipeline weitergeben kann.
Allerdings weiß ich nicht, wie eine Pipeline mit einer parse_item-Funktion zwei verschiedene Elementklassen behandeln kann?
Oder ist es möglich, verschiedene parse_item-Funktionen zu verwenden?
Oder muss ich mehrere Pipelines verwenden?
Oder ist es möglich, einen Iterator in ein Scrapy Item Field zu schreiben?
comments_list=[]
comments=response.xpath(somexpath)
for x in comments.extract():
comments_list.append(x)
ScrapyItem['comments'] =comments_list