2016-04-26 1 views
-2

Ich stieß auf . Basierend darauf habe ich den folgenden Code geschrieben. Der Code wird ausgeführt. Ich möchte einige zusätzliche Ergebnisse. Irgendwelche Vorschläge oder alternative Pakete, die Sie vorschlagen können? Ich schaffe word1, weil ich für "Eric Bledsoe"/Bigramm suchen möchten und nicht ("eric", "bledsoe")Python Web Scraping gnp Paket

import gnp 
word= 'eric bledsoe' 
word1='"' + word + '"' 
c = gnp.get_google_news_query(word1) 
#c = gnp.get_google_news_query("What's happening on earth") 
print (c) 
  1. Wie kann ich einen Zeitstempel (6 Stunden zurück, Apr 25, 2016 etc) das ist mit jeder Nachricht verbunden?
  2. Wie kann ich mich auf Nachrichten beschränken, die in den letzten 365 Tagen veröffentlicht wurden?
  3. Wie kann ich nur Top X Einträge nehmen? zum Beispiel möchte ich top sehen 1000 Ergebnisse nur? Wie kann ich durch 2,3,4 .... google news Seite navigieren?
+0

Bitte beschränken Sie sich auf eine Frage pro Beitrag. – MattDMo

+0

Bitte zeigen Sie mir die Regel, die besagt, dass ich nicht mehr als 1 Frage veröffentlichen kann, auch wenn sie sehr ähnlich sind (bezogen auf das gleiche Problem). – user2543622

+1

Nicht genau eine Regel, aber [hier] (https://stackoverflow.com/help/on-topic) ist es (Hervorhebung von mir): "Fragen, die ** zu breit sind **, unklar, unvollständig oder vor allem Meinungen- können von der Gemeinschaft aufgehalten werden, bis sie verbessert sind ". Wenn Sie mehrere Fragen pro Postkatze stellen, wird Ihre Frage als zu breit geschlossen. –

Antwort

1

Sie können nicht. Das Paket, das Sie verwenden, unterstützt keines dieser Dinge.

Im Allgemeinen rate ich Ihnen, dieses Paket zu vermeiden. Es ist von Natur aus fragil, da es auf der HTML-Ausgabe von Google News basiert und keine offizielle (oder sogar inoffizielle!) API verwendet. Es wird wahrscheinlich kaputt gehen, wenn Google seine News-Oberfläche neu gestaltet.

+0

Sie sind richtig @duskwuff. Das 'gnp'-Paket wurde für meinen Analysezweck erstellt und müsste überarbeitet werden, wenn Google das Nachrichtenlayout ändert. Es ist dem Benutzer überlassen, auf dem Paket für zusätzliche Funktionalität aufzubauen. – Manuel