2016-06-14 15 views
0

Ich möchte 10.000 Tweet in Twitter zu crawlen, enthalten ein bestimmtes Wort mit Hashtag.twitter crawling hashtag mit api für die Verwendung von Python

zum Beispiel enthalten Hashtag, #love wie folgt.

und crawlen alle Hashtag in Tweet.

zum Beispiel existiert ein Tweet so.

[i bin schläfrig #boring #tired #sleep]

und ich möchte Daten kriechen, und sehen, wie dies zur Folge haben.

"#boring" "#tired" "#sleep"

erwarte ich zu verstehen, was ich sage.

Ich habe versucht, Hashtag mit twitter API für Python zu crawlen.

aber es gibt einige Fehler

meinen Code im Anschluss an diese:

from tweepy.streaming import StreamListener 
from tweepy import OAuthHandler 
from tweepy import Stream 

#Variables that contains the user credentials to access Twitter API 
access_token = "mytoken" 
access_token_secret = "mytokenscret" 
consumer_key = "consumerkey" 
consumer_secret = "consumersecret" 

class StdOutListener(StreamListener): 

    def on_data(self, data): 
     print data 
     return True 

    def on_error(self, status): 
     print status 


if __name__ == '__main__': 

    l = StdOutListener() 
    auth = OAuthHandler(consumer_key, consumer_secret) 
    auth.set_access_token(access_token, access_token_secret) 
    stream = Stream(auth, l) 
    stream.filter(track=['#happy']) 

, wenn ich diesen Code ausführen, gibt es Pop-up wie diese. enter image description here

wie ich das beheben, und crawlen tweet alle hashtag, die tweet enthalten bestimmte hashtag.

Ich versuchte Python 3.3.4 und Windows 8.1 64x.

bitte helfen Sie mir.

danke zum Lesen meiner Frage.

+1

Haben Sie sich die Fehlermeldung überhaupt angesehen? Sie fehlen buchstäblich Klammern in Call 'print' – Keatinge

+0

@Keatinge Ich verwechsle das mit der Druckfunktion Python 2.x und 3.x mein Fehler Danke für Ihren Kommentar! –

Antwort

1

Wie es scheint, dass Sie Python 3.0 verwenden und so können Sie print "Hello world" nicht verwenden, müssen Sie print("Hello world") verwenden, so ändern Sie Ihre Druckaufrufe, um Klammern zu haben.

+0

danke ich irre wie dumm. Vielen Dank –

+0

Jederzeit! Glückliche Codierung =] –