ich eine Klasse definiert Blöcke von Tweets zu behandeln, damit ich sie ein wenig gelänge einfacherKlasse nicht funktionierende Methoden richtig
class twitter_block(object):
def __init__(self):
self.tweets = []
self.df = pd.DataFrame()
self.tag = ''
def load(self, data):
self.tweets = [x for x in data]
dann ein Verfahren als Teil einer Pipeline definiert:
def clean(self):
HTTP_PATTERN = '^https?:\/\/.*[\r\n]*'
AT_PATTERN = '@\w+ ?'
# tke away links
self.tweets = [re.sub(HTTP_PATTERN, '', str(x), flags=re.MULTILINE) for x in self.tweets]
# take away @ signs
self.tweets = [re.sub(AT_PATTERN,'',str(x)) for x in self.tweets]
aber Wenn ich dies anrufe:
gibt es die 1504 Tweets, die ich in das Blockobjekt geladen habe, wie zuvor, keine clea Links oder irgendetwas. Obwohl, eigentlich ist der @ -Zeichen entfernen ... aber diese Methode,
def smilecheck(self):
#save a tweet if there is a smiley there
smiley_pattern = '^(:\(|:\))+$'
for tweet in self.tweets:
if re.match(smiley_pattern, str(tweet)):
pass
else:
self.tweets.remove(tweet)
entfernt nicht das Tweets ohne smileys, kehrt 1504 Tweets, das gleiche wie ich in setzen ... irgendwelche Hilfe Jungs? Ich bin sicher, das ist ein Problem mit der Art und Weise bin ich näher Objekte
Ist das Ihre tatsächliche Vertiefung oder haben Sie es richtig transkribieren gescheitert? Bitte reproduzieren Sie Ihren Einzug sorgfältig, da schlecht eingerückter Python-Code Unsinn ist. – khelwood