Ich muss Wörter in einer riesigen Textdatei zählen, aber vorher muss ich die Datei von Sonderzeichen in einer bestimmten Weise reinigen.Entfernen Sie Sonderzeichen vom Anfang und Ende eines Wortes, während Sie die Wörter in einer Datei zählen
Zum Beispiel -
;xyz --> xyz
xyz: --> xyz
xyz!) --> xyz!
Ich verwende flatMap() alle Wörter auf Raum zu teilen. Und dann versuche ich die Sonderzeichen zu entfernen, die nicht funktionieren. Bitte helfen Sie! Hier
ist der Code, ich verwende ---
Die Zeichen zu entfernen sind: -; ! ?().
>>> input = sc.textFile("file:///home/<...>/Downloads/file.txt")
>>> input2 = input.flatMap(lambda x: x.split())
>>> def remove(x):
if x.endsWith(':'):
x.replace(':','')
return x
elif x.endsWith('.'):
x.replace('.','')
return x
. .
>>> input3 = input2.map(lambda x: remove(x))
Warum funktioniert es nicht? Bitte posten Sie, was Sie versucht haben. –
Im dritten Beispiel "!" Charakter ist kein spezielles Zeichen? – EbraHim
Können Sie definieren, was Sonderzeichen sind? – Saleem