eine Datei wie folgt gegeben:Wie erfasst man alle Regex-Gruppen in einem Regex?
# For more information about CC-CEDICT see:
# http://cc-cedict.org/wiki/
A A [A] /(slang) (Tw) to steal/
AA制 AA制 [A A zhi4] /to split the bill/to go Dutch/
AB制 AB制 [A B zhi4] /to split the bill (where the male counterpart foots the larger portion of the sum)/(theater) a system where two actors take turns in acting the main role, with one actor replacing the other if either is unavailable/
A咖 A咖 [A ka1] /class "A"/top grade/
A圈兒 A圈儿 [A quan1 r5] /at symbol, @/
A片 A片 [A pian4] /adult movie/pornography/
ich, dass ein JSON-Objekt aufbauen wollen:
- Sprunglinien, die mit
#
- Pausen Linien in 4 Teile beginnt
- Tradition Zeichen (erstreckt sich vom Start
^
bis zum nächsten Leerzeichen) - vereinfachten Zeichen (Span von dem ersten Raum zu dem zweiten)
- Pinyin (Span zwischen den eckigen Klammern
[...]
) - der Glanz Raum zwischen den ersten
/
bis zum letzten/
(man beachte, gibt es Fälle, in denen es innerhalb von Schrägstrichen sein können der Glanz, z/adult movie/pornography/
- Tradition Zeichen (erstreckt sich vom Start
Ich bin derzeit als solche zu tun:
>>> for line in text.split('\n'):
... if line.startswith('#'): continue;
... line = line.strip()
... simple, _, line = line.partition(' ')
... trad, _, line = line.partition(' ')
... print simple, trad
...
A A
AA制 AA制
AB制 AB制
A咖 A咖
A圈兒 A圈儿
A片 A片
Um die [...]
, ich zu tun hatte:
>>> import re
>>> line = "A片 A片 [A pian4] /adult movie/pornography/"
>>> simple, _, line = line.partition(' ')
>>> trad, _, line = line.partition(' ')
>>> re.findall(r'\[.*\]', line)[0].strip('[]')
'A pian4'
Und die /.../
zu finden, hatte ich zu tun:
>>> line = "A片 A片 [A pian4] /adult movie/pornography/"
>>> re.findall(r'\/.*\/$', line)[0].strip('/')
'adult movie/pornography'
Wie verwende ich Regex-Gruppen, um alle von ihnen auf einmal zu erfassen, was mehrere Partitionen/Splits/Fundall?
i spät bin party..so werde ich es als Kommentar setzen: - https://regex101.com/r/uO0yS1/1 – rock321987
Danke allen für die tollen Antworten !! – alvas