Ich habe mit Python Regex für eine Weile kämpfen versucht, Absätze in einem Text übereinstimmen, aber ich war nicht erfolgreich. Ich muss die Anfangs- und Endpositionen der Absätze erhalten.Wie passen einen Absatz mit Regex
Ein Beispiel für einen Text:
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod
tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At
vero eos et accusam et justo duo dolores et ea rebum.
Stet clita kasd gubergren,
no sea takimata sanctus est Lorem ipsum dolor sit amet.
Ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod
tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At
vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,
no sea takimata sanctus est Lorem ipsum dolor sit amet.
In diesem Beispielfall würde ich mag separat die Absätze alle mit Lorem, Stet und Ipsum bzw. (ohne Leerzeilen) beginnen lassen. Hat jemand eine Idee, wie man das macht?
Gibt es einen Grund, warum Sie wollen, dies zu tun mit Regex? Für etwas so Einfaches wie das Aufteilen von durch Doppel-Zeilenumbruch getrennten Absätzen könnten Sie einfach 'paragraph.split ('\ n \ n')' –
verwenden. Ich interessiere mich für die Anfangs- und Endpositionen der Absätze, nicht für die tatsächlichen Zeichenfolgen. Ich hätte das erwähnen sollen. –