Angenommen, Sie den folgenden Text haben:Spiel jedes nicht-Wort-Zeichen (ohne diakritische Zeichen)
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam Lorem! nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At Lorem, vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
Und Sie wollen mit der Einschränkung, jede „Lorem“ Schlüsselwort übereinstimmen, dass es nicht eine Teil eines Wortes sein muss . Ich Überprüfung Deshalb bin, wenn es endet/beginnt mit einem leeren oder wenn es das Ende/Anfang der Zeichenfolge, mit:
/(^|\s)(lorem)(?=\s|$)/gmi
Das funktioniert gut. Ich möchte jedoch diese Funktionalität erweitern, um auch Übereinstimmungen zu finden, die mit jedem Sonderzeichen wie ,
oder %
enden (nicht auf diese beschränkt) und nicht nur mit Leerzeichen. Das Problem, das ich damit habe, ist, dass es keine Zeichenklasse zu Sonderzeichen zu geben scheint und ich kann \w
oder \W
nicht verwenden, da sie auch diakritische Zeichen als Nicht-Wort-Zeichen (auch wenn sie Wort sind) Figuren).
Also frage ich mich, wie man das erreicht !? Gibt es eine Möglichkeit, den Bereich für jedes Nicht-Wort-Zeichen anzugeben, das keine diakritischen Zeichen enthält?
Beachten Sie, dass ich kein RegExp Extender-Plugin verwenden kann, um die Suche mit Unicode-Unterstützung zu ermöglichen.
Beispiel für meine Situation: Demo.
Erfüllt '\ blorem \ b' Ihre Bedürfnisse? –
Nein, da es nicht mit diakritischen Zeichen kompatibel ist. Siehe diesen Thread: http://stackoverflow.com/questions/2881445/utf-8-word-boundary-regex-in-javascript – user3292653
@ user3292653 Bitte geben Sie uns eine Liste, was Sie als "Sonderzeichen" betrachten. Zum Beispiel, wäre '-' oder' · 'oder' .' oder '_' ein Wortzeichen oder ein Nichtwortzeichen? – Laurel