2016-06-15 16 views
-1

mein Wissen mit Regex begrenzt ist und ich versuche, den Text des folgenden Satzes zu halten, aber die Sonderzeichen wie Bindestriche entfernen:Regex für alphanumerische Zeichen, sondern auch andere Alphabete wie Chinesisch, Japanisch, Kyrillisch

Λένα & Πλάτωνος - Red Axes Remixes 
Sugai Ken 鯰上 - On The Quakefish 

Wer weiß, wie man mit verschiedenen Alphabeten umgeht? Ich versuchte ([^\w'])+, aber es entfernt die wesentlichen Zeichen ...

Danke!

+0

Welchen PL verwendest du? Dieses Thema hilft Ihnen vielleicht [http://stackoverflow.com/questions/1716609/how-to-match-cyrillic-characters-with-a-regular-expression](http://stackoverflow.com/questions/1716609/how -anzupassen-kyrillisch-Zeichen-mit-einem-regulären-Ausdruck) – morels

+0

Hängt von der Regexaroma/Programmiersprache/Werkzeug ab. Probieren Sie '[^ \ p {L} \ p {M} '] +' –

+0

Ich benutze Nodejs in einer Jade-Vorlage – silveur

Antwort

0

Man könnte so etwas wie dies versucht:

`[^ \ x00- \ x1F \ x21- \ x7F] *

Dies sollte etwas nicht in dem regulären ASCII-Zeichensatz und Raum passen. Sie können das aktualisieren, um alle anderen regulären ASCII-Zeichen einzuschließen, die Sie einschließen möchten. Wie Sie sehen können, habe ich 1 Bereiche, so dass es das 'Leerzeichen' Zeichen enthält.

Offensichtlich könnte man umgekehrt gehen und ein integratives Spiel tun, ist es einfacher, umfassen die genauen Zeichen machen zum Spiel:

`[\ x80- \ x {FFFF} &] *