2016-07-26 22 views
-2

Ich verwende einige Regex, um Leerzeichen aus einem Text in JavaScript zu entfernen. Die aktuelle Regex sieht wie folgt aus:JavaScript Entfernen von Copyright-Zeichen aus dem Text

var cleaned_plaintext = website_content; 

cleaned_plaintext = cleaned_plaintext.toLowerCase(); 
cleaned_plaintext = cleaned_plaintext.replace(/(\0\r\n|\n|\r|\0)/gm," "); 
cleaned_plaintext = cleaned_plaintext.replace(/\s+/g," "); 
cleaned_plaintext = cleaned_plaintext.replace(/[...\(\)]/g,""); 
cleaned_plaintext = cleaned_plaintext.replace(/[…]/g,""); 
cleaned_plaintext = cleaned_plaintext.replace(/[:!?.,={-}]/g," "); 
cleaned_plaintext = cleaned_plaintext.replace(/\s+/g," "); 

Die obige regex tut ziemlich gut in den meisten weißen Räumen Reinigung aber sagen, ich habe Symbole wie diese

© 

Wie kann ich die mit Regex entfernen? alle Tipps auch Reinigung, dass es schlanker oben regex zu machen, schneller, etc ....

+0

Vielleicht wird ausdrücklich, was Sie –

+0

entfernen möchten Was Sie denken, ' /[...\(\)]/ g' Übereinstimmungen? Wie auch immer, die zwei grundlegenden Optionen, die Sie haben, sind: (1) listet alle Zeichen auf, die Sie entfernen möchten, (2) listet alle Zeichen auf, die Sie * nicht entfernen wollen. – nnnnnn

Antwort

-2

einfach das Symbol direkt verwenden:

'©'.replace('©', ''); 
+1

Dies wird nur 1 Instanz des Zeichens entfernen. –

-1

Sie können auch Sie können \ w, auf diese Weise verwenden finden "kein Wort caracter", einschließlich white Spaces Sie dazu folgende Möglichkeiten:

'test %%% © º§§§§§@@@@@ ;OK%'.replace(/[^\w]/g,'') 

das Ergebnis:

"testOK" 

Edit:

Wenn Sie die weißen Flecken halten möchten, können Sie diese verwenden:

'test %%% © º§§§§§@@@@@ ;OK%'.replace(/[^a-zA-Z\d\s:]/g,' ') 

Ergebnis:

"test      OK "