2016-04-07 7 views
-4

Ich habe es schon seit Stunden versucht.
Ich brauche die verknüpfbare Textbedeutung, den gesamten Text von einer Webseitenquelle, die zwischen <a href> und </a> liegt, mit Ausnahme der anderen Tags, die zwischen den <a> Tags verschachtelt sind.
Beispiel:regex, um verknüpfbaren Text zu bekommen

<a href="blabla.net">THIS TEXT 
<img src="hhh.jpg" />   THIS TEXT TOO 
       <span> ALSO THIS TEXT. </span>AND ALSO THIS TEXT</a> 
+0

Also, was hast du schon probiert? – Cylian

+1

Welche Sprache verwenden Sie? –

Antwort

0

Sie einen einfachen regulären Ausdruck mit einer nicht gierig Gruppe verwenden: es

<[aA]\b[^\>]*>([\w\W]*?)<\/[aA]> 

Sie können testen, auf dieser Seite von F12 schlagen dann die Eingabe

$(document.body).html().match(/<a\b[^\>]*>([\w\W]*?)<\/a>/ig) 
+0

Das stimmt nicht überein, wenn innerhalb des Links Tags vorhanden sind –

+0

@PoulBak Haben Sie es getestet? Tun Sie es einfach auf dieser Seite und Sie werden sehen, dass es funktioniert. –

+0

Nicht wenn mehrere Zeilen vorhanden sind. Außerdem möchte er nicht, dass die Tags img und span zurückgegeben werden, nur der Text. –

0

Sie können den folgenden regulären Ausdruck versuchen, der den Text zwischen Tags in vier Gruppen zurückgibt:

(?<=>)[^<]+?(?=<) 

Es entfernt Tags aus dem Text.