Seit ich gefragt habe, wie man html mit Regex parsen und ein bisschen zerschlagen wird (zu Recht), habe ich HTML::TreeBuilder, , HTML::TokeParser und HTML::Elements Perl-Module studiert.Wie kann ich den Inhalt eines div mit Perls HTML-Modulen finden, wenn ich ein Tag darin kenne?
Ich habe HTML wie folgt aus:
<div id="listSubtitlesFilm">
<dt id="a1">
<a href="/45/subtitles-67624.aspx">
.45 (2006)
</a>
</dt>
</div>
ich die /45/subtitles-67624.asp
analysieren wollen, aber noch wichtiger ist Ich möchte wissen, wie Sie den Inhalt des div parsen.
ich dieses Beispiel auf einer früheren Frage gegeben wurde:
while (my $anchor = $parser->get_tag('a')) {
if (my $href = $anchor->get_attr('href')) {
#http://subscene.com/english/Sit-Down-Shut-Up-First-Season/subtitles-272112.aspx
push @dnldLinks, $1 if $href =~ m!/subtitle-(\d{2,8})\.aspx!;
}
Das perfekt dafür gearbeitet, aber wenn ich es ein wenig zu bearbeiten versucht und es auf ein verwenden `` div` es nicht funktioniert . Hier ist der Code, den ich versucht:
ich diesen Code versucht, mit:
while (my $anchor = $p->get_tag("dt")) {
if($stuff = $anchor->get_attr('a1')) {
print $stuff."\n";
}
}
Entschuldigung! aktualisiert es! – Codygman
Welches Modul verwenden Sie eigentlich? Sie erwähnen wie fünf in Ihrer Frage, es gibt nicht so etwas wie HTML :: TreeParser, und Ihr Code sieht nicht so aus wie für HTML :: TreeBuilder ... – hobbs
Ich benutze HTML :: TokeParser :: Simple .. Entschuldigung für die Verwirrung – Codygman