2016-04-16 13 views
0

ich eine Seite mit XML haben, die wie folgt aussieht: obenPHP get img src von xml

<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"> 
    <channel> 
    <title>FB-RSS feed for Salman Khan Fc</title> 
    <link>http://facebook.com/profile.php?id=1636293749919827/</link> 
    <description>FB-RSS feed for Salman Khan Fc</description> 
    <managingEditor>http://fbrss.com (FB-RSS)</managingEditor> 
    <pubDate>31 Mar 16 20:00 +0000</pubDate> 
    <item> 
     <title>Photo - Who is the Best Khan ?</title> 
     <link>https://www.facebook.com/SalmanKhanFns/photos/a.1639997232882812.1073741827.1636293749919827/1713146978901170/?type=3</link> 
     <description>&lt;a href=&#34;https://www.facebook.com/SalmanKhanFns/photos/a.1639997232882812.1073741827.1636293749919827/1713146978901170/?type=3&#34;&gt;&lt;img src=&#34;https://scontent.xx.fbcdn.net/hphotos-xap1/v/t1.0-0/s130x130/11059765_1713146978901170_8711054263905505442_n.jpg?oh=fa2978c5ecfb3ae424e9082aaa057b8f&amp;oe=57BB41D5&#34;&gt;&lt;/a&gt;&lt;br&gt;&lt;br&gt;Who is the Best Khan ?</description> 
     <author>FB-RSS</author> 
     <guid>1636293749919827_1713146978901170</guid> 
     <pubDate>31 Mar 16 20:00 +0000</pubDate> 
    </item> 
    <item> 
     <title>Photo</title> 
     <link>https://www.facebook.com/SalmanKhanFns/photos/a.1636293813253154.1073741825.1636293749919827/1713146755567859/?type=3</link> 
     <description>&lt;a href=&#34;https://www.facebook.com/SalmanKhanFns/photos/a.1636293813253154.1073741825.1636293749919827/1713146755567859/?type=3&#34;&gt;&lt;img src=&#34;https://scontent.xx.fbcdn.net/hphotos-xap1/v/t1.0-0/s130x130/12294686_1713146755567859_6728330714340999478_n.jpg?oh=6d90a688fdf4342f9e12e9ff9a66b127&amp;oe=57778068&#34;&gt;&lt;/a&gt;&lt;br&gt;&lt;br&gt;</description> 
     <author>FB-RSS</author> 
     <guid>1636293749919827_1713146755567859</guid> 
     <pubDate>31 Mar 16 19:58 +0000</pubDate> 
    </item> 
    </channel> 
</rss> 

Ich möchten die src s der img s im xml.

Die Bilder werden in der <description> jedoch gespeichert, sie sind nicht im Format von

<img...

sie eher wie folgt aussehen:

&lt;img src=&#34;https://scontent.xx.fbc....

die < wird durch &lt; ersetzt ... Ich denke, das ist der Grund, warum $imgs = $dom->getElementsByTagName('img'); nichts zurückgibt.

Gibt es irgendwelche Arbeit? Diese

ist, wie ich es nennen:

libxml_use_internal_errors(true); 
$dom = new DOMDocument(); 
$dom->loadXML($xml_file); 
$imgs = ...(get the imgs to extract the src...('img') ??; 

//Then run a possible foreach 
//something like: 

foreach($imgs as $img){ 

    $src= ///the src of the $img 

    //try it out 
    echo '<img src="'.$src.'" /> <br />', 
} 

Jede Idee?

Antwort

1

Sie haben HTML in XML-Tags eingebettet, Sie müssen also XML-Knoten abrufen, jeden HTML-Code laden und das gewünschte Tag-Attribut abrufen.

In Ihrem XML gibt es verschiedene <description> Knoten, so dass mehr als Ihre gewünschten Knoten zurückgibt. Verwenden Sie DOMXPath nur <description> Knoten in der rechten Baumposition abrufen:

$dom = new DOMDocument(); 
libxml_use_internal_errors(True); 
$dom->loadXML($xml); 
$dom->formatOutput = True; 

$xpath = new DOMXPath($dom); 
$nodes = $xpath->query('channel/item/description'); 

Dann durchlaufen alle Knoten, Lastknotenwert in einem neuen DOMDocument (keine Notwendigkeit, HTML-Entities zu dekodieren, DOM decodiert es bereits für Sie) und Extrakt src Attribut aus <img> Knoten:

foreach($nodes as $node) 
{ 
    $html = new DOMDocument(); 
    $html->loadHTML($node->nodeValue); 
    $src = $html->getElementsByTagName('img')->item(0)->getAttribute('src'); 
} 

eval.in demo

+0

Großartig! Scheint zu funktionieren .... Danke! – ErickBest