2016-06-30 22 views
4

I Links haben wie folgt aussiehtWegbeschreibung Text von span-Tag in BeautifulSoup

<div class="systemRequirementsMainBox"> 
<div class="systemRequirementsRamContent"> 
<span title="000 Plus Minimum RAM Requirement">1 GB</span> </div> 

Ich versuche 1 GB zu bekommen von dort. Ich versuchte

tt = [a['title'] for a in soup.select(".systemRequirementsRamContent span")] 
for ram in tt: 
    if "RAM" in ram.split(): 
     print (soup.string) 

Es gibt None aus.

Ich versuchte a['text'], aber es gibt mir KeyError. Wie kann ich das beheben und was ist mein Fehler?

+0

Können Sie das teilen umgebende HTML? (oder die URL) –

+0

@PadraicCunningham Ja, nur eine min bitte – GLHF

+0

Versuchen Sie auch 'supp.select_one (" span [title * = RAM] "). Text' und wenn Sie über die Liste iterieren Sie bereits den Text –

Antwort

8

Sie einen CSS-Selektor verwenden können, die Spanne Ziehen Sie den Titeltext möchten mit:

soup = BeautifulSoup("""<div class="systemRequirementsMainBox"> 
<div class="systemRequirementsRamContent"> 
<span title="000 Plus Minimum RAM Requirement">1 GB</span> </div>""", "xml") 

print(soup.select_one("span[title*=RAM]").text) 

dass die Spanne mit einem Titel Attribut findet, die RAM enthält, ist es gleichwertig Sprechen in Python, if "RAM" in span["title"].

Oder mit finden mit re.compile

import re 
print(soup.find("span", title=re.compile("RAM")).text) 

alle Daten zu erhalten:

from bs4 import BeautifulSoup 
r = requests.get("http://www.game-debate.com/games/index.php?g_id=21580&game=000%20Plus").content 

soup = BeautifulSoup(r,"lxml") 
cont = soup.select_one("div.systemRequirementsRamContent") 
ram = cont.select_one("span") 
print(ram["title"], ram.text) 
for span in soup.select("div.systemRequirementsSmallerBox.sysReqGameSmallBox span"): 
     print(span["title"],span.text) 

die Ihnen:

000 Plus Minimum RAM Requirement 1 GB 
000 Plus Minimum Operating System Requirement Win Xp 32 
000 Plus Minimum Direct X Requirement DX 9 
000 Plus Minimum Hard Disk Drive Space Requirement 500 MB 
000 Plus GD Adjusted Operating System Requirement Win Xp 32 
000 Plus GD Adjusted Direct X Requirement DX 9 
000 Plus GD Adjusted Hard Disk Drive Space Requirement 500 MB 
000 Plus Recommended Operating System Requirement Win Xp 32 
000 Plus Recommended Hard Disk Drive Space Requirement 500 MB 
+0

Btw Ich probierte 'supp.select_one (" span [title * = Space] ") .text' auf diesem um 500 MB zu bekommen. < 500 MB</span><div class="systemRequirementsTickOrCross"></div> 'aber es druckt' HDD Space', das verstehe ich nicht warum. – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/4302226/">GLHF</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">können Sie einen Link zur HTML/URL hinzufügen? Ich denke, es gibt möglicherweise einen anderen Spannentitel, der den Text Raum – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">enthält. Oh gut, weil es Span-Tags mit Disk gibt und ihre Texte 'HDD Raum' sind. Wie kann ich darauf hinweisen, dass ich nur Span-Tags im Link des Spiels haben möchte? – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/4302226/">GLHF</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048381"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Letzte Frage </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://de.uwenku.com/question/p-wyugyfmx-en.html" target="_blank" title="Python 3: Wie testet man Ausnahmen innerhalb mit?"> Python 3: Wie testet man Ausnahmen innerhalb mit? </a> </li> <li class="side_article_list_item"> 2. <a href="http://de.uwenku.com/question/p-zdlllvey-et.html" target="_blank" title="XML - XSL zur Auswahl bestimmter Knoten und Ausgang horizontal"> XML - XSL zur Auswahl bestimmter Knoten und Ausgang horizontal </a> </li> <li class="side_article_list_item"> 3. <a href="http://de.uwenku.com/question/p-qtdudwmb-es.html" target="_blank" title="Funktionen einstellen zu Onclick für Buttons innerhalb von Schleifen mit Strings in HTML/Javascript"> Funktionen einstellen zu Onclick für Buttons innerhalb von Schleifen mit Strings in HTML/Javascript </a> </li> <li class="side_article_list_item"> 4. <a href="http://de.uwenku.com/question/p-btyquicu-er.html" target="_blank" title="Vergewissern Sie sich, dass ipconfig angewendet wurde"> Vergewissern Sie sich, dass ipconfig angewendet wurde </a> </li> <li class="side_article_list_item"> 5. <a href="http://de.uwenku.com/question/p-weypqpwn-dn.html" target="_blank" title="inverse fft mit Matlab funktioniert nicht"> inverse fft mit Matlab funktioniert nicht </a> </li> <li class="side_article_list_item"> 6. <a href="http://de.uwenku.com/question/p-fionetss-dy.html" target="_blank" title="Rendern in eine Cubemap-Textur mit einem Framebuffer"> Rendern in eine Cubemap-Textur mit einem Framebuffer </a> </li> <li class="side_article_list_item"> 7. <a href="http://de.uwenku.com/question/p-vggmywjt-dz.html" target="_blank" title="Lesen der Microsoft Exchange E-Mail in C#"> Lesen der Microsoft Exchange E-Mail in C# </a> </li> <li class="side_article_list_item"> 8. <a href="http://de.uwenku.com/question/p-svjjqaqt-eb.html" target="_blank" title="Ausführen von TestNG-Methoden direkt in IntelliJ"> Ausführen von TestNG-Methoden direkt in IntelliJ </a> </li> <li class="side_article_list_item"> 9. <a href="http://de.uwenku.com/question/p-cvlaotqt-ec.html" target="_blank" title="Wählen Sie ein untergeordnetes Element von SoapException.Detail.InnerXML"> Wählen Sie ein untergeordnetes Element von SoapException.Detail.InnerXML </a> </li> <li class="side_article_list_item"> 10. <a href="http://de.uwenku.com/question/p-gkwqedqq-em.html" target="_blank" title="Validieren Passwort in Einzeltextfeld Swift"> Validieren Passwort in Einzeltextfeld Swift </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Verwandte Themen</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item">Keine verwandten Themen^_^</li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://de.uwenku.com/contact">Sprechen Sie uns an</a></li> <li>© 2020 DE.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>