Also wollte ich Statuten von dieser Website kratzen: Python Web Scraping mit BeautifulSoup, wie kommt es, meine Ausgabe-Datei den Inhalt dreimal mit unterschiedlichem Format ausdrucken?
I https://www.dropbox.com/s/2l41o1eubutwanh/outflieFS.txt?dl=0: http://www.leg.state.fl.us/Statutes/index.cfm?App_mode=Display_Statute&URL=0000-0099/0001/0001.html
konnte ich die Ausgabe in eine txt
Datei schreiben, die Ausgabe drei verschiedene Formate jedoch ausgedruckt, wie hier gezeigt Ich bin nicht gut in der Formatierung der Ausgabe. Könnte es etwas falsch mit meiner write
Aussage sein, oder wo mache ich mich falsch?
mein Code:
from bs4 import BeautifulSoup
import urllib2
f = open('C:\Python27\projects\outflieFS.txt','w')
def First_part(url):
thepage = urllib2.urlopen(url)
soupdata = BeautifulSoup(thepage,'html.parser')
return soupdata
soup = First_part("http://www.leg.state.fl.us/statutes/index.cfm?App_mode=Display_Statute&URL=0000-0099/0002/0002.html")
tableContents = soup.find('div', {'id': 'statutes' })
for data in tableContents.findAll('div'):
data = data.text.encode("utf-8","ignore")
data = str(data)+ "\n\n"
f.write(data)
f.close()
Bitte poste deine Ausgabe nicht als Bild :) – Signal
Mein Fehler, ich habe es in einen Dropbox-Link geändert – CHballer
Wie soll das Ausgabeformat aussehen? – bmcculley