ich zur Zeit, wie unten gzipped Webseite lesen verwenden mechanisieren:Convert gzipped von urllib2 abgerufenen Daten in HTML
br = mechanize.Browser()
br.set_handle_gzip(True)
response = br.open(url)
data = response.read()
Ich frage mich, wie gzip-Daten von urllib2 zu HTML Text geholt zu entpacken?
req = urllib2.Request(url)
opener = urllib2.build_opener()
response = opener.open(req)
data = response.read()
if response.info()['content-encoding'] == 'gzip':
HOW TO DECOMPRESS DATA TO HTML
Sie können auch 'gzip.decompress (data)'. –
Dies funktioniert nicht wirklich in diesem Fall, wie in diesem Artikel erläutert: http://rationalpie.wordpress.com/2010/06/02/python-streaming-gzip-decompression/ so müssen Sie zlib anstelle von gzip verwenden – gabuzo
@ gabuzo Eigentlich betrifft dieser Artikel die _streaming_gzip-Dekomprimierung, die sich tatsächlich sehr von dem Thema dieser Frage unterscheidet, da hier speziell erwähnt wird, dass die Daten bereits abgerufen wurden, während Sie in einer Streaming-Situation dekomprimieren möchten, sobald Sie sie erhalten. –