Ich wollte die Bildunterschrift bekommen, nein. von Likes und Kommentaren der letzten 10 Bilder eines bestimmten Benutzers. Mit dem unten stehenden Code kann ich nur das Neueste bekommen.Scraping on Python
Code:
from selenium import webdriver
from bs4 import BeautifulSoup
import json, time, re
phantomjs_path = r'C:\Users\ravi.janjwadia\Desktop\phantomjs-2.1.1-windows\bin\phantomjs.exe'
browser = webdriver.PhantomJS(phantomjs_path)
user = "barackobama"
browser.get('https://instagram.com/' + user)
time.sleep(0.5)
soup = BeautifulSoup(browser.page_source, 'html.parser')
script_tag = soup.find('script',text=re.compile('window\._sharedData'))
shared_data = script_tag.string.partition('=')[-1].strip(' ;')
result = json.loads(shared_data)
print(result['entry_data']['ProfilePage'][0]['user']['media']['nodes'][0]['caption'])
Ergebnis: LAST CALL: Geben Sie für eine Chance, Präsident Obama in diesem Sommer vor heute Abend Frist einzuhalten. → Im Profil verlinken.
Getting this: TypeError: Liste Indizes müssen Ganzzahlen sein, nicht str – Ravi
Mein schlechtes. Ich habe meine Antwort bearbeitet. Lass es mich wissen, wenn die aktualisierte Antwort funktioniert :) –
Danke. Es funktioniert perfekt – Ravi