Ich versuche LinkedIn zu kratzen, um die aktuellen und Bildungselemente (Diese Informationen sind öffentlich zugänglich) von jedem Benutzerprofil zu erhalten. Nach dem Ausführen dieses Codes kann ich jedoch nicht die benötigten Informationen abrufen, sondern leere Klammern [].Scraping Linkedin mit Python gibt nur '' [] 'zurück
https://www.linkedin.com/in/bryan-engelhardt-a099204b Dies ist die genaue Verbindung i in diesem Moment bin mit und von hier aus möchte ich die folgenden Informationen in der Lage sein zu kratzen: "Current-College of the Holy Cross" und "Education-University of Iowa"
Mein Code ist ziemlich einfach:
from lxml import html
import requests
response = requests.get('https://www.linkedin.com/in/bryan-engelhardt-a099204b')
data = html.fromstring(response.text)
print(data.xpath('//title/text()')) #looks for title and prints it
print(data.xpath('//*[@id="topcard"]/div[1]/div/div/table/tbody/tr[1]/td/ol/li/span/a/text()')) # using a direct xpath
print(data.xpath('//*[@id="topcard"]/div[1]/div/div/table/tbody/tr[2]/td/ol/li/a/text()'))
Die Ausgabe sieht wie folgt aus:
C:\Python34\python.exe "C:/Users/Holy Cross - Summer/Desktop/python/scrape/scrape1.py"
[]
[]
[]
Process finished with exit code 0
ich bin nicht sicher, warum seine Rückkehr, dass als Antwort wie ich das mit anderen Websites versucht habe und erfolgreiche Ergebnisse bekommen habe. Es könnte sein, dass LinkedIn versucht, mich daran zu hindern, diese Informationen zu bekommen, und wenn es so ist, wie kann ich es umgehen?
Vielleicht durch Drucken der Antwort beginnen? –
Druckantwort gibt mir. Ich gehe davon aus, dass linkedin mir den Zugriff auf ihre Informationen verweigert und somit [] zurückbringt. Wie komme ich da rum? –
Haben Sie die Antwort gelesen? –