intelligente Web-Crawler mit maschinellem Lernen

Ich baue E-Commerce-Websiteintelligente Web-Crawler mit maschinellem Lernen

Problemstellung:

I Web-Seiten get product name, images and product specifications/features durchsuchen wollen, und speichern Sie es in meinem database

Eingang zur Maschine Lernalgorithmus:

Webseite mit HTML-Inhalt

Ausgabe von maschinellem Lernen erwartet algo:

Es sollte automatisch erkennen, ob es Produktdetailseite oder nicht
Wenn es Details Produktseite dann sollte es Produktkategorie
erkennen ist
Dann sollte es Produktname, Spezifikationen

analysieren

Frage

Welcher Algorithmus für diese Problemstellung geeignet wäre?

Kann jemand vorschlagen richtigen Ansatz zu folgen?

Quelle

2016-07-20 Akash Shinde

... und die Frage ist? – dratewka

@dratewka aktualisierte Frage, sorry dafür –

@AkashShinde haben Sie Lösung zu Ihrer Frage bekommen. – swan

Ich bin kein Experte in Machine Learning/Naturel Language Processing, aber mein Bauchgefühl sagt, es ist sehr schwierig, dies als ein ML-Produkt vollständig zu implementieren. Sehen Sie sich zunächst an, ob Ihre eCommercise-Websites eine Art API zum Extrahieren von Daten bereitstellen. Wenn solche APIs verfügbar sind, verwenden Sie diese, und das wird einfacher als ML sein.

Quelle

2016-07-20 09:16:15

https://www.diffbot.com/ diese Jungs machen es –

intelligente Web-Crawler mit maschinellem Lernen

Antwort

Verwandte Themen