2016-07-20 8 views
1

Ich baue E-Commerce-Websiteintelligente Web-Crawler mit maschinellem Lernen

Problemstellung:

I Web-Seiten get product name, images and product specifications/features durchsuchen wollen, und speichern Sie es in meinem database

Eingang zur Maschine Lernalgorithmus:

Webseite mit HTML-Inhalt

Ausgabe von maschinellem Lernen erwartet algo:

  • Es sollte automatisch erkennen, ob es Produktdetailseite oder nicht

  • Wenn es Details Produktseite dann sollte es Produktkategorie

  • erkennen ist

    Dann sollte es Produktname, Spezifikationen

analysieren

Frage

Welcher Algorithmus für diese Problemstellung geeignet wäre?

Kann jemand vorschlagen richtigen Ansatz zu folgen?

+0

... und die Frage ist? – dratewka

+0

@dratewka aktualisierte Frage, sorry dafür –

+0

@AkashShinde haben Sie Lösung zu Ihrer Frage bekommen. – swan

Antwort

0

Ich bin kein Experte in Machine Learning/Naturel Language Processing, aber mein Bauchgefühl sagt, es ist sehr schwierig, dies als ein ML-Produkt vollständig zu implementieren. Sehen Sie sich zunächst an, ob Ihre eCommercise-Websites eine Art API zum Extrahieren von Daten bereitstellen. Wenn solche APIs verfügbar sind, verwenden Sie diese, und das wird einfacher als ML sein.

+0

https://www.diffbot.com/ diese Jungs machen es –