Ich versuche, ein ähnliches Produkt mit LSH zu erstellen, und ich habe folgende Abfrage.Suche nach ähnlichen Produkten mit LSH auf strukturierten Daten
Meine Daten hat folgende Schema
id: long,
title: string,
description: string,
category: string,
price: double,
inventory_count: int,
active: boolean,
date_added: datetime
Sollte ich LSH zu den einzelnen Funktionen getrennt und dann kombinieren sie in irgendeiner Art und Weise durchführen, können gewichteter Durchschnitt sein?
oder
Soll ich über den Aufbau LSH auf alle gehen verfügt über alle zusammen (im Grunde Merkmalsnamen Befestigung während Schindeln wie title_iphone, title_nexus Erstellen price_1200.25, aktiv_1 ...) und dann mit Sack-of -Wörter Ansatz LSH auf dieser Tasche durchführen?
Wenn jemand mich zu einem Dokument verweisen kann, wo ich herausfinden kann, wie man LSH auf strukturierten Daten wie von E-Commerce durchführt, wird es groß sein.
P.S. Ich plane, Funken und Min-Hash-Funktion in LSH zu verwenden. Lassen Sie es mich wissen, wenn Sie weitere Informationen benötigen.