2016-04-07 8 views
0

Ich möchte Daten Vorhersagealgorithmen auf Netzwerk-Daten verwenden. Also kann mir bitte jemand auf die richtige Richtung zeigen. welcher Algorithmus am effektivsten ist und wie man Daten auf diese Formeln anwendet.Wie können Datenvorhersagealgorithmen auf Netzwerkdaten angewendet werden?

+0

Willkommen bei [so]! Bitte lesen [fragen], das wird sich als nützlich erweisen. Ihre Frage, wie sie jetzt ist, wird als offtopic auf [so] angesehen. Versuchen Sie es zu bearbeiten, mit etwas Code, den Sie vielleicht ausprobiert haben. –

Antwort

0

Sie müssen genauer sein, wenn Sie eine detailliertere Antwort wünschen. Bis dahin, hier ist etwas, um Ihnen den Einstieg zu erleichtern.

Wenn Sie Netzwerkdaten sagen, das erste, was ich denke, ist Streams von Datenpaketen, Streams von Transaktionen und so. Diese erreichen normalerweise eine hohe Geschwindigkeit (zB können sie mehr als tausend pro Minute betragen), sind potentiell unendlich (alle Elemente passen nicht in ein Arbeitsgedächtnis; das Beste, auf das Sie hoffen können, ist ein sehr kleiner Teil der Elemente zu speichern), und normalerweise möchten Sie, dass Ihr Vorhersagemodell sich an die neuesten Beispiele anpasst, während Sie "kleine" Speicherkapazität verwenden.

Es ist verlockend zu sagen, dass wir ein Modell anhand einer Stichprobe von Daten lernen könnten. Das Modell, das Sie heute lernen, könnte jedoch in der nächsten Woche nicht mehr gültig sein - Sie möchten diese Änderungen erkennen und Ihr Modell kontinuierlich anpassen.

Es gibt einen ganzen Zweig des Data Mining für Szenarien dieses Typs; Es heißt Datenstrom Mining.

Je nachdem, was Sie vorhersagen wollen, schlage ich vor, dass Sie Data Stream Mining: A Practical Approach vom Team beraten, die MOA entwickelt (was für Massive Online-Analyse steht und ist, soweit ich weiß, den führenden Datenstrom Mining Toolbox); Ich empfehle auch die chapter on data stream mining aus dem Mining of Massive Data Sets Buch von Leskovec et al. Die Wiki article on data stream mining ist ein guter Ort, um nach weiteren Referenzen zu suchen.

+0

Vielen Dank für Ihre schnelle Antwort :) Ja, es ist mehr mit der Schnittstelle Bandwidth data.am verwandt, die lineare Regression oder Gradientenverstärkungsalgorithmen verwendet, um diese Daten zu analysieren und vorherzusagen, aber ich weiß nicht, wie man Interface History Records auf diese Formeln anwendet Hilfe dabei. – Manoj

+0

Warum versuchen Sie nicht zuerst einfache Methoden, wie "Dämpfung" Durchschnitt? Sie geben kürzlichen Werten höhere Gewichte und ignorieren im Grunde alte Werte. – blazs

+0

Suche nach "incremental Regression", es gibt umfangreiche Erklärungen zur Verfügung. Zum Beispiel: http://stats.stackexchange.com/questions/23481/are-there-algorithms-for-computing-running-linear-or-logistic-regression-param – blazs