2016-07-25 36 views
1

Kann mir jemand die wichtigsten Vor- und Nachteile der bekanntesten Data-Mining-Tools erklären?Welches Datamining-Tool verwenden?

Überall lese ich, dass Rapidminer, Weka, orange, KNIME die besten sind. look at this blog post

Kann jemand einen schnellen technischen Vergleich in einer kleinen Aufzählung machen.

Meine Bedürfnisse sind die folgenden:

  • Es sollte Klassifikationsalgorithmen (Naive Bayes, SVM, C4.5, kNN) unterstützen.
  • Es sollte einfach in Java zu implementieren sein.
  • Es sollte verständliche Dokumentation haben.
  • Es sollte Referenzproduktionsprojekte oder Anwendungsfälle arbeiten in.
  • einige zusätzliche Benchmark-Vergleich, wenn möglich.

Vielen Dank!

+0

Fragen zur Software und Bibliothek Empfehlungen gefragt sind Wegthema auf Stackoverflow. –

+0

Ich frage nach Erfahrung und Leistungsvergleich. Was erwartest du? – user2670818

+0

Fragen askikng über das Schreiben von besserem Code. –

Antwort

1

Ich möchte zuerst sagen, es gibt Pro und Kontra für jeden von ihnen auf Ihrer Liste, aber ich würde vorschlagen, aus Ihrer Liste weka aus meiner persönlichen Erfahrung ist es unglaublich einfach in Ihrer eigenen Java-Anwendung mit dem Weka-Glas zu implementieren Datei und verfügt über eigene Tools für Data Mining.

Rapid Miner scheint eine kommerzielle Lösung zu sein, die eine End-to-End-Lösung bietet, aber die bemerkenswerteste Anzahl von Beispielen für externe Implementierungen von Lösungen für Rapid Miner sind normalerweise in Python und R-Skript nicht Java.

Orange bietet Tools, die in erster Linie auf Menschen mit möglicherweise weniger Bedarf für benutzerdefinierte Implementierungen in ihre eigene Software ausgerichtet sind, aber eine viel einfachere Zeit mit Benutzer-Itnaction, es ist in Python geschrieben und Quelle ist verfügbar, Benutzer-Addons werden unterstützt.

Knime ist eine weitere kommerzielle Plattform bietet End-to-End-Lösungen für Data Mining und Analyse bietet alle erforderlichen Tools, dieses hat verschiedene gute Bewertungen rund um das Internet, aber ich habe es genug verwendet, um Sie oder jemand auf die Vor- oder Nachteile zu beraten davon.

Sehen Sie hier für knime vs weka

Best data mining tools

Wie ich sagte weka mein persönlicher Favorit als Software-Entwickler ist, aber ich bin sicher, dass andere Menschen haben unterschiedliche Gründe und Meinungen darüber, warum man über den anderen zu wählen. Hoffe, dass Sie die richtige Lösung für Sie finden.

auch nach Ihren Wünschen weka unterstützt Folgendes:

Naivebayes

SVM

C4.5

KNN

+1

ja, großartig. Vielen Dank! Ich persönlich benutze auch WEKA, aber um zu beweisen, warum es besser ist als andere, bin ich mir da nicht ganz sicher. Deshalb war ich interessiert, ob jemand die Leistung oder den Unterschied zwischen Algorithmenimplementierung und API-s für die Entwicklung vergleicht – user2670818

+0

Nachdem Sie herumgelesen haben, um Ihre Frage zu beantworten, ist es wirklich schwer, eine klare und präzise Aufschlüsselung der Leistung zwischen all diesen Data Mining zu finden Tools/Plattformen, die eigentlich aus vielen Gründen wirklich nützlich wären ... hoffentlich sollten wir sehen, dass mehr Dienste in Zukunft eine Aufschlüsselung liefern, aber ich fand das ... was marginal hilfreich war .. http://www.predictiveanalyticstoday.com was, wenn Sie durch suchen, gibt sehr grobe Bewertungen, aber besser als nichts, ich denke ... Sowieso imo, wenn Sie Weka verwendet haben und Erfahrung damit wahrscheinlich am leichtesten kleben bleiben, bis Sie einen Grund finden – D3181