Ich habe eine Reihe von Büchern Objekten, classs Buch wie folgt definiert ist:Java Textklassifikation Problem
Class Book{
String title;
ArrayList<tags> taglist;
}
Wo Titel den Titel des Buchs ist, Beispiel: Javascript für Dummies.
und taglist ist eine Liste von Tags für unser Beispiel: Javascript, jQuery, "Web-Entwickler", ..
Wie gesagt ein eine Reihe von Büchern haben sprechen über verschiedene Dinge: IT, Biologie, Geschichte, ... Jedes Buch hat einen Titel und eine Reihe von Tags beschreiben, es ..
ich automaticaly diese Bücher in voneinander getrennten Gruppen thematisch zu klassifizieren haben, Beispiel:
es Bücher:
- Java für Dummies
- Javascript für Dummies
- Erfahren Sie in 30 Tagen blinken
- C++ Programmierung
Geschichtsbücher:
- Weltkriege
- Amerika im Jahr 1960
- Martin Lebens Luther King
BIOLOGIE BOOKS:
- ....
Sie weiß, dass ihr ein Klassifikationsalgorithmus/Methode für diese Art von Problemen zu bewerben?
Eine Lösung ist eine externe API zu verwenden, um die Kategorie des Textes zu definieren, aber das Problem hier ist, dass Bücher in verschiedenen Sprachen sind: Französisch, Spanisch, Englisch ..
Ja, aber es sind einige häufige Tags zwischen den Büchern :( – Youssef
Verwandte Frage: http://stackoverflow.com/questions/2781752/naive-bayesian-for-topic-detection-using-bag-of-words-approach/2783356#2783356 – dmcer
nett Danke (y) – Youssef