Ich muss Thema Modellierung in einer bestimmten Anzahl von Dokumenten in R mit LDA tun.Thema Modellierung mit bereits bestehenden Themen
Ich habe n am meisten vorkommende Wörter für jeden von M Themen und ich möchte dies LDA füttern und wollen die meisten vorkommenden Thema erhalten (aus M Themen), die in jedem Dokument.
Kurz -
Eingang - X Dokumente, M Themen mit n Top-Wörter für jeden
Output - Top 2 auftretenden Themen aus M Themen in jedem Dokument.
Gibt es eine Möglichkeit, dies mit bereits vorhandenen Paket in R oder einer anderen Sprache zu erreichen.
Was sollte der Inhalt der Klassifikationsdatei sein? Können Sie bitte ein Tutorial für die Klassifikator-basierte Themenmodellierung vorschlagen? – Shubham
@Shubham: Versuchen Sie 'bin/mallet train-topics --help', das sollte Ihnen einen Überblick über die verschiedenen Ausgabedateien geben, die MALLET produzieren kann. – jknappen