Ich versuche ein Klassifikationsproblem zu lösen. Es scheint, dass viele klassische Ansätze einem ähnlichen Paradigma folgen. Trainieren Sie also ein Modell mit einem Trainingssatz, und verwenden Sie es, um die Klassenbezeichnungen für neue Instanzen vorherzusagen.Feedback oder Verstärkung beim maschinellen Lernen verwenden?
Ich frage mich, ob es möglich ist, einen Feedback-Mechanismus in das Paradigma einzuführen. In der Steuerungstheorie ist die Einführung einer Rückkopplungsschleife ein effektiver Weg, um die Systemleistung zu verbessern.
Momentan ist mir klar, dass wir zuerst mit einer Reihe von Instanzen beginnen und ein Modell mit ihnen trainieren. Jedes Mal, wenn das Modell eine falsche Vorhersage trifft, fügen wir die falsche Instanz in den Trainingssatz ein. Das ist anders als das Trainings-Set blind zu vergrößern, weil es mehr Targeting ist. Dies kann als eine Art negatives Feedback in der Sprache der Kontrolltheorie angesehen werden.
Gibt es Forschungsergebnisse zum Feedback-Ansatz? Könnte jemand etwas Licht werfen?
Schauen Sie nach oben, das ist im Grunde, was Sie beschreiben. –
Sollte es zu http://stats.stackexchange.com/ migriert werden? – sashkello
smwikipedia: Ich bin nach genau dem gleichen Problem. http://stackoverflow.com/questions/36068292/incorporating-user-feedback-in-a-ml-model. Möchten Sie Ihre Ergebnisse teilen? –