Ich trainiere ein Lernmodell für neuronale Netzwerke und bin ein wenig verwirrt darüber, wie man Hyperparameter einstellen kann.Wie Sie Hyper-Parameter mit Validierungsdaten abstimmen
Ich sehe den Trainingsprozess wie folgt:
- build neuronales Netz mit einigen hyper-Parameter (zB Anzahl der Neuronen in verborgenen Schicht)
- Update-Parameter unter Verwendung von Trainingsdaten
- Datennutzung Validierung zu bewerten wenn das Modell nicht über~~POS=TRUNC und ist die Verbesserung der
- Verwendung von Testdaten Leistung beurteilen
Mir wurde gesagt, dass Validierungsdaten auch verwendet werden, um Hyperparameter einzustellen. Ich verstehe nicht, wie dies zu tun ist, da Sie die Validierungsdaten verwenden nach Sie haben das Modell gebaut und trainiert. Ich kann einen Hyperparameter nicht ändern, weil das Modell bereits erstellt wurde.
Angenommen, ich habe 4 Hyper-Parameter, die die Architektur eines neuronalen Netzes angeben. Soll ich den gesamten Trainings- und Validierungsprozess für jede Hyperparameter-Kombination durchlaufen (4^4 Kombinationen)?
Danke
Neben der Optimierung können Sie den Validierungssatz für ein frühes Stoppen in der Trainingsphase verwenden, da bei jeder Iteration nicht nur der Zugverlust, sondern auch der Validierungsverlust berechnet wird. Wählen Sie dann die Parametereinstellungen, die den besten Validierungsverlust als endgültiges Modell für den Test ergeben haben. – Ash