1

Wenn ich mit Caffe spiele, beobachte ich, dass wir mehrere Verlustschichten in der Prototxtdatei haben können.
Ich glaube, dass Caffe den Gradienten aus dem kombinierten Verlust berechnen und verwenden wird, um die Gewichte des Netzwerks anzupassen.
Ist das korrekt?Caffe mit mehreren Verlustschichten

Antwort

4

Ja.
Wenn Sie genau hinsehen, werden Sie feststellen, dass Verlustschichten einen Parameter loss_weight haben, der Gesamtverlust (der für die Rückausbreitung abzuleiten ist) ist die Summe der Mehrfachverluste.

+0

Hallo, hast du schon mal mit dem Parameter versucht? Seine Schemata von loss_weight ähneln denen von Deeply-Supervised Nets-Papier. Ist es richtig? – user8264