Ich bekomme Form Mismatch Fehler auf FC-Schicht, wenn ich versuche, trainierte Netz in C++ zu laden. My Eingangsschicht in Zug/Prüfphase (unterscheiden sich nur durch die Quelle und die Chargengröße, sind einige params weggelassen):Form Mismatch beim Kopieren Gewichte von eigenen trainierten Netz in Caffe
layer {
type: "ImageData"
image_data_param {
batch_size: 8
new_height: 256
new_width: 256
}
transform_param {
crop_size: 227
}
}
Eingangsschicht zum Bereitstellen von:
layer {
type: "Input"
input_param { shape: { dim: 1 dim: 3 dim: 256 dim: 256 }}
}
Fehler:
Cannot copy param 0 weights from layer 'fc4'; shape mismatch. Source param shape is 8 26912 (215296); target param shape is 8 32768 (262144).
Ich fand this Antwort, aber mein eigenes Modell ist geschult und getestet. Könnten Sie etwas Licht auf dieses Thema werfen?
Ich würde erwarten, dass die Abweichung viel früher als ** fc4 ** erscheint. Können Sie Ihre Topologie veröffentlichen? – Prune
@Prune, wenn alle Layer vor 'fc4' 'Convolution'-Layer sind, dann gibt es kein Problem nur für den vollständig verbundenen Layer. – Shai
@Shai - richtig. Deshalb versuche ich mehr Informationen zu sammeln. Die Eingaben sind, soweit berichtet, gleich groß. Eine Reihe von CONV-Schichten würde keinen Fehler erzeugen. Nicht übereinstimmende Eingaben könnten/sollten jedoch den ersten CONV auslösen. – Prune