2016-05-08 15 views
3

Sagen wir ein Einkanal-Bild (5x5) habenWie erfolgt die Faltung mit RGB-Kanal?

A = [ 1 2 3 4 5 
     6 7 8 9 2 
     1 4 5 6 3 
     4 5 6 7 4 
     3 4 5 6 2 ] 

und ein Filter K (2x2)

K = [ 1 1 
     1 1 ] 

Ein Beispiel Faltung der Anwendung (lassen Sie uns das erste 2x2 von A nehmen) wäre

1*1 + 2*1 + 6*1 + 7*1 = 16 

Dies ist sehr einfach. Aber lassen Sie uns einen Tiefenfaktor in die Matrix A einführen, d. H. RGB-Bild mit 3 Kanälen oder sogar Conv-Schichten in einem tiefen Netzwerk (mit der Tiefe = 512 vielleicht). Wie würde die Faltungsoperation mit demselben Filter durchgeführt werden? Ein ähnliches Training wird für einen RGB-Fall sehr hilfreich sein.

Antwort

3

Sie werden genauso wie Sie mit einem einzelnen Kanal Bild, außer dass Sie drei Matrizen anstelle von einem erhalten werden. This ist eine Vorlesungsnotiz über CNN Grundlagen, die ich denke, könnte hilfreich für Sie sein.

+0

Hallo, wenn du 3 Matrizen sagst, meinst du, dass du ein Filter und ein Punktprodukt mit der ersten Matrix nimmst und es mit dem Filterpunktprodukt mit der zweiten Matrix summierst und es mit dem Filterdunkelprodukt summierst dritte Matrix? Dies gibt Ihnen dann einen einzelnen Wert für diesen Ort. Hab ich recht? – Desmond

0

Für RGB-ähnliche Eingänge ist der Filter tatsächlich 2 * 2 * 3, jeder Filter entspricht einem Farbkanal, was zu drei Filterantworten führt. Diese drei addieren sich zu einem Fluss, der durch Bias und Aktivierung fließt. schließlich ist dies ein Pixel in der Ausgabekarte.