Ein Wort der Warnung: Wenn Sie die Klassifizierung zurück zu bestimmten Eingabefunktionen verfolgen können, ist es durchaus möglich, dass CNN das falsche ML-Paradigma für Ihre Anwendung ist. Die meiste Textverarbeitung verwendet RNN, Bag-of-Word, Bi-Grams und andere einfache lineare Kombinationen.
Die Struktur eines CNN ist im Allgemeinen gegensätzlich zur Identifizierung der Bedeutung einzelner Merkmale. Aufgrund der verschiedenen nichtlinearen Schichten ist es selten möglich, ein Merkmal als wichtig herauszustellen; vielmehr bilden die Kombinationen von Eingaben kleine Inferenzstrukturen, die sich dann zu komplexeren Strukturen falten, bis die endgültige Ausgabe von einer Reihe von Nachbarschaftsbeziehungen, Cut-Offs, Poolings und anderen Elementen gesteuert wird.
Aus diesem Grund ist die Rückwärtsausbreitung für die Ausführung von CNNs so wichtig: Die Kausalitätskette ist nicht. Andernfalls würden wir den Prozess auf ein einfaches lineares NN mit einer versteckten Ebene reduzieren.
Wenn Sie analysieren möchten, was passiert, versuchen Sie, Ihre Zwischenschichten zu visualisieren. Dazu gibt es verschiedene Module; Versuchen Sie zum Beispiel, nach "+ theano + visualize + CNN -news" zu suchen (das letzte ist, die stark frequentierten Verweise auf Cable News Network zu entfernen). Es gibt viele Beispiele in der Bildverarbeitung; wir werden nicht wissen, wie sehr es Ihrer Textverarbeitung helfen könnte, bis Sie es versuchen.
Es gibt keine Unterstützung dafür, da das Finden der wichtigsten Funktionen etwas ist, das Sie selbst implementieren müssen und Teil des Modells ist. –