2016-07-08 12 views
-2

Ich folgte dem Tutorial unter site, das detailliert, wie Sie Text-Klassifizierung auf dem Film-Dataset mit CNN durchführen. Es verwendete den Filmüberprüfungsdatensatz, um positive und negative Bewertungen zu finden.Wie finden Sie die wichtigsten Funktionen, die während Deep Learning mit CNN gelernt wurden?

Meine Frage ist, gibt es eine Möglichkeit, die wichtigsten erlernten Features aus dem Modell zu finden? Hat Tensorflow/Theano dafür Unterstützung?

Danke!

+0

Es gibt keine Unterstützung dafür, da das Finden der wichtigsten Funktionen etwas ist, das Sie selbst implementieren müssen und Teil des Modells ist. –

Antwort

1

Ein Wort der Warnung: Wenn Sie die Klassifizierung zurück zu bestimmten Eingabefunktionen verfolgen können, ist es durchaus möglich, dass CNN das falsche ML-Paradigma für Ihre Anwendung ist. Die meiste Textverarbeitung verwendet RNN, Bag-of-Word, Bi-Grams und andere einfache lineare Kombinationen.

Die Struktur eines CNN ist im Allgemeinen gegensätzlich zur Identifizierung der Bedeutung einzelner Merkmale. Aufgrund der verschiedenen nichtlinearen Schichten ist es selten möglich, ein Merkmal als wichtig herauszustellen; vielmehr bilden die Kombinationen von Eingaben kleine Inferenzstrukturen, die sich dann zu komplexeren Strukturen falten, bis die endgültige Ausgabe von einer Reihe von Nachbarschaftsbeziehungen, Cut-Offs, Poolings und anderen Elementen gesteuert wird.

Aus diesem Grund ist die Rückwärtsausbreitung für die Ausführung von CNNs so wichtig: Die Kausalitätskette ist nicht. Andernfalls würden wir den Prozess auf ein einfaches lineares NN mit einer versteckten Ebene reduzieren.

Wenn Sie analysieren möchten, was passiert, versuchen Sie, Ihre Zwischenschichten zu visualisieren. Dazu gibt es verschiedene Module; Versuchen Sie zum Beispiel, nach "+ theano + visualize + CNN -news" zu suchen (das letzte ist, die stark frequentierten Verweise auf Cable News Network zu entfernen). Es gibt viele Beispiele in der Bildverarbeitung; wir werden nicht wissen, wie sehr es Ihrer Textverarbeitung helfen könnte, bis Sie es versuchen.