2016-06-02 8 views

Antwort

2

sind hier drei Möglichkeiten:

  1. Crop die längeren Artikel.
  2. Pad die kürzeren Artikel.
  3. Verwenden Sie ein rekurrentes neuronales Netzwerk, das Eingaben variabler Länge natürlich unterstützt.
+0

Will Option 1 und 2, um die ursprüngliche Bedeutung der Gegenstände beeinflussen nach dem Schneiden oder Polsterung? – Fiong

+0

Wahrscheinlich schneiden wird (nicht so viel Polsterung), aber müssen Sie wirklich einen ganzen Nachrichtenartikel lesen, um den Kern davon zu bekommen? Wie nachteilig das Schneiden ist, hängt von Ihrer Aufgabe ab. –

+0

In Bezug auf 3, ich denke, es ist wahr, wenn Sie eine Sequenz zu sequenzieren Problem, wie Pos-Tagging. Bei der Sequenzmarkierung, wie Sentimentanalyse oder Emotionserkennung, glaube ich, dass Sie in Keras Trunking/Padding durchführen müssen, um RNN für die Sequenzmarkierung zu verwenden. – pedrobisp