2016-07-29 6 views
1

Welcher ist der beste Weg, ein rekursives Sprachenmodell (z. B. LSTM) zu erstellen, das keine Satzgrenzen überschreitet? Oder allgemeiner ausgedrückt: Wie können Sie den Zustand nach dem Lesen jedes einzelnen Satzes wiederherstellen, wenn Sie dem Modell einen Stapel zur Verfügung stellen, wobei jede Zeile mehrere Sätze enthält? Gibt es ein spezielles Token, das Sie für das Modell angeben können?TensorFlow-Reset-Status während Stapelverarbeitung = Sprachmodell auf Satzebene

Danke!

Antwort

0

Wenn die Sätze unabhängig sind, wäre es sauberer, wenn jede Zeile im Stapel nur einen Satz enthält. Anschließend können Sie den Status des LSTM nach jedem Stapel zurücksetzen, wie in den Antworten auf this question erläutert.