TensorFlow-Reset-Status während Stapelverarbeitung = Sprachmodell auf Satzebene

Welcher ist der beste Weg, ein rekursives Sprachenmodell (z. B. LSTM) zu erstellen, das keine Satzgrenzen überschreitet? Oder allgemeiner ausgedrückt: Wie können Sie den Zustand nach dem Lesen jedes einzelnen Satzes wiederherstellen, wenn Sie dem Modell einen Stapel zur Verfügung stellen, wobei jede Zeile mehrere Sätze enthält? Gibt es ein spezielles Token, das Sie für das Modell angeben können?TensorFlow-Reset-Status während Stapelverarbeitung = Sprachmodell auf Satzebene

Danke!

Quelle

2016-07-29 niefpaarschoenen

Wenn die Sätze unabhängig sind, wäre es sauberer, wenn jede Zeile im Stapel nur einen Satz enthält. Anschließend können Sie den Status des LSTM nach jedem Stapel zurücksetzen, wie in den Antworten auf this question erläutert.

Quelle

2016-12-20 09:56:13

TensorFlow-Reset-Status während Stapelverarbeitung = Sprachmodell auf Satzebene

Antwort

Verwandte Themen