1

Ich habe einen Datensatz von einem Videospiel Untertitel in Englisch und Französisch und die Audio-Dateien für die englischen Untertitel nur. In den englischen Untertiteln sind in ihnen Stille angegeben, die ihrer jeweiligen Audiodatei entsprechen. Beispiel:Machine Learning Ansatz zum Hinzufügen von Stille zu übersetzten Untertiteln

[Silence 3] Some narrated text goes here. [Silence 2] Some more text goes here. 

(Die 3 in [Stille 3] steht für die Dauer der Stille).

Meine Aufgabe, ein Programm zu bieten, die das Schweigen zu den Französisch Untertitel hinzufügt, so dass ich ausgeben kann:

[Silence 3] Certains textes narratifs vont ici. [Silence 2] Un peu plus de texte va ici. 

Ich habe bereits die Antworten für die Französisch Untertitel, die soll ich verwenden, um die überprüfen Wirksamkeit meines Algorithmus. Ich dachte daran, einen maschinellen Lernansatz unter Verwendung der bereits gegebenen Antwort zu machen, um meinen Algorithmus zu lehren, aber ich bin mir nicht sicher, was der beste Typ von Algorithmus wäre, oder ob dies der Weg ist, in diesem Fall zu gehen. Ich finde auch keine Verwendung für die Audiodateien. Was wäre der beste Weg, dieses Problem anzugehen?

Edit: Nicht alle Sätze verhalten sich wie das Beispiel, das ich früher gab, manchmal ist die Stille in der Mitte eines Satzes.

Antwort

0

Wenn ich Sie wäre, würde ich über maschinelles Lernen Ansatz vergessen und teilen Sie den Text in Sätze.

Ergreifen Sie die entsprechende Übersetzung, und fügen Sie an geeigneten Stellen Stille ein (nach Position 2 und 3).

+0

Die Sache ist, das ist mein letztes Jahr Projekt, so würde ich überrascht sein, die Lösung ist so einfach. Auch manchmal sind die Stille in der Mitte eines Satzes. Obwohl ich 90% der Fälle, die sie mir im Datenblatt durch einen einfachen String-Vergleich gegeben haben, lösen konnte, glaube ich nicht, dass sie das von mir erwarten. – Hector

+0

Dann schlage ich vor, dass Sie schreiben, dass Sie hier nicht versuchen, ein Problem zu lösen, sondern vor allem, wie Sie eine Hausaufgabe machen. Es ist auch schön, die vollständigen Anforderungen zu beschreiben, denn es ist unmöglich zu erraten, welche Art von Daten Sie haben und welche Besonderheiten es hat. –

+0

Nun, das Problem, das ich zu lösen versuche, ist, wie man das Problem angeht, ist maschinelles Lernen zu weit hergeholt? – Hector