Ich muss die Sprechgeschwindigkeit jeder Zeile von Untertitel berechnen. Der Inhalt der srt (Untertitel) Datei sieht wie folgt aus:R: Extrahieren Zeit von srt (Untertitel) Datei
1
00:00:19,000 --> 00:00:21,989
I'm Annita McVeigh and welcome to Election Today where we'll bring you
2
00:00:22,000 --> 00:00:23,989
the latest from the campaign trail, plus debate and analysis.
3
00:00:24,000 --> 00:00:28,989
The Liberal Democrats promise to protect the pay of millions
Zum Beispiel dauert es 4 Sekunden 989 Millisekunden die 10 Worte zu sagen: „Die Liberaldemokraten versprechen die Bezahlung von Millionen zu schützen“ . Die durchschnittliche Sprachrate dieser 10 Wörter ist 498,9 Millisekunden pro Wort.
Wie lese ich die srt-Datei, so dass ich einen Datenrahmen mit Startzeit haben kann, endTime, Textstring und WORDCOUNT als Spalten und Zeilen der Untertitel als Zeilen wie unten?
startTime<-c("00:00:19,000", "00:00:22,000", "00:00:24,000")
endTime<-c("00:00:21,989", "00:00:23,989", "00:00:28,989")
textString<-c("I'm Annita McVeigh and welcome to Election Today where we'll bring you", "the latest from the campaign trail, plus debate and analysis.", "The Liberal Democrats promise to protect the pay of millions")
wordCount<-c(12,10,10)
rate.df<-data.frame(startTime, endTime, textString, wordCount)
Wie kann ich von Startzeit endTime in R subtrahieren, wenn die Zeit in Form von Stunde vorgestellt: Minute: Sekunde, Millisekunde?
ich in der Aufgabe gelang MS Excel, aber ich habe zu viele Daten Excel zu verwenden, für diese Aufgabe. – Ninjacat