Die deutsche Website nandoo.net bietet die Möglichkeit, einen Nachrichtenartikel zu kürzen. Wenn Sie den Prozentwert mit einem Schieberegler ändern, ändert sich der Text und einige Sätze werden weggelassen.Kürzen Sie einen Text und behalten Sie nur wichtige Sätze
Sie können das hier in Aktion sehen:
Die Meldung ist auf der linken Seite und Tags markiert sind. Der Schieberegler befindet sich oben in der zweiten Spalte. Je mehr Sie den Schieberegler nach links bewegen, desto kürzer wird der Text.
Wie können Sie so etwas anbieten? Gibt es Algorithmen, mit denen Sie das erreichen können?
Meine Idee war, dass ihr Algorithmus die Anzahl der Tags und Substantive in einem Satz zählt. Dann werden die Sätze mit der geringsten Anzahl von Tags/Substantiven weggelassen.
Konnte das wahr sein? Oder hast du eine andere Idee?
Ich hoffe, Sie können mir helfen. Danke im Voraus!
Vielen Dank! Dann müssen Sie nur die Anzahl der Vorkommen aller Wörter in Ihrer Datenbank speichern. Das ist kein Problem. Aber warum brauchen Sie eine Bayessche Analyse? Sie können den Text durchgehen, die Häufigkeit der Wörter auswählen und sie für jeden Satz zählen. Recht? – caw
Sie sollten keine reinen Zählungen verwenden, da Wörter, die von Natur aus häufiger vorkommen, * erwartet * hohe Zählraten haben, während Sie nach Wörtern suchen, bei denen die Zählungen hoch * relativ * zu erwartet sind. Die Bayessche Analyse macht genau das. –
Thx! Also wähle ich die durchschnittliche Anzahl der Vorkommen der Wörter aus der Datenbank. Dann bestimme ich, welche Wörter in diesem Text häufiger vorkommen als im Durchschnitt. Zumindest wähle ich die Sätze aus, die diese unerwartet häufigen Wörter enthalten.Recht? – caw