Es gibt Dinge, Sprachmodell bezeichnet und n-Gramm. Ich werde versuchen, kurz zu erklären, was sie sind. Angenommen, Sie haben eine große Auswahl an korrekten englischen Sätzen. Wählen wir eine davon:
The quick brown fox jumps over the lazy dog
. Lassen Sie uns nun alle Wörterpaare (genannt Bigramme) darin betrachten: (the, quick)
, (quick, brown)
, (brown, fox)
, (fox, jumps)
und so weiter ... Mit einer riesigen Sammlung von Sätzen werden wir eine große Anzahl von Bigrammen haben. Wir nehmen jetzt einzigartige und zählen ihre Häufigkeit (Anzahl der Zeit, die wir in richtigen Sätzen gesehen haben). Wir haben jetzt, sagen
('the', quick) - 500
('quick', brown) - 53
Bigramme mit ihren Frequenzen ein Sprachmodell bezeichnet. Es zeigt Ihnen, wie häufig eine bestimmte Kombination von Wörtern ist.
So können Sie alle möglichen Sätze Ihrer Wörter erstellen und zählen ein Gewicht von jedem von ihnen unter Berücksichtigung von Sprachmodell. Ein Satz mit dem maximalen Gewicht wird sein, was Sie brauchen.
Wohin mit Bigrammen und deren Frequenzen? Nun, google has it. Sie können nicht nur ein Wortpaar verwenden, sondern verdreifachen und so weiter. Es ermöglicht Ihnen, mehr menschenähnliche Sätze zu erstellen.
Dies ist ein hartes Problem zu knacken. "Natural Language Processing" ist der Suchbegriff, nach dem Sie suchen. Aber wie gesagt: Das ist ein SEHR hartes Problem. –
warum nicht hinzufügen "und es ist in Javascript" :) –