2012-03-30 1 views
4

Ich baue eine Anwendung, die Satzprüfung tut. Weißt du, gibt es irgendwelche DLLs, die Sätze und ihre Logik erkennen und Sätze richtig organisieren? Wie Wörter in einen Satz zu einem richtigen Satz bringen.Algorithmus für natürlich aussehende Sentenz in englischer Sprache

Wenn es nicht verfügbar ist, können Sie vielleicht Suchbegriffe vorschlagen, die ich recherchieren kann.

+0

Dies ist ein hartes Problem zu knacken. "Natural Language Processing" ist der Suchbegriff, nach dem Sie suchen. Aber wie gesagt: Das ist ein SEHR hartes Problem. –

+0

warum nicht hinzufügen "und es ist in Javascript" :) –

Antwort

1

Dies ist ein sehr komplexes Thema, das Sie verlangen. Es heißt Computerlinguistik oder natürliche Sprache Verarbeitung, die Gegenstand der laufenden Forschung ist.

Hier sind ein paar Links, die Sie zu erhalten begonnen:

ich denke, man wird nur eine DLL nicht in der Lage sein, zum Download und lassen Ich fließe :)

+0

abgeordnet.Schauen Sie sich auch https://www.coursera.org/nlp/class/index für einen kostenlosen Online-Kurs in natürlicher Sprachverarbeitung an, sie decken viele typische Probleme ab. – Sprachprofi

4

Es gibt Dinge, Sprachmodell bezeichnet und n-Gramm. Ich werde versuchen, kurz zu erklären, was sie sind. Angenommen, Sie haben eine große Auswahl an korrekten englischen Sätzen. Wählen wir eine davon:

The quick brown fox jumps over the lazy dog. Lassen Sie uns nun alle Wörterpaare (genannt Bigramme) darin betrachten: (the, quick), (quick, brown), (brown, fox), (fox, jumps) und so weiter ... Mit einer riesigen Sammlung von Sätzen werden wir eine große Anzahl von Bigrammen haben. Wir nehmen jetzt einzigartige und zählen ihre Häufigkeit (Anzahl der Zeit, die wir in richtigen Sätzen gesehen haben). Wir haben jetzt, sagen
('the', quick) - 500
('quick', brown) - 53

Bigramme mit ihren Frequenzen ein Sprachmodell bezeichnet. Es zeigt Ihnen, wie häufig eine bestimmte Kombination von Wörtern ist.

So können Sie alle möglichen Sätze Ihrer Wörter erstellen und zählen ein Gewicht von jedem von ihnen unter Berücksichtigung von Sprachmodell. Ein Satz mit dem maximalen Gewicht wird sein, was Sie brauchen.

Wohin mit Bigrammen und deren Frequenzen? Nun, google has it. Sie können nicht nur ein Wortpaar verwenden, sondern verdreifachen und so weiter. Es ermöglicht Ihnen, mehr menschenähnliche Sätze zu erstellen.

+0

OMG .. das ist eine Menge, ich denke, ich muss dann meine eigene Datenbank aufbauen .. – Jason