Durch "Lexing" Sie Ihre Bezugnahme auf Lexikalische Analyse, und es gibt einige alte Werkzeuge, die immer noch arbeiten mit dem Namen Lex und Yacc. Lex erstellt den Tokenizer und Yacc steht für "noch einen Compiler-Compiler" und ist der eigentliche Parser.
Das Konzept von lex/Yacc, erstellen Sie eine Grammatik für die Sprache, und führen Sie dann die Grammatik über das Paslex-Tool zum Generieren von Quellcode (normalerweise in C), mit dem Sie eine Datei analysieren und Maßnahmen ergreifen können bestimmte Schlüsselwörter und Token. Martin Waldenburg hat eine Pascal-Version von lex/yacc mit dem Namen PasLex geschrieben, die seit mehr als einem Jahrzehnt läuft und in Delphi umgewandelt wurde (obwohl es mit den neuesten Versionen ohne kleinere Arbeit nicht funktionieren könnte). Wenn ich mich richtig erinnere, verwendet es die gleichen .L Grammatik-Eingabedateien wie lex, so dass jede Dokumentation, die Sie für lex/yacc finden, auch auf Paslex angewendet werden kann, mit der Ausnahme, dass Sie Pascal-Code als Ausgabe erhalten.
Ich bin mir nicht sicher über aktuelle Dokumentationsverfügbarkeit. Vor dem Internet (keuchen) haben wir Bücher benutzt und das meiste davon war stark dokumentiert auf Papier, das schon lange gelb geworden ist ... Gerüchten zufolge könnte es sein, dass du ... vielleicht eine gebrauchte Kopie von Amazon abholen kannst. Ich schnitt meine Zähne auf diese ein Buch mit, das auch als „the dragon book“ bekannt ist, die als kürzlich
EDIT als 2006 erneut veröffentlicht zu haben scheint worden:
ich durch die irrte Werkzeug, war es TPLY. PasLex war eine Delphi-Grammatikimplementierung ... TPLY war das Lex/Yacc-Tool, das eine Pascal-Quelle aus einer .L-Datei erzeugte.
Siehe http://stackoverflow.com/questions/354563/what-would-be-a-good-delphi-lexer-parser-for-javascript-language-file/355218#355218 –