2010-07-05 11 views
21

Gibt es ein Paket, das die Levenshtein-Entfernungszählfunktion enthält, die als C- oder Fortran-Code implementiert ist? Ich habe viele Strings zu vergleichen und stringMatch von MiscPsycho ist zu langsam dafür.Schnelle Levenshtein Entfernung in R?

Antwort

16

levenshteinDist (aus dem RecordLinkage Paket) ruft kompilierten C-Code auf. Versuche es.

5

Sie könnten stringDist von Biostrings versuchen auch

12

Und stringdist im stringdist Paket ist es auch, sogar schneller als levenshteinDist unter bestimmten Bedingungen (1)

+0

stringdist hat seit diesem Blog, das Sie deutlich beschleunigt verlinken auf : Es verwendet jetzt mehrere Kerne. –