Gibt es ein Paket, das die Levenshtein-Entfernungszählfunktion enthält, die als C- oder Fortran-Code implementiert ist? Ich habe viele Strings zu vergleichen und stringMatch
von MiscPsycho
ist zu langsam dafür.Schnelle Levenshtein Entfernung in R?
21
A
Antwort
16
levenshteinDist (aus dem RecordLinkage
Paket) ruft kompilierten C-Code auf. Versuche es.
5
Sie könnten stringDist
von Biostrings
versuchen auch
12
Und stringdist
im stringdist
Paket ist es auch, sogar schneller als levenshteinDist
unter bestimmten Bedingungen (1)
stringdist hat seit diesem Blog, das Sie deutlich beschleunigt verlinken auf : Es verwendet jetzt mehrere Kerne. –