Ich habe zwei Tabellen, die jeweils Informationen geben über eine Reihe von Anwendungen, die auf meiner Arbeit Netzwerk ausgeführt werden. Sie wurden von zwei verschiedenen Personen geschaffen, die niemals zu korrespondieren schienen.Levenshtein Entfernung/String-Matching-Algorithmus für Phrasen
Als Ergebnis werden die Namen sie die Anwendungen gegeben haben, sind zwischen den Blättern nicht konstant. Sie sind jedoch ähnlich. Zum Beispiel könnte man eine Anwendung „Office 2010“, die andere „MS Office 10“ oder so nennen.
Ich habe den Levenshtein Algorithmus nachgeschlagen, aber dies scheint nur auf einzelne Wörter oder Sätze anzuwenden, wo das Wort, um konstant ist und nur die Schreibweise abweicht. (Ich bin kein Informatiker; fühlen Sie sich frei, mich diesbezüglich zu korrigieren).
Deshalb suche ich einen Algorithmus, der in einem Blatt für jeden Namen, kann in dem anderen Blatt alle Namen durchlaufen und die beste Übereinstimmung finden. Muss nicht perfekt sein, irgendetwas wird helfen.
Irgendwelche Ideen? Danke an alle, die mithelfen können.