KMP algorithm for string matching. Im Anschluss an den code ich online zur Berechnung des längsten Präfix-Suffix-Array gefunden:
Defination:String Matching: Berechnung des längsten Präfix-Suffix-Arrays im Kmp-Algorithmus
lps[i] = the longest proper prefix of pat[0..i]
which is also a suffix of pat[0..i].
Code:
void computeLPSArray(char *pat, int M, int *lps)
{
int len = 0; // length of the previous longest prefix suffix
int i;
lps[0] = 0; // lps[0] is always 0
i = 1;
// the loop calculates lps[i] for i = 1 to M-1
while(i < M)
{
if(pat[i] == pat[len])
{
len++;
lps[i] = len;
i++;
}
else // (pat[i] != pat[len])
{
if(len != 0)
{
// This is tricky. Consider the example AAACAAAA and i = 7.
len = lps[len-1]; //*****************
// Also, note that we do not increment i here
}
else // if (len == 0)
{
lps[i] = 0;
i++;
}
}
}
}
Kann ich len = len-1
statt len = lps[len-1]
?
weil len immer die Präfixlänge wie aus [0 .. someIndex] zählt. Warum dann lps für die Zuweisung hier? Im Anschluss an die Fälle sind, für die ich die feinen getestet arbeiten (erste Zeile ist das Muster und die nachfolgenden zwei Linien sind das Ergebnis für Original und modifizierte Zuordnung zu len
):
a a a b a b c
0 1 2 0 1 0 0
0 1 2 0 1 0 0
a b c b a b c
0 0 0 0 1 2 3
0 0 0 0 1 2 3
a a b c b a b
0 1 0 0 0 1 0
0 1 0 0 0 1 0
-Code hier mit beiden Varianten geschrieben: http://ideone.com/qiSrUo