Ich versuche, die Verarbeitung von E-Mail-Nachrichten, die über IMAP abgerufen werden, höchstens einmal zu erreichen. (I asked a related question about it.)Können wir über IMAP abgerufene E-Mails durch Hash deduplizieren?
Ist es zuverlässig, einen kryptografischen Hash-Code der MIME-Nachrichten zu berechnen, die über IMAP abgerufen werden, um sie zu deduplizieren?
Mit anderen Worten, warum würde dieselbe E-Mail zu einem anderen Ergebnis führen, wenn sie mehrmals über IMAP abgerufen wird? Kann eine E-Mail ihren Inhalt ändern, wenn sie zum Beispiel über Ordner hinweg verschoben oder als gelesen oder aus einem anderen Grund markiert wird?
Ich benutze hMailserver unter Windows mit Mailkit.NET als Client. Bin mir nicht sicher, dass das wichtig ist.
Wenn Sie nur den Inhalt hashen, kann dies nicht geändert werden, es können jedoch tatsächliche Duplikate existieren (Nachrichten können in IMAP kopiert werden). Ich denke, Sie sind über das Engineering-Problem, aber die UID sollte ausreichen. – Max
http://crypto.stackexchange.com/questions/2583/is-it-fair-to-assume-that-sha1-collisions-wont-occur-on-a-set-of-100-k-strings/2584 –