Viele Dateispeichersysteme verwenden Hashes, um eine Duplizierung derselben Dateiinhaltsdaten zu vermeiden (neben anderen Gründen), z. B. verwenden Git und Dropbox beide SHA256. Die Dateinamen und Daten können unterschiedlich sein, aber solange der Inhalt den gleichen erzeugten Hash erhält, wird er nie mehr als einmal gespeichert.Verwenden gängige Betriebssystem-Dateisysteme Hashwerte, um zu vermeiden, dass dieselben Inhaltsdaten mehr als einmal gespeichert werden?
Es scheint, dass dies in einem Betriebssystem-Dateisystem sinnvoll wäre, um Platz zu sparen. Gibt es irgendwelche Dateisysteme für Windows oder * nix, die das tun, oder gibt es einen guten Grund, warum keiner von ihnen das tut?
Dies würde die Notwendigkeit für doppelte Dateifinder-Dienstprogramme größtenteils eliminieren, da zu diesem Zeitpunkt der einzige Speicherplatz, den Sie speichern würden, für den Dateieintrag im Dateisystem wäre, was für die meisten Benutzer nicht ausreicht bedeuten.
Edit: Wahrscheinlich könnte dies auf ServerFault gehen, aber ich denke, Entwickler sind eher zu verstehen, die Probleme und Kompromisse beteiligt.
Ein Anwendungsfall ist ein Freund von mir mit vielen Tausenden von Videodateien, von denen viele doppelte Videos mit unterschiedlichen Namen sind. Er schreibt einen Code, um sie alle zu hacken und herauszufinden, welches das gleiche Video ist, damit er die Duplikate löschen kann, und mir ist aufgefallen, dass das Dateisystem das für ihn erledigen könnte. – RedFilter