Als Teil meiner Arbeit erhalten wir ca. 25TB wert Protokolldateien pro Jahr, derzeit wurde es über ein NFS-basiertes Dateisystem gespeichert. Einige werden wie in zip/tar.gz archiviert, während andere im reinen Textformat vorliegen.Speichern von Millionen von Protokolldateien - ca. 25 TB pro Jahr
Ich bin auf der Suche nach Alternativen für die Verwendung eines NFS-basierten Systems. Ich schaute auf MongoDB, CouchDB. Die Tatsache, dass es sich um eine dokumentenorientierte Datenbank handelt, scheint die richtige Lösung zu sein. Der Inhalt der Protokolldateien muss jedoch in JSON geändert werden, damit er in der Datenbank gespeichert werden kann. Etwas, zu dem ich nicht bereit bin. Ich muss den Inhalt der Protokolldateien unverändert lassen.
Wie für die Verwendung beabsichtigen wir, eine kleine REST-API zu setzen und ermöglichen Menschen, Datei-Liste, neueste Dateien und die Fähigkeit, die Datei zu erhalten.
Die vorgeschlagenen Lösungen/Ideen müssen eine Form von verteilter Datenbank oder Dateisystem auf Anwendungsebene sein, wo man Protokolldateien speichern und horizontal durch Hinzufügen weiterer Maschinen skalieren kann.
Ankur
Nur die Mathematik zu tun: das ist 500 GB/Woche oder 100 GB jeden Werktag. – egrunin
Worauf loggen Sie? – ChaosPandion
@egrunin Danke für die Mathematik. Wir haben bereits Jahre wert. @chaosDiese Protokolldateien stammen aus global installierten Speicher-Arrays. –