Wir haben hdfs mit einer Kapazität von 900 TB. Da die gespeicherten Daten stark anwachsen, ist es schwierig zu verfolgen, was nützlich ist und was gelöscht werden könnte. Ich möchte hdfs Nutzung für folgende Muster analysieren, so dass die Kapazität optimal genutzt werden könnte.So erhalten Sie den hdfs-Nutzungsbericht im Detail
- Auf welche Daten werden häufig zugegriffen.
- Daten werden nicht lange berührt/zugegriffen (Möglicher Löschkandidat)
- Datenverteilungsverteilung durch Benutzer.
- Aktive Benutzer.