Ich habe gerade angefangen, Big Data zu lernen, und zu dieser Zeit arbeite ich an Flume. Das gängige Beispiel ist die Verarbeitung von Tweets (das Beispiel von Cloudera) mit Java.Verwenden des lokalen Dateisystems als Flume-Quelle
Nur für Test- und Simulationszwecke, kann ich mein lokales Dateisystem als Flume-Quelle verwenden? insbesondere einige Excel- oder CSV-Dateien? Benötige ich neben der Flume-Konfigurationsdatei auch Java-Code, genau wie bei der Twitter-Extraktion?
Wird diese Quelle ereignisgesteuert oder abfragbar sein?
Danke für Ihre Eingabe.
Ich nehme an, dass Sie eine benutzerdefinierte Gerinne Quelle machen können. Ich weiß nicht, ob es für das lokale Dateisystem bereits existiert – fdsa