ich newAPIHadoopFile in meiner scala-Klasse verwenden, um Text-Dateien von HDFS wie untenÖffnen von Dateien in Funken mit bestimmten Zeitstempeln
val conf = new SparkConf
val sc = new SparkContext(conf)
val hc = new Configuration(sc.hadoopConfiguration)
val dataFilePath = "/data/sample"
val input = sc.newAPIHadoopFile(dataFilePath, classOf[TextInputFormat], classOf[LongWritable], classOf[Text], hc)
Aber jetzt zu lesen, muß ich Dateien in einem Bereich von Zeitstempeln öffnen Sie einfach. Irgendeine Idee, wie ich das tun könnte?
Danke, Jeff
Vielen Dank Cimox für Ihre Antwort. Ich suche nach einem Systemzeitstempelfilter. – Jeff
Ich habe meine Post bearbeitet, mit dem obigen Code sollten Sie Dateien mit gegebenem Zeitstempel filtern können. Sie können diese gefilterten Dateien anschließend mit Spark öffnen. – cimox
danke cimox :) – Jeff