Ich bin building on some old code from a few years back using the commoncrawl dataset mit EMR mit MRJob. Der Code verwendet die folgende innerhalb MRJob Unterklasse Mapperfunktion, um zu bestimmen, ob lokal oder auf emr läuft:MRJob Feststellung, ob inline läuft, lokal, emr oder hadoop
self.options.runner == 'emr'
Dies scheint entweder noch nie gearbeitet oder nicht mehr funktioniert, self.options.runner nicht durch die Aufgaben übergeben wird und ist daher immer auf den Standardwert 'inline'
eingestellt. Die Frage ist, gibt es eine Möglichkeit festzustellen, ob der Code lokal oder auf emr mit der aktuellen Version von MRJob (v0.5.0) ausgeführt wird.
Bekam den gleichen Fehler. Das Problem wird nun unter https://github.com/commoncrawl/cc-mrjob/issues/7 verfolgt –