0

Ich habe auf tiefe Verstärkung Lernen wie hier zu lesen up:Verringert die Vorverarbeitung bei tiefem Q/Verstärkungslernen die Genauigkeit?

https://www.nervanasys.com/demystifying-deep-reinforcement-learning/

Es wird eine Weile dauern, bis ich all die Mathematik verstehe aber, dass mich nicht von der Nutzung der Bibliotheken zu stoppen. Wie auch immer, ich weiß, dass man in einem konvolutionellen KNN, wenn man Bilder lernen will, die Bilder vorverarbeiten muss, sonst ist die Rechenleistung, die zur Berechnung des neuronalen Netzwerks benötigt wird, astronomisch. Beeinträchtigt dies die Qualität des Netzes in irgendeiner Weise? Wenn das so ist, wie?

Nehmen wir an, Sie hatten genug Rechenleistung, um das Netzwerk mit jedem Pixel eines qualitativ hochwertigen Bildes in einem Videostream zu versorgen, um zu lernen, wie Sie Ihre Ziele erreichen. Würde das das Netz bei der Erreichung seines Ziels viel besser machen? Würde es die Arten von Zielen erweitern, die das Netz erreichen könnte, und ihm möglicherweise die Möglichkeit geben, sich besser zu verallgemeinern?

Ich denke auch darüber im Zusammenhang mit Computer Vision, wo Sie einen Roboter über seine Umgebung zu denken haben, um zu lernen, Aufgaben zu erfüllen. Es scheint, dass die Vorverarbeitung der Bilder, die sie empfängt, ähnlich wäre, sie mit extrem schlechter Sicht zu behandeln.

Antwort

1

Wenn Sie die Bilder vorverarbeiten, meinen Sie, sie auf eine Standardgröße wie 256x256 Pixel zu skalieren?

Wenn Sie das Bild auf eine Größe von 256x256 Pixel verkleinern, verlieren Sie Informationen. Daher sollten Sie bessere Ergebnisse erzielen, wenn Sie das Bild in hoher Auflösung halten.

Aber es kostet Sie auch viel mehr Computerleistung, also ist es nicht wirklich wert, so zu tun. In Scaling up Image Recognition behaupten die Autoren, dass sie unter Verwendung von Bildern mit einer Auflösung von 512 × 512 statt 256 × 256 eine niedrigere Fehlerrate erreichen. Es ist jedoch nur 0,54% niedriger, was nicht viel ist.

In einer anderen Aufgaben, denke ich, die Auswirkungen der Verwendung von Bildern mit höherer Auflösung sollte ähnlich sein, wird es das Modell mehr Details sehen daher wird es wahrscheinlich besser sein, aber es kann nicht wert sein wegen der Erhöhung der Rechenleistung benötigt.

Beachten Sie, dass die Autoren des Links, den ich zur Verfügung gestellt habe, auf ImageNet betrogen wurden, so dass sogar die Verringerung der Fehlerrate real sein kann, sollte der erzielte Wert bei der ImageNet-Konkurrenz ignoriert werden.

+0

Ja, ich meine die Herunterskalierung. Ich habe noch nicht viel mit Conv Networks gearbeitet, aber ich habe einen Kurs belegt und angefangen, mit Code zu spielen. Ich stellte die Frage, weil ich mir meine eigene Vision vorstellte, wenn alles, was ich tun musste, eine verkleinerte, verzerrte Sicht auf die Welt war und wie viel besser es ist, dass ich es nicht tat. Man würde denken, dass die Verbesserung groß wäre. Es gibt einen großen Unterschied zwischen einem 12MP-Bild und 256x256. Vielleicht, wenn einige Tests mit etwas viel höher als 512 durchgeführt wurden? Natürlich gibt es Berechnungen, die berücksichtigt werden sollten, und obwohl es wichtig ist, ist es auch wichtig zu wissen, was die Skalierung bietet. – xendi

+0

Nun, wie ich Ihnen sagte, und ich bin mir sicher, dass es mehr Referenzen gibt, je größer die Auflösung, desto besser die Ergebnisse, aber die Verbesserungen kosten viel mehr Rechenaufwand. – gcucurull