2016-06-09 12 views
2

Ich spiele gerade mit Tensorflow und Mnist Code. Der Mnist-Datensatz von Yann Lecun enthält 20x20 Pixel-Bilder, die in einem 28x28-Bild zentriert wurden, indem der Schwerpunkt der Pixel berechnet wurde. Das Ergebnis ist eine Grenze von mindestens 4 Pixeln, die das Ergebnis verbessern. Ich habe viel auf mnist gesucht und gelesen, aber ich kann nicht finden, warum 4 Pixel verwendet wurden. Ich bin 100x100 Pixel Bilder mit 5 Pixel Grenze innerhalb, aber ich habe keine Ahnung, ob das genug oder nicht. Ich könnte versuchen, die Größe der Grenze zu ändern und Ergebnisse zu vergleichen, aber das würde mich ewig brauchen. Wissen und die Anwendung guter Praktiken sind besser, denke ich. So, wie man die beste Randgröße definiert?Mnist Pixel Grenzen

+0

Eine bereits decodierte Version des MNIST-Datensatzes finden Sie hier: http://mnist-decoded.000webhostapp.com/ – SomethingSomething

Antwort

3

Meiner Erfahrung nach ist es nicht üblich, außerhalb von MNIST Grenzen zu verwenden. Wenn Sie versuchen, Objekte innerhalb von Bildern zu erkennen (anstelle von Ziffern), sollten Sie nur das gesamte Bild liefern, möglicherweise mit zufälliger Beschneidung oder anderen Verzerrungen, um den Lernprozess zu unterstützen. Die Best Practices für andere Aufgaben variieren je nach Domäne, stammen jedoch in der Regel aus intuitiven Einschätzungen zu den Eingaben, auf die das Modell in der Produktion wahrscheinlich trifft.

+0

Vielen Dank für Ihre Antwort – Guix