Ich versuche, Buchstaben von einem Spielbrett für ein Projekt zu extrahieren. Derzeit kann ich das Spielbrett erkennen, es in die einzelnen Quadrate segmentieren und Bilder von jedem Quadrat extrahieren.Genaue binäre Bildklassifizierung
Der Eingang Ich ist wie diese bekommen (diese sind einzelne Buchstaben):
Zuerst war ich die Anzahl der schwarzen Pixel pro Bild zu zählen und die Verwendung dieser als eine Möglichkeit, die verschiedenen Buchstaben zu identifizieren, was bei kontrollierten Eingabebildern gut funktioniert hat. Das Problem, das ich habe, ist jedoch, dass ich diese Arbeit nicht für Bilder machen kann, die etwas davon abweichen.
Ich habe etwa 5 Proben von jedem Brief mit dem Training zu arbeiten, die gut genug sein sollte.
Weiß jemand, was wäre ein guter Algorithmus für diesen Zweck?
waren Meine Ideen (nach der Bild Normalisierung):
- den Unterschied zwischen einem Bild Zählen und jedem Buchstaben Bild zu sehen, welche die geringste Menge an Fehler erzeugt. Dies funktioniert jedoch nicht für große Datasets.
- Erkennen von Ecken und Vergleichen der relativen Positionen.
- ???
Jede Hilfe wäre willkommen!
Willkommen bei OCR. – delnan
Heh, ich habe Teschearact auf den Testbildern getestet, nachdem ich sie ein wenig erweitert habe, aber es ist kläglich gescheitert (selbst nachdem ich den Segmentierungsmodus auf "ein Wort" eingestellt habe). OCR erscheint für diesen speziellen Fall wie ein Overkill, IMO, da die Bilder in jedem Fall sehr ähnlich sind. – Blender
Was ist mit Skalen- und Rotationsinvarianz? – moooeeeep