Wie MNIST-Datensatz zu 0-9, möchte ich ein handgeschriebenes Dokument in eine Word-Datei verwandeln. Das Problem besteht darin, dass sich alle Zeichen in einem Dokument im Gegensatz zum MNIST-Dataset auf demselben Bild befinden. Wie sollte ich das angehen, um ein einzelnes Zeichen in einem Bild wie mnist zu erhalten und einem Klassifizierer zuzuführen? Ich bin ziemlich gut mit Deep Learning sowie einige ML-Klassifikatoren.Wie man OCR handschriftliches Dokument mit tiefem Lernen nähert?
Wie kann ich jedes Zeichen ausschneiden und an meinen DNN füttern?
oder gibt es einen besseren Weg?