2016-05-04 6 views
0

Ich versuche zu lösen, was ich realisiert habe, ist ein ziemlich schweres Problem, aufgrund meiner mangelnden Sachkenntnis in dem Thema zu adressieren. Angenommen, ich habe ein Bild einer Tabelle mit 3 Zeilen und 5 Spalten. Jede Reihe enthält Text (nehmen wir jetzt nur Englisch an) oder Zahlen (normale indo-arabische Ziffern). Zwischen den Spalten und zwischen jeder Zeile befindet sich nichts als Leerzeichen. Unter der Annahme, dass alle Zeilen und alle Spalten ausgerichtet sind, wäre es meine Aufgabe, einen Algorithmus zum Erkennen und Extrahieren jeder Zeile aus dem Dokument zu erhalten (ich weiß nicht, ob ich das gut genug artikuliere).Teilen Sie eine Tabelle in einem Bild in Zeilen mit Leerzeichen mit Computer-Vision-Anwendungen

Könnte jemand einen guten Ausgangspunkt vorschlagen (Bibliothek, ähnliches Beispiel, Lehrbuchkapitel, das sich mit so etwas beschäftigt) usw .. für mich, um anzufangen.

Mein Hintergrund ist Datenwissenschaft, aber ich war noch nie der Computer Vision ausgesetzt.

Jede Hilfe wäre willkommen.

+1

Werfen Sie einen Blick auf open cv: http://opencv.org/ – Keatinge

Antwort

0

Sie sollten mit OpenCV starten, wie Racialz vorgeschlagen. Dieses Werkzeug enthält eine Hough Linien/Hough Transformation Methode, die die primäre und einfachste Möglichkeit für Sie sein sollte, Text aus Tabellenabschnitten zu finden und zu beschneiden. Es gibt viele verschiedene Aufgaben für Linien zu finden, für die Menschen diesen Algorithmus (wie THIS oder THIS) verwenden, aber mit Ihrer Aufgabe wäre es viel einfacher, denn Linien sollten viel klarer und einfacher sein, als in diesen Beispielen. Nachdem Sie Ihre Extraktion durchgeführt haben, müssen Sie dann Ihren Text scannen, dafür würde ich Ihnen empfehlen, tesseract ocr engine zu verwenden. Diese Engine ist kostenlos, wirklich einfach zu bedienen, liefert ziemlich gute Ergebnisse und ermöglicht es Ihnen, bestimmte Typen von Buchstaben zu scannen.