Kann ich Google Cloud Vision sagen, den größten (Schriftgröße) Text zu isolieren, den es in einem Bild liest?

Ich möchte Cloud Vision verwenden, um den "Haupt" -Text in einem Bild zu erkennen und zu isolieren (sagen wir zum Beispiel die größte Schrift auf der Verpackung). Ich gehe davon aus, dass Cloud Vision dies im Backend tun könnte, indem man sich die Schriftgröße/die Anzahl der Pixel pro Buchstabe anschaut, aber ich bin mir nicht sicher, ob es dafür eine Ausgabe in der API gibt.Kann ich Google Cloud Vision sagen, den größten (Schriftgröße) Text zu isolieren, den es in einem Bild liest?

Meine beste Vermutung an, wo diese Informationen in der Dokumentation ist unter folgendem Link sein würden, aber ich kann nichts sehen im Zusammenhang mit diesem: https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText

Quelle

2016-07-30 veeday

Klingt wie Sie zu tun haben, [OCR] (https://en.wikipedia.org/wiki/Optical_character_recognition) zuerst, dann schreibe etwas Code, um die Fragmente mit dem größten Schriftgrößenattribut zu bekommen ... Ich bin mir nicht sicher, dass Cloud Vision dir dabei hilft. OCR ist keine Bilderkennung. – lenz

TEXT_DETECTION Vision-API (https://cloud.google.com/vision/docs/samples#detecting_text_in_images) kann Arrays von Rück (String + BoundingPoly).

Die JSON-Darstellung AnnotateImageResponse ist unten.

"textAnnotations": [ 
    { 
     object(EntityAnnotation) 
    } 
    ]

EntityAnnotation https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation

Sie können die Schriftgröße (in Pixel) erhalten von BoundingPoly https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly

Quelle

2016-08-01 01:07:05

Kann ich Google Cloud Vision sagen, den größten (Schriftgröße) Text zu isolieren, den es in einem Bild liest?

Antwort

Verwandte Themen