Ich möchte Cloud Vision verwenden, um den "Haupt" -Text in einem Bild zu erkennen und zu isolieren (sagen wir zum Beispiel die größte Schrift auf der Verpackung). Ich gehe davon aus, dass Cloud Vision dies im Backend tun könnte, indem man sich die Schriftgröße/die Anzahl der Pixel pro Buchstabe anschaut, aber ich bin mir nicht sicher, ob es dafür eine Ausgabe in der API gibt.Kann ich Google Cloud Vision sagen, den größten (Schriftgröße) Text zu isolieren, den es in einem Bild liest?
Meine beste Vermutung an, wo diese Informationen in der Dokumentation ist unter folgendem Link sein würden, aber ich kann nichts sehen im Zusammenhang mit diesem: https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText
Klingt wie Sie zu tun haben, [OCR] (https://en.wikipedia.org/wiki/Optical_character_recognition) zuerst, dann schreibe etwas Code, um die Fragmente mit dem größten Schriftgrößenattribut zu bekommen ... Ich bin mir nicht sicher, dass Cloud Vision dir dabei hilft. OCR ist keine Bilderkennung. – lenz