Ich versuche, OCR auf eine Bilddatei in Python mit Teseract-OCR zu tun. Meine Umgebung ist Python 3.5 Anaconda auf Windows-Maschine. HierUnicodeDecodeError 'Charmap' Codec mit Tesseract OCR in Python
ist der Code:
from PIL import Image
from pytesseract import image_to_string
out = image_to_string(Image.open('sample.png'))
Der Fehler Ich erhalte ist:
File "Anaconda3\lib\sitepackages\pytesseract\pytesseract.py", line 167, in image_to_string
return f.read().strip()
File "Anaconda3\lib\encodings\cp1252.py", line 23 in decode
return codecs.charmap_decode(input, self.errors, decoding_table)[0]
UnicodeDecodeError:'charmap' codec can't decode byte 0x81 in position 1583: character maps to <undefined>
ich versucht habe, die Lösung here erwähnt Der Hack funktioniert nicht
ich versucht habe, Mein Code auf Mac OS funktioniert.
Ich habe in die pytesseract Probleme sah: Hier ist dies ein open issue
Dank