Hallo, ich habe ein Problem in Python. Ich versuche mein Problem mit einem Beispiel zu erklären.Python - Probleme mit regulären Ausdruck und Unicode
Ich habe diese Saite:
>>> string = 'ÐÑÒÓÔÕÖרÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ'
>>> print string
ÐÑÒÓÔÕÖרÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ
und ich möchte zum Beispiel charachters ersetzen verschieden von n, A, ï mit ""
Ich habe versucht:
>>> rePat = re.compile('[^ÑÃï]',re.UNICODE)
>>> print rePat.sub("",string)
�Ñ�����������������������������ï�������������������Ã
Ich habe dieses erhalten. Ich denke, dass es passiert, weil diese Art von Zeichen in Python durch zwei Positionen im Vektor dargestellt werden: zum Beispiel \ xc3 \ x91 = Ñ. Dafür, wenn ich den Regolar Ausdruck mache, sind alle \ xc3 nicht ersetzt. Wie kann ich diese Art von Sub ?????
Dank Franco