Die übliche URL-Kodierung eines Unicode-Zeichens besteht darin, es in 2% HH-Codes aufzuteilen. (\ u4161 =>% 41% 61)Unicode-URL-Dekodierung
Aber, wie unterscheidet Unicode beim Dekodieren? Woher weißt du, dass % 41% 61 ist \ u4161 vs \ x41 \ x61 ("Aa")?
Sind 8-Bit-Zeichen, die codiert werden müssen, vorangestellt von % 00?
Oder ist der Punkt, an dem Unicode-Zeichen verloren gehen sollen?
Dies ist genau das, was verwendet werden sollte. Die Charaktere, die du erwähnst, mögen merkwürdig erscheinen, aber keiner von ihnen wird Kontrollcharakter sein (so funktioniert UTF-8) und das ist wirklich gut. –