Für ein bestimmtes Zeichen könnten Sie mit den Anmerkungen in den Codediagrammen im Unicode-Standard beginnen. Die Anmerkungen beziehen sich oft auf andere Zeichen aus verschiedenen Gründen, einschließlich Ähnlichkeit oder Identität der Form. Aber die Anmerkungen sollen nicht alles abdecken.
Sie können Ihren Charakter auch bei http://shapecatcher.com/ zeichnen und bitten, es zu erkennen. Sie erhalten oft eine lange Liste von visuell ähnlichen Alternativen.
Wie @TedHopp in seinem Kommentar schreibt, ist die visuelle Identität font-abhängig. Zum Beispiel müssen "s" und "S" nicht in der Form identisch sein; in den meisten Schriftarten sind sie nicht - die Grundform ist die gleiche, aber es gibt verschiedene Unterschiede in Strichbreite Variation, Krümmung, Serifen, etc. Allerdings kann erwartet werden, dass einige Zeichen in jeder Schriftart, die sie enthält, optisch identisch sind, wie z als lateinische Hauptstadt A, griechische Hauptstadt Alpha Α und kyrillische Hauptstadt А.
Sie haben den Zweck der Studie nicht angegeben, aber Sie könnten etwas tun, das vom Unicode-Konsortium in gewissem Umfang durchgeführt wurde. Siehe UTR #6, Unicode Sicherheitsüberlegungen, die auch Verweise auf verwandte Arbeiten enthält, einschließlich UTS #9, Unicode Sicherheitsmechanismen, die confusables.txt enthält, Empfohlene verwechselbar Mapping für IDN (dh für einen bestimmten Kontext, aber es kann sein, Interesse für andere Zwecke auch).
Unicode gibt nicht das Aussehen von Zeichen an. Das ist ein Font-Problem. (Der Standard verwendet _representative_ images, aber sie sind nicht Teil des Standards.) Möchten Sie zum Beispiel Kapital I und Ziffer 1 und Kleinbuchstaben l alle zusammen? In einigen Schriften sind sie identisch und in anderen Schriften sind sie alle unterschiedlich. –