Meine Datenbank enthält viele Spalten, die in allen Tabellen wiederverwendet werden, aber der Name der Spalte ändert sich.Wie identifizieren Sie identische Spalten mit unterschiedlichen Namen in Tabellen?
edit: als ein Beispiel: Wir sind in der Telekommunikation und beschäftigen sich mit der 10-stelligen Telefonnummer. Es wird über 100 von Tabellen verwendet, normalerweise mit einem anderen column_name für jede Tabelle, und der Datentyp und das Format der Spalte sind nicht konsistent (zB '123-456-7890', '1234567890', int 1234567890, 1800-123-456- 7890).
Für Training und Analyse möchte ich in der Lage sein, diese Duplikate mit anderen Namen zu verknüpfen oder zu identifizieren.
Wie kann ich das tun?
Das klingt wie eine manuelle Aufgabe :( –
Können Sie ein Beispiel geben, was Sie tun? Ich nehme an, Sie haben einen Primärschlüssel oder Fremdschlüssel-Setup für jede Tabelle? – GabrielVa
Wie viele Daten insgesamt? Weniger als 20 GB? Weniger als 2 GB? – Jeutnarg