2016-07-13 38 views
0

Ich arbeite derzeit an einem Projekt zur Gestaltung und Implementierung eines Banking Data Warehouse. Ich möchte das Datenmodell für den Buchhaltungs-Data-Mart definieren, die Körnung definieren und das Sternschema verwenden, um es zu modellieren. Mir wurde gesagt, dass wir in den Geschäften eines Kunden interessiert sind die in einem Zweig registriert ist für ein Konto .... (einige andere Dimensionen) ..... an einem bestimmten Datum . Aber sie fragen nach den DAILY Transaktionen! Meiner Meinung nach ist es sinnlos, tägliche Transaktionen im Data Warehouse zu haben, da dies die exakte Replik der Transaktionsdatenbank wäre! Dieses Data Warehouse wird verwendet, um Dashboards zu der Vermutung zu führen, dass Entscheidungsträger nicht in so detaillierte Daten eingebunden sind. Was denken Sie ?Identifizieren Sie das Datenmodell Korn

Vielen Dank.

+0

Festplatten sind billig. Duplizierung ist in Data Warehouses gut. Immer mit dem feinsten Korn gehen –

+0

@NeilMcGuigan aber sind wir an den täglichen Daten interessiert? Ich denke nicht – yasmine92

+0

Sie werden nie alle Fragen im Voraus in meiner Erfahrung denken. Immer mit der geringstmöglichen Körnung gehen. – tobi6

Antwort

1

Verwenden Sie den Tag Korn für Ihre Zeitdimension und beachten Sie Folgendes:

Das Lager nicht eine Replik der Transaktionsdatenbank, obwohl die gleichen Informationen in beide verfügbar. Das Warehouse ist für die Analyse optimiert, enthält die gesamte Historie, ist nichtflüchtig und aggregiert Daten entlang der Dimensionen.

In Ihrem Beispiel kann das Lager eine einzelne Zeile haben, die viele Transaktionen darstellt, die innerhalb eines einzigen Tages aufgetreten sind, so dass das Korn nicht dupliziert wird. Es kann Informationen aus fünf Jahren enthalten, die aus dem Transaktionssystem entfernt wurden. Es wird blitzschnell sein, Beträge in einer Abfrage zu aggregieren. Die Verwendung belastet Ihr Transaktionssystem nicht. Eines Tages kann es Informationen aus einer anderen Transaktionsdatenbank enthalten, wenn Ihr Unternehmen mit einem anderen Unternehmen verschmilzt. Oder die Kundeninformationen können mit Daten erweitert werden, die aus einem oder mehreren sozialen Netzwerken importiert werden.

Der Punkt ist, nicht auf feinkörnige Daten im Lager, die für das transaktionale System redundant zu sein scheint. Es ist nützlich und üblich.

+0

Vielen Dank für Ihre detaillierte Antwort macht es die Dinge klarer für mich – yasmine92

0

Ein Prinzip der dimensionalen Modellierung besteht darin, immer mit der feinsten Körnung zu modellieren. Ich würde niemals daran denken, Transaktionen an einem Tag zu modellieren, und ich würde sogar versuchen, Zeit zu gewinnen (obwohl das eine separate Dimension sein könnte).

+0

Ich habe mehr darüber nachgedacht und ich sehe was du hier meinst. Vielen Dank! – yasmine92