Meine Anwendung verbraucht XML-Daten von verschiedenen Anbietern. Alle Anbieter haben unterschiedliche XML-Formate/Schemas und benutzerdefinierte Abfragen sind erforderlich, um verschiedene Daten aus diesen XML-Dateien abzurufen.XML-Datenbankauswertung
Ich begann zunächst mit einem RDBMS-Ansatz, bei dem ich nach dem Abrufen eines bestimmten XML-Codes vom Anbieter die XML-Datei analysieren/abfragen und die Daten in einige Tabellen schreiben würde (mit Woodstock StAX-Parser). Aufgrund der Natur von RDBMS (festes Schema), bin ich nicht in der Lage, alle XML-Formate von verschiedenen Anbietern zu unterstützen, und selbst wenn ich dies tue, muss ich das hierarchische XML in relationale RDBMS-Schema-Daten "normalisieren".
Die XML/Daten von den Anbietern werden häufig täglich aktualisiert und die Größen variieren zwischen einigen kbs bis zu 50 MB Datendateien.
Ich evaluiere verschiedene NXD (Native Xml-Datenbanken), eXist-db, Sedna, BaseX und MonetDB als nächsten Schritt, um zu sehen, ob dies meine Zwecke erfüllen würde.
Kann jemand bitte einige praktische Ratschläge geben, wie man das ausarbeitet? oder hat ein ähnliches System erstellt, das viele XML-Daten verschiedener Formate/Schemata verarbeitet.
Hier sind die Kerne XML Anforderungen i zu beantworten versuchen zu:
- Griffe mehr XML-Datendateien, aus mehreren Quellen. XMLs unterscheiden sich von Anbieter zu Anbieter.
- XML-Updates, des gesamten Dokuments sowie einige Felder in der vorhandenen XML in der DB.
- Identifizieren Sie, ob es von einem bestimmten Anbieter und die Abfragen entsprechend abfeuern.
- Fragen Sie diese XML mit XPath/XQuery ab, um die Daten zu lesen, um sie den Benutzern in einer gemeinsamen Ansicht zu präsentieren.
Bitte um Rat.
Danke, Subhro.