Uni-Logo
Databases and Information Systems
Sie sind hier: Startseite Research Former Projects Dynamic Integration of eCatalogs
 

Dynamische Integration von elektronischen Katalogen

Präsentationen

Übersicht

Das allgemeine Problem der Datenintegration besteht darin, dass eine Menge von lokalen und heterogenen Informationsquellen zu einem einheitlichen Informationssystem integriert werden sollen. Zur Lösung dieses Problems existieren im Wesentlichen zwei Ansätze:
Zum einen können die zu integrierenden Daten in einem separaten Vorverarbeitungs-Schritt in einer großen Datenbasis zusammengefasst werden. Dabei ist es notwendig für jede Datenquelle eine Abbildung von dem Schema der zu integrierenden Datenquelle auf das Schema der Ziel-Daten zu definieren. Naturgemäß besteht hier das Problem der Aktualität der integrierten Daten. Zum anderen kann eine einheitliche Anfrageschnittstelle auf Basis eines allgemeinen globalen Schemas definiert werden, so dass Anfragen, die über diese Schnittstelle gestellt werden, vor der Verarbeitung in den integrierten Systemen an die jeweiligen lokalen Schemata angepasst werden müssen. Die Haupt-Anforderungen sind hier das Umschreiben von Anfragen und der Entwurf von neuen Techniken zur Anfrage-Verarbeitung.
Beide Ansätze leiden darunter, dass manuelle Eingriffe notwendig sind, etwa zur Definition von Umschreibe-Regeln für Anfagen bzw. dass permanent umfangreiche Datenquellen bewegt und verarbeitet werden müssenen.
Unser Integrations-Ansatz basiert auf einer adaptive Auswertungs-Technik, die es erlaubt Anfragen über XML-Daten mit verschiedensten und variierenden Strukturen zu verarbeiten. Hierbei ist keine Kenntnis der lokalen Schemata notwendig, sie kann jedoch zu Optimierungszwecken nichtsdestotrotz verwendet werden. Diese Technik bietet insbesondere einen mächtigen Ansatz für die Integration von Daten einer bestimmten Anwendungsdomäne, wie sie etwa bei der Integration von Katalogen verschiedenster Anbieter zu einem einheitlichen und gemeinsamen Marktplatz vorliegt.
Der Einsatz der adaptiven Evaluierungstechnik bietet den entscheidenden Vorteil, dass sie ein allgemein anwendbares Verfahren ist, welches ohne explizite Definition von Abbildungs- oder Umschreiberegeln in der Lage ist, Anfragen auf nahezu beliebigst strukturerte Datenquellen ausführen zu können.
Die Mächtigkeit unserer Anfragetechnik konnte in einer konkreten Implementierung eines verteilten und integrierten Katalogsystems auf Basis der XML-Speicherungs- und Verarbeitungstechnik XML2LDAP von Pedro José Marrón gezeigt werden. Dabei wurden eine Reihe von Realwelt-Katalogen: soweit künstliche Kataloge durch Anwendung unserer Anfragetechnik zu einem Katalogsystem integriert. Eine Online-Demoversion verschafft einen Eindruck unseres Systems.

Publikationen

Projekt-Mitglieder

Patente

Im Umfeld dieses Projekts liegen bereits Patente vor, bzw. sind Patente angemeldet:

  • Verarbeitung von XML in LDAP,
  • Adaptive Anfragetechnik zur Integration von elektronischen Katalogen.