Uni-Logo
Databases and Information Systems
Sie sind hier: Startseite Teaching Lehrangebot Frühere Semester Ontologiegestuetzte Suche in unstrukturierten Daten
 

Ontologiegestuetzte Suche in unstrukturierten Daten

Veranstalter:

Prof. Dr. Georg Lausen

Mitwirkung:

Kai Simon
Geb. 051, Raum 01-026

Thomas Hornung
Geb. 051, Raum 01-028

Sprache: Deutsch/Englisch

ECTS: 16 (Master) / 6 (Bachelor)

Zeit, Ort & Organisatorisches:

Für diese Veranstaltung ist eine vorherige Anmeldung per Mail an Kai Simon erforderlich (Bitte Matrikelnummer, Prüfungsordnung, Fachsemester angeben). Die endgültige Teilnehmerliste wird bei der Einführungsveranstaltung am 25.10.07 bekannt gegeben.

Raum: Geb. 051, SR 00-006
Zeit: Donnerstag, 16 - 19 Uhr (s.t)

Curriculumeinordnung:

  • Bachelor of Science: 5. Semester (Projekt)
  • Master of Science: 3. Semester (Team Projekt)

Folien:


Inhalt:

Das Web dient heutzutage in vielen Bereichen als eines der wichtigsten Informationsquellen. Doch durch die Größe des Webs führt der Weg zur Informationsquelle zumeist über den Gebrauch eines Suchdienstes. Suchdienste versuchen soviel Informationen wie möglich zu sammeln und zu indexieren um ein großes Spektrum des Webs abdecken zu können. Ein wesentlicher Bestandteil einer jeden Suchmaschine ist der Crawler, der neue Informationsquellen erschließen soll aber auch alte bereits indexierte Informationen auf dem neusten Stand hält.
Im Rahmen des Projekts beschäftigen wir uns mit Crawlern, die nicht wahllos nach neuen Informationen suchen, sondern zielgerichtet, fokussiert neue Quellen indexieren. Ausgehend von einer Ontologie, die eine genauere Beschreibung der gewünschten Information beinhaltet, werden neue Informationsquellen identifiziert und bewertet. Ontologien sind ein zentraler Bestandteil des World Wide Web genauer des Semantic Webs. Sie ermöglichen, dass Zusammenhänge zwischen Objekten der realen Welt implizit und explizit ausgedrückt werden können.

Ziel:

Ziel ist der Entwurf eines Fokus-Crawlers, der Daten zielgerichtet aus dem Web sammelt und indexiert. Zur Abspeicherung der gefunden Information soll ein Indexformat umgesetzt werden, dass eine effiziente Verwaltung der Daten ermöglicht. Die gesammelten Daten sollen schließlich zur maschinellen Weiterverarbeitung in eine semantische Form überführt werden.

Prüfungsleistungen: (Bachelor)

Für den erfolgreichen Abschluss des Projekts sind neben der Realisierung eines Teilprojekts auch die Dokumentation, ein Projektprotokoll und die Präsentation der Ergebnisse erforderlich.

Literatur: