IIF
Albert-Ludwigs-Universtät Freiburg
Impressum
Technische Fakultät
DBIS ::: Lehre ::: WS0506 ::: Information Retrieval

Veranstalter:

Prof. Dr. Georg Lausen, Geb. 051, Raum 01-025

Mitwirkung:

Kai Simon, Geb. 051, Raum 01-026

Zeit, Ort & Organisatorisches:

Vorbesprechung und Vergabe der Themen findet am Dienstag den 25. Oktober, 14:00h ct im SR 01-009/13, Geb. 101 oder nach der Informationsveranstaltung am Montag den 24. Oktober statt.

Präsentation und Handout können wahlweise in deutscher oder englischer Sprache gehalten und angefertigt werden.

Wichtig: Eine unverbindliche Anmeldung für das Proseminar vor der Vorbesprechung am 24. und 25. Oktober ist möglich. Bitte an Kai Simon schreiben.

Das Proseminar findet ab dem 10.01.2006 wöchentlich im SR 01-009/13, Geb. 101 jeweils

    Dienstag von 14-16 Uhr

statt.

Themenvergabe: 24. und 25.10.2005

Sprache: Deutsch

ECTS: 3

Curriculumeinordnung:

    Bachelor of Science

Inhalt:

Information Retrieval (IR), versteht sich als ein Teilgebiet der Informatik und beschäftig sich im Wesentlichen mit der inhaltlichen Suche in unstrukturierten Datenmengen. Im Gegensatz zu klassischen Datenbanksystemen sind die Inhalte der zu durchsuchenden Daten beim IR zumeist nicht genauer spezifiziert (d.h. es existieren beispielsweise keine Metadaten). Das wohl bekannteste Beispiel einer unstrukturierten Datenmenge ist das WWW, wo unzählige Informationen in diversen Formaten ((X)HTML-Seiten, PS- und PDF-Dateien, XML-Dateien usw.) mit unbekannten Inhalten abgelegt sind.

Das Information Retrieval stellt Techniken und Verfahren zur Verfügung, die es erlauben, auf solchen Daten effiziente und effektive Suchanfragen auszuwerten und die potentielle Relevanz der Informationen für den Benutzer abzuschätzen.

Im diesem Proseminar sollen ausgewählte Themen und Konzepte des Information Retrievals bearbeitet werden.

Literatur:

Als einführende Literatur zum Thema Information Retrieval werden folgende Quellen empfohlen:

  • [Rijs79] C. J. van RIJSBERGEN: Information Retrieval. London, Butterworths, 1979. Online Version verfügbar unter (Web Link) [zuletzt verfügbar 2005-09-31]
  • [Baez99] Baeza-Yates, Richardo; Ribeiro-Neto, Berthier: Modern Information Retrieval. ACM Press, New York, 1999, 0-21-39829-X.
  • [Ferb03] Ferber, Reginald: Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web. dpunkt.verlag, Heidelberg, 2003, 3-89864-213-5. HTML Online Version verfügbar unter (Web Link) [zuletzt verfügbar 2005-09-31]
  • [Chak02] Soumen Chakrabarti: Mining the Web Discovering Knowledge from Hypertext Data. Morgen-Kaufmann, 2002,1-55860-754-4.
  • [Page98] S. Brin and L. Page. The anatomy of large-scale hypertextual web search engine. In Proceeding of the Seventh International WWW Conference, 1998.
  • [Klein99] J. Kleinberg. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. Extended version in Journal of the ACM 46(1999). Also appears as IBM Research Report RJ 10076, May 1997.
  • [Info05a] Weitere Links zum Thema Information Retrieval finden sich unter (Web Link) [zuletzt verfügbar 2005-09-31]
  • [Info05b] Liste von Tools zum Thema Information Retrieval  finden sich unter (Web Link) [zuletzt verfügbar 2005-09-31]

Vorträge:

Themen

Termin

Thema

Quellen

25.10.2005

Vorbesprechung und Themenvergabe

 

17.01.2006
[Alexander Schätzle]

IR Grundlagen Einführung, Indizierung, Text Processing

[Rijs79] Kapitel 2 (Automatic Text Analysis)
[Baez99] Kapitel 7.2

17.01.2006
[Daniel Dietsch]

Probabilistisches IR

[Baez99] Kapitel 2.5.4, 2.8
[Rijs79] Kapitel 6
[Ferb03] Kapitel 10

24.01.2006
[Frank Gutmann]

Retrieval Bewertung und Vergleich

[Baez99] Kapitel 3.2, 3.3
[Ferb03] Kapitel 3.7

24.01.2006
[Nicola Sheldrick]

Schlüsselwort basierte Anfragen, Anfrageerweiterung

[Baez99] Kapitel 4.2, 5.3, 5.4
[Ferb03] Kapitel 13.2.3

31.01.2006
[Justus Bisser]

Kategorisieren (Clustering)

[Ferb03] Kapitel 5

31.01.2006
[Philipp Merkle]

Crawling Indexing

[Chak02] Kapitel 2
[Baez99] Kapitel 8
[Ferb03] Kapitel 16.4.1

07.02.2006
[Peter Schmitt]

Linktopologische Ranking Verfahren

[Chak02] Kapitel 7.2
[Page98] [Klein99]

07.02.2006
[Martin Przyjaciel-Zablocki]

IR- Benutzerinterfaces

[Baez99] Kapitel 10


Formales

Das Proseminar wird auf deutsch abgehalten (englische Vorträge sind jedoch möglich).

Anforderungen
Anforderungen für eine erfolgreiche Teilnahme:

  • Bearbeitung eines Themas (inkl. Literaturrecherche usw.), das in der Vorbesprechung ausgegeben wird
  • Anfertigung einer Kurzzusammenfassung (1/2 bis max. 1 Seite)
  • Fristgerechte Abgabe der Kurzzusammenfassung und der Folien vor dem Vortrag
  • Präsentation des Themas in einem ca. 45-minütigen Vortrag an einem der Seminartermine
  • Regelmässige, aktive Teilnahme an alle Veranstaltungsterminen (inkl. Vorbereitung z.B. durch Lesen der Kurzzusammenfassungen, die vorher an die Teilnehmer ausgegeben werden usw.)
zuletzt geändert am: 25.10.2005