Veranstalter:
Prof. Dr.
Georg Lausen, Geb. 051, Raum 01-025
Mitwirkung:
Kai Simon,
Geb. 051, Raum 01-026
Zeit, Ort & Organisatorisches:
Vorbesprechung
und Vergabe der Themen findet am Dienstag den 25. Oktober, 14:00h ct im
SR
01-009/13, Geb. 101 oder nach der Informationsveranstaltung am Montag
den 24. Oktober statt.
Präsentation und Handout können wahlweise in
deutscher oder englischer Sprache gehalten und angefertigt werden.
Wichtig: Eine unverbindliche Anmeldung für das
Proseminar
vor der Vorbesprechung am 24. und 25. Oktober ist möglich.
Bitte an Kai
Simon
schreiben.
Das Proseminar findet ab dem
10.01.2006 wöchentlich im SR
01-009/13, Geb. 101 jeweils
statt.
Themenvergabe: 24. und 25.10.2005
Sprache: Deutsch
ECTS: 3
Curriculumeinordnung:
Inhalt:
Information
Retrieval (IR), versteht sich als ein Teilgebiet der Informatik und
beschäftig sich im Wesentlichen mit der inhaltlichen Suche in
unstrukturierten Datenmengen. Im Gegensatz zu klassischen
Datenbanksystemen sind die Inhalte der zu durchsuchenden Daten beim
IR zumeist nicht genauer spezifiziert (d.h. es
existieren beispielsweise keine Metadaten). Das wohl bekannteste
Beispiel einer unstrukturierten Datenmenge ist das WWW, wo
unzählige Informationen in diversen Formaten ((X)HTML-Seiten,
PS-
und PDF-Dateien, XML-Dateien usw.) mit unbekannten Inhalten abgelegt
sind.
Das Information Retrieval stellt Techniken
und Verfahren zur Verfügung, die es erlauben, auf solchen Daten
effiziente und effektive Suchanfragen auszuwerten und die potentielle
Relevanz der Informationen für den Benutzer abzuschätzen.
Im diesem Proseminar sollen ausgewählte Themen und Konzepte
des
Information Retrievals bearbeitet werden.
Literatur:
Als einführende Literatur zum Thema Information Retrieval
werden
folgende Quellen empfohlen:
- [Rijs79] C. J. van
RIJSBERGEN: Information Retrieval. London, Butterworths,
1979. Online Version verfügbar unter (Web Link) [zuletzt
verfügbar
2005-09-31]
- [Baez99] Baeza-Yates, Richardo; Ribeiro-Neto, Berthier: Modern Information Retrieval. ACM
Press, New York, 1999, 0-21-39829-X.
- [Ferb03] Ferber, Reginald: Information
Retrieval - Suchmodelle und Data-Mining-Verfahren für
Textsammlungen und das Web. dpunkt.verlag, Heidelberg, 2003,
3-89864-213-5. HTML Online Version verfügbar unter (Web Link)
[zuletzt
verfügbar
2005-09-31]
- [Chak02] Soumen Chakrabarti: Mining
the Web Discovering Knowledge from Hypertext Data.
Morgen-Kaufmann, 2002,1-55860-754-4.
- [Page98] S. Brin and L. Page. The
anatomy of large-scale hypertextual web search engine. In
Proceeding of the Seventh International WWW Conference, 1998.
- [Klein99] J. Kleinberg. Authoritative sources
in a hyperlinked environment.
Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998.
Extended version in Journal of the ACM 46(1999).
Also appears as IBM Research Report RJ 10076, May 1997.
- [Info05a] Weitere Links zum Thema Information
Retrieval finden sich unter (Web Link)
[zuletzt
verfügbar
2005-09-31]
- [Info05b] Liste von Tools zum Thema Information Retrieval
finden sich unter (Web
Link) [zuletzt
verfügbar
2005-09-31]
Vorträge:
Themen
|
Termin
|
Thema
|
Quellen
|
|
25.10.2005
|
Vorbesprechung und Themenvergabe
|
|
|
17.01.2006
[Alexander Schätzle]
|
IR Grundlagen Einführung, Indizierung, Text Processing
|
[Rijs79] Kapitel 2 (Automatic Text Analysis)
[Baez99] Kapitel 7.2
|
|
17.01.2006
[Daniel Dietsch]
|
Probabilistisches IR
|
[Baez99] Kapitel 2.5.4, 2.8
[Rijs79] Kapitel 6
[Ferb03] Kapitel 10
|
|
24.01.2006
[Frank Gutmann]
|
Retrieval Bewertung und Vergleich
|
[Baez99] Kapitel 3.2, 3.3
[Ferb03] Kapitel 3.7
|
|
24.01.2006
[Nicola Sheldrick]
|
Schlüsselwort basierte Anfragen, Anfrageerweiterung
|
[Baez99] Kapitel 4.2, 5.3, 5.4
[Ferb03] Kapitel 13.2.3
|
|
31.01.2006
[Justus Bisser]
|
Kategorisieren (Clustering)
|
[Ferb03] Kapitel 5
|
|
31.01.2006
[Philipp Merkle]
|
Crawling Indexing
|
[Chak02] Kapitel 2
[Baez99] Kapitel 8
[Ferb03] Kapitel 16.4.1
|
|
07.02.2006
[Peter Schmitt]
|
Linktopologische Ranking Verfahren
|
[Chak02] Kapitel 7.2
[Page98] [Klein99]
|
|
07.02.2006
[Martin Przyjaciel-Zablocki]
|
IR- Benutzerinterfaces
|
[Baez99] Kapitel
10
|
Formales
Das Proseminar wird auf deutsch abgehalten (englische
Vorträge sind jedoch möglich).
Anforderungen
Anforderungen
für eine erfolgreiche Teilnahme:
- Bearbeitung eines Themas (inkl. Literaturrecherche usw.), das in
der Vorbesprechung ausgegeben wird
- Anfertigung einer Kurzzusammenfassung (1/2 bis max. 1 Seite)
- Fristgerechte Abgabe der Kurzzusammenfassung und der Folien
vor dem Vortrag
- Präsentation des Themas in einem ca. 45-minütigen
Vortrag an einem der Seminartermine
- Regelmässige, aktive Teilnahme an alle
Veranstaltungsterminen (inkl. Vorbereitung z.B. durch Lesen der
Kurzzusammenfassungen, die vorher an die Teilnehmer ausgegeben werden
usw.)
zuletzt geändert am:
25.10.2005
|