Information Retrieval
Allgemeines
Auf dieser Seite finden Sie verschiedene Informationen zu der Vorlesung "Information Retrieval", die im Wintersemester 2009/2010 von Andreas Nürnberger gehalten wird. Diese Seite wird während der Lehrveranstaltung laufend aktualisiert.
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in nicht oder wenig strukturierten Datenbeständen wie z.B. Text- oder multimedialen Datenbanken. Beispiele für Anwendungen sind Internet-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bild- oder Videodatenbanken. Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt und anhand spezieller Anwendungsbereiche illustriert werden. Da die inhaltsorientierte Suche im Vordergrund steht, werden außerdem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten vorgestellt.
Organisatorische Regelungen für den Übungsschein und die Prüfungszulassung
Zu den Übungen gibt es Übungsblätter. Die Übungsaufgaben werden votiert. Durch eine Votierung erklärt man sich bereit, zu einer Aufgabe vorzutragen. (Lösungsvorschläge werden diskutiert, sie müssen nicht gleich richtig sein. Man sollte sich aber gründlich mit der Aufgabe beschäftigt haben.)
Zusätzlich zu den theoretischen Übungsaufgaben gibt es praktische Programmieraufgaben (Assignments), die eingereicht und mit Punkten bewertet werden. Diese Aufgaben sollen in Gruppen von 3-4 Studenten bearbeitet werden. Der Stichtag für die Einsendung wird für jedes Assignment bekanntgegeben, in der Regel stehen zwei bis drei Wochen für die Bearbeitung zur Verfügung.
Den Übungsschein bekommt, wer
- mindestens die Hälfte der Punkte für Assignments erreicht hat und
- mindestens die Hälfte der sonstigen Übungsaufgaben votiert hat und
- mindestens einmal in den Übungen vorgetragen hat.
Zum Erwerb eines Scheins (anstelle einer Prüfung) muss zusätzlich am Ende des Semesters ein kurzes Kolloquium (ca. 10 min.) bestanden werden.
Der Übungsschein ist Voraussetzung für die Prüfungszulassung!
Alle Einreichungen der praktischen Aufgabe waren für die Zulassung ausreichend. Für individuelle Informationen zur Zulassung, insbesondere bezüglich der Votierungen, wenden Sie sich bitte an einen der Übungsleiter.
Termine und Räume
Veranstaltung | Zeit | Beginn | Raum |
Vorlesung | Mittwoch 17:00 - 18:30 | 14.10.09 | G22A-122 |
Übung | Montag 15:00 - 17:00 | 19.10.09 | G22A-119 |
Übung | Dienstag 11:00 - 13:00 | 20.10.09 | G22B-103 |
Die Übungen am 30.11.2009 bzw. 01.12.2009 entfallen!
Klausureinsicht
Termine für die Einsicht der IR-Klausuren sind:
- Dienstag, d. 23.03.2010 von 13-15 Uhr
- Mittwoch, d. 07.04.2010 von 13-14 Uhr
jeweils im Raum G29-002.
Lehrende
Wenn Sie Fragen zur Vorlesung oder zu den Übungen haben, wenden Sie sich bitte (wenn möglich, per E-Mail) an
Übung:
- Stefan Haun
E-Mail: shaun@iti.cs.uni-magdeburg.de - Tatiana Gossen
E-Mail: tatiana.gossen@ovgu.de - Marcus Nitsche
E-Mail: marcus.nitsche@ovgu.de
Material
Während der Vorlesung werden hier Folien, Übungsblätter und weiteres Material veröffentlicht.
Vorlesungsfolien
- Einführung
- Document Pre-Processing
- Indexing
- Vector Space Model
- Latent Semantic Indexing
- The Probabilistic Model
- Human-Computer Interaction
- Evaluation
- Websuche: Linkanalyse
- Websuche: Crawling
Übungsblätter
- Übungsblatt 01 (zum 19.10.2009 bzw 20.10.2009)
- Übungsblatt 02 (zum 26.10.2009 bzw 27.10.2009)
- Übungsblatt 03 (zum 02.11.2009 bzw 03.11.2009) (englische Version)
- Übungsblatt 04 (zum 09.11.2009 bzw 10.11.2009) (englische Version)
- Übungsblatt 05 (zum 16.11.2009 bzw 17.11.2009) (englische Version)
- Übungsblatt 06 - theoretischer Teil (zum 23.11.2009 bzw 24.11.2009) (englische Version)
- Übungsblatt 06 - praktischer Teil (zum 25.11.2009)
- Übungsblatt 07 (zum 07.12.2009 bzw. 08.12.2009) (englische Version)
- Übungsblatt 08 (zum 14.12.2009 bzw. 15.12.2009) (englische Version)
- Übungsblatt 09 (zum 21.12.2009 bzw. 22.12.2009) (englische Version)
- Übungsblatt 10 (zum 11.01.2010 bzw. 12.01.2010) (englische Version)
- Übungsblatt 11 - praktischer Teil (zum 27.01.2009)
- Übungsblatt 11 (zum 18.01.2010 bzw. 19.01.2010) (englische Version)
- Übungsblatt 12 (zum 25.01.2010 bzw. 26.01.2010) (englische Version)
Hinweis: Bei gleichzeitig verfügbaren deutschen und englischen Übungsblättern ist für die Aufgabenstellung das deutsche Übungsblatt maßgebend und das englische Übungsblatt lediglich als Hilfestellung gedacht.
Zusatzmaterial
- LSI-Tutorial
- Porter Stemmer Algorithmus
- Formale Vorgaben für die Lösung der Programmieraufgaben
- Bewertung der Programmieraufgaben
Literatur
- Introduction to Information Retrieval, C.D. Manning, P. Raghavan, H. Schütze, Cambridge University Press, 2008. (Online-Version)
- Soft Computing in Information Retrieval, Fabio Crestani and Gabriella Pasi, Physica Verlag, 2000.
- Modern Information Retrieval, Ricardo Baeza-Yates and Berthier Ribiero-Neto, Addison Wesley, 1999.
- Foundations of Statistical Natural Language Processing, Chris Manning and Hinrich Schütze, MIT Press, Cambridge, MA, 1999.
- Information Retrieval: Data Structures and Algorithms, William B. Frakes and Ricardo Baeza-Yates, Prentice-Hall, 1992.