Information Retrieval
Allgemeines
Auf dieser Seite finden Sie verschiedene Informationen zu der Vorlesung "Information Retrieval", die im Wintersemester 2008/2009 von Andreas Nürnberger gehalten wird. Diese Seite wird während der Lehrveranstaltung laufend aktualisiert.
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in nicht oder wenig strukturierten Datenbeständen wie z.B. Text- oder multimedialen Datenbanken. Beispiele für Anwendungen sind Internet-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bild- oder Videodatenbanken. Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt und anhand spezieller Anwendungsbereiche illustriert werden. Da die inhaltsorientierte Suche im Vordergrund steht, werden außerdem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten vorgestellt.
Organisatorische Regelungen für den Übungsschein und die Prüfungszulassung
Zu den Übungen gibt es Übungsblätter. Die Übungsaufgaben werden votiert. Durch eine Votierung erklärt man sich bereit, zu einer Aufgabe vorzutragen. (Lösungsvorschläge werden diskutiert, sie müssen nicht gleich richtig sein. Man sollte sich aber gründlich mit der Aufgabe beschäftigt haben.)
Zusätzlich zu den theoretischen Übungsaufgaben gibt es praktische Programmieraufgaben (Assignments), die eingereicht und mit Punkten bewertet werden. Diese Aufgaben sollen in Gruppen von 3-4 Studenten bearbeitet werden. Der Stichtag für die Einsendung wird für jedes Assignment bekanntgegeben, in der Regel stehen zwei bis drei Wochen für die Bearbeitung zur Verfügung.
Den Übungsschein bekommt, wer
- mindestens die Hälfte der Punkte für Assignments erreicht hat und
- mindestens die Hälfte der sonstigen Übungsaufgaben votiert hat und
- mindestens einmal in den Übungen vorgetragen hat.
Zum Erwerb eines Scheins (anstelle einer Prüfung) muss zusätzlich am Ende des Semesters ein kurzes Kolloquium (ca. 10 min.) bestanden werden.
Der Übungsschein ist Voraussetzung für die Prüfungszulassung!
Zusatzregelung für Studenten des Studiengangs "Master Medizinische Systeme"
Die Assignments müssen von Master-Studenten mit dem Studiengang "Master Medizinische Systeme" (aber auch nur von diesen!) nicht bearbeitet werden. Stattdessen sind für den Übungsschein 66% der Aufgaben zu votieren.
Termine und Räume
Veranstaltung | Zeit | Beginn | Raum |
Vorlesung | Mittwoch 17:00 - 18:30 | 22.10.2008 | G22A-122 |
Übung | Montag 15:00 - 17:00 | 03.11.2008 | G29-K058 |
Übung | Dienstag 11:00 - 13:00 | 28.10.2008 | G22B-103 |
Lehrende
Wenn Sie Fragen zur Vorlesung oder zu den Übungen haben, wenden Sie sich bitte (wenn möglich, per E-Mail) an
Übung:
- Stefan Haun
E-Mail: stefan.haun@ovgu.de - Marcus Nitsche
E-Mail: marcus.nitsche@ovgu.de
Material
Während der Vorlesung werden hier Folien, Übungsblätter und weiteres Material veröffentlicht.
Vorlesungsfolien
- Einführung (Teil 1) (slides in english )
- Einführung (Teil 2) (slides in english )
- Invertierter Index (slides in english )
- Vektorraummodell (slides in english )
- Fuzzy Modelle (slides in english )
- Probabilistische Modelle (slides in english )
- Mensch-Computer-Interaktion (Teil 1) (slides in english)
- Relevanz-Feedback (slides in english)
- Evaluierung (slides in english)
- Clustering (slides in english)
- Multimedia Retrieval (Teil 1) (slides are in english)
- Multimedia Retrieval (Teil 2) (slides are in english)
- Mensch-Computer-Interaktion (Teil 2)
- Suchmaschinen
- Suchmaschinen (Teil 2)
Übungsblätter
- Übungsblatt 01 (zum 28.10.2008)
- Übungsblatt 02 (zum 03.11.2008 bzw. 04.11.2008)
- Übungsblatt 03 (zum 10.11.2008 bzw. 11.11.2008) in english: Exercise 03 (up to 10.11.2008 rather 11.11.2008)
- Übungsblatt 04 (zum 17.11.2008 bzw. 18.11.2008) in english: Exercise 04 (up to 17.11.2008 rather 18.11.2008)
- Übungsblatt 05 (zum 24.11.2008 bzw. 25.11.2008) in english: Exercise 05 (up to 24.11.2008 rather 25.11.2008)
- Übungsblatt 06 (zum 01.12.2008 bzw. 02.12.2008) in english: Exercise 06 (up to 01.12.2008 rather 02.12.2008)
- Übungsblatt 07 (zum 08.12.2008 bzw. 09.12.2008) in english: Exercise 07 (up to 08.12.2008 rather 09.12.2008)
- Übungsblatt 08 (zum 15.12.2008 bzw. 16.12.2008) in english: Exercise 08 (up to 15.12.2008 rather 16.12.2008)
- Übungsblatt 09 (zum 12.01.2009 bzw. 13.01.2009) in english: Exercise 09 (up to 12.01.2009 rather 13.01.2009)
- Übungsblatt 10 (zum 19.01.2009 bzw. 20.01.2009) in english: Exercise 10 (up to 19.01.2009 rather 20.01.2009)
- Übungsblatt 11 (zum 26.01.2009 bzw. 27.01.2009) in english: Exercise 11 (up to 26.01.2009 rather 27.01.2009)
Assignments
- Richtlinien zur Bewertung der Assignments
- Assignment1 (zum 12.11.08 bzw. 19.11.08)
- Assignment2 (zum 05.01.09)
Es wird entgegen der vorherigen Auskunft kein drittes Assignment geben. Die praktischen Aufgaben sind damit abgeschlossen.
Zusatzmaterial
Aktuelles zum Thema
- Auf der dunklen Seite der Macht: Suchmaschinen im Internet ("Das Kulturgespräch" im Deutschlandfunk; 30.01.2009)
Literatur
- Modern Information Retrieval, Ricardo Baeza-Yates and Berthier Ribiero-Neto, Addison Wesley, 1999.
- Foundations of Statistical Natural Language Processing, Chris Manning and Hinrich Schütze, MIT Press, Cambridge, MA, 1999.
- Information Retrieval: Data Structures and Algorithms, William B. Frakes and Ricardo Baeza-Yates, Prentice-Hall, 1992.
- Soft Computing in Information Retrieval, Fabio Crestani and Gabriella Pasi, Physica Verlag, 2000.