Information Retrieval
Allgemeines
Auf dieser Seite finden Sie verschiedene Informationen zu der Vorlesung "Information Retrieval", die im Wintersemester 2011/2012 von Tatiana Gossen gehalten wird. Diese Seite wird während der Lehrveranstaltung laufend aktualisiert.
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in nicht oder wenig strukturierten Datenbeständen wie z.B. Text- oder multimedialen Datenbanken. Beispiele für Anwendungen sind Internet-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bild- oder Videodatenbanken. Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt und anhand spezieller Anwendungsbereiche illustriert werden. Da die inhaltsorientierte Suche im Vordergrund steht, werden außerdem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten vorgestellt.
Organisatorische Regelungen für den Übungsschein und die Prüfungszulassung
Zu den Übungen gibt es Übungsblätter. Die Übungsaufgaben werden votiert. Durch eine Votierung erklärt man sich bereit, zu einer Aufgabe vorzutragen. (Lösungsvorschläge werden diskutiert, sie müssen nicht gleich richtig sein. Man sollte sich aber gründlich mit der Aufgabe beschäftigt haben.)
Zusätzlich zu den theoretischen Übungsaufgaben gibt es praktische Programmieraufgaben (Assignments), die eingereicht und mit Punkten bewertet werden. Diese Aufgaben sollen in Gruppen von 3-4 Studenten bearbeitet werden. Der Stichtag für die Einsendung wird für jedes Assignment bekanntgegeben, in der Regel stehen zwei bis drei Wochen für die Bearbeitung zur Verfügung.
Den Übungsschein bekommt, wer
- mindestens die Hälfteder Punkte für Assignments erreicht hat und
- mindestens zwei Drittel der sonstigen Übungsaufgaben votiert hat und
- mindestens einmal in den Übungen vorgetragen hat.
Zum Erwerb eines Scheins (anstelle einer Prüfung) muss zusätzlich am Ende des Semesters ein kurzes Kolloquium (ca. 10 min.) bestanden werden.
Der Übungsschein ist Voraussetzung für die Prüfungszulassung!
Termine und Räume
Veranstaltung | Zeit | Beginn | Raum |
Vorlesung | Mittwoch 17:00 - 18:30(s.t.) | 12.10.11 | G22A-122 |
Übung | Montag 15:00 - 16:30 (s.t.) | 17.10.11 | G22A-119 |
Die Vorlesung am 21.12.2011 findet nicht statt!
Lehrende
Wenn Sie Fragen zur Vorlesung oder zu den Übungen haben, wenden Sie sich bitte (wenn möglich, per E-Mail) an
- Tatiana Gossen
E-Mail: tatiana.gossen@ovgu.de
Übung:
- Stefan Haun
E-Mail: stefan.haun@ovgu.de
Material
Während der Vorlesung werden hier Folien, Übungsblätter und weiteres Material veröffentlicht.
Vorlesungsfolien
- Einführung
- Vorverarbeitung von Dokumenten
- Indexing
- Vektorraum-Retrieval
- Probabilistische Retrievalmodelle
- Web-Suche: Link-based Retrieval
- Web-Suche: Crawling
- Search User Interfaces
- Evaluierung
- Latent Semantic Indexing
- Relevance Feedback & Query Expansion
Übungsblätter
- Übungsblatt 1 (zum 17.10.2011)
- Übungsblatt 2 (zum 24.10.2011)
- Übungsblatt 3 (zum 07.11.2011)
- Übungsblatt 4 (zum 14.11.2011)
- Übungsblatt 5 (zum 21.11.2011)
- Übungsblatt 6 (zum 28.11.2011)
- Übungsblatt 7 (zum 05.12.2011)
- Übungsblatt 8 (zum 12.12.2011)
- Übungsblatt 9 (zum 19.12.2011)
- Übungsblatt 10 (zum 09.01.2012)
- Übungsblatt 11 (zum 16.01.2012)
- Übungsblatt 12 (zum 23.01.2012)
Praktische Aufgaben
- Praktische Programmieraufgabe (zum 30.01.2012)
- Formale Vorgaben für die Lösung der Programmieraufgabe
- Hinweise zur Bewertung der Programmieraufgabe
Zusatzmaterial
Literatur
-
- Introduction to Information Retrieval, C.D. Manning, P. Raghavan, H. Schütze, Cambridge University Press, 2008. (Online-Version)
- Search User Interfaces, Marti Hearst, Cambridge University Press, 2009. (Online-Version)
- Soft Computing in Information Retrieval, Fabio Crestani and Gabriella Pasi, Physica Verlag, 2000.
- Modern Information Retrieval, Ricardo Baeza-Yates and Berthier Ribiero-Neto, Addison Wesley, 1999.
- Foundations of Statistical Natural Language Processing, Chris Manning and Hinrich Schütze, MIT Press, Cambridge, MA, 1999.
- Information Retrieval: Data Structures and Algorithms, William B. Frakes and Ricardo Baeza-Yates, Prentice-Hall, 1992.