Information Retrieval
Allgemeines
Auf dieser Seite finden Sie verschiedene Informationen zu der Vorlesung "Information Retrieval", die im Wintersemester 2010/2011 von Andreas Nürnberger gehalten wird. Diese Seite wird während der Lehrveranstaltung laufend aktualisiert.
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in nicht oder wenig strukturierten Datenbeständen wie z.B. Text- oder multimedialen Datenbanken. Beispiele für Anwendungen sind Internet-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bild- oder Videodatenbanken. Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt und anhand spezieller Anwendungsbereiche illustriert werden. Da die inhaltsorientierte Suche im Vordergrund steht, werden außerdem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten vorgestellt.
Organisatorische Regelungen für den Übungsschein und die Prüfungszulassung
Zu den Übungen gibt es Übungsblätter. Die Übungsaufgaben werden votiert. Durch eine Votierung erklärt man sich bereit, zu einer Aufgabe vorzutragen. (Lösungsvorschläge werden diskutiert, sie müssen nicht gleich richtig sein. Man sollte sich aber gründlich mit der Aufgabe beschäftigt haben.)
Zusätzlich zu den theoretischen Übungsaufgaben gibt es praktische Programmieraufgaben (Assignments), die eingereicht und mit Punkten bewertet werden. Diese Aufgaben sollen in Gruppen von 3-4 Studenten bearbeitet werden. Der Stichtag für die Einsendung wird für jedes Assignment bekanntgegeben, in der Regel stehen zwei bis drei Wochen für die Bearbeitung zur Verfügung.
Den Übungsschein bekommt, wer
- mindestens die Hälfteder Punkte für Assignments erreicht hat und
- mindestens zwei Drittel der sonstigen Übungsaufgaben votiert hat und
- mindestens einmal in den Übungen vorgetragen hat.
Zum Erwerb eines Scheins (anstelle einer Prüfung) muss zusätzlich am Ende des Semesters ein kurzes Kolloquium (ca. 10 min.) bestanden werden.
Der Übungsschein ist Voraussetzung für die Prüfungszulassung!
Termine und Räume
Veranstaltung | Zeit | Beginn | Raum |
Vorlesung | Mittwoch 17:00 - 18:30 | 13.10.10 | G22A-122 |
Übung | Montag 15:00 - 17:00 | 18.10.10 | G22A-119 |
Übung | Dienstag 11:00 - 13:00 | 19.10.10 | G22B-103 |
Lehrende
Wenn Sie Fragen zur Vorlesung oder zu den Übungen haben, wenden Sie sich bitte (wenn möglich, per E-Mail) an
Übung:
- Tatiana Gossen
E-Mail: tatiana.gossen@ovgu.de - Stefan Haun
E-Mail: stefan.haun@ovgu.de
Material
Während der Vorlesung werden hier Folien, Übungsblätter und weiteres Material veröffentlicht.
Vorlesungsfolien
- Einführung
- Document Pre-Processing (Aktualisiert am 28.10.2010)
- Indexing (Aktualisiert am 11.11.2010)
- Vector Space Model
- Probabilistisches Retrieval Modell (Aktualisiert am 03.12.2010)
- Latent Semantic Indexing
- Evaluation
- HCI
- Websuche: Linkanalyse
- Websuche: Crawling
Übungsblätter
- Übungsblatt 01 (zum 18.10.2010 bzw 19.10.2010)
- Übungsblatt 02 (zum 25.10.2010 bzw 26.10.2010)
- Übungsblatt 03 (zum 01.11.2010 bzw 02.11.2010)
- Übungsblatt 04 (zum 08.11.2010 bzw 09.11.2010)
- Übungsblatt 05 (zum 15.11.2010 bzw 16.11.2010)
- Übungsblatt 06 (zum 22.11.2010 bzw 23.11.2010)
- Übungsblatt 07 (zum 29.11.2010 bzw 30.11.2010)
- Übungsblatt 08 (zum 06.12.2010 bzw 07.12.2010)
- Übungsblatt 09 (zum 13.12.2010 bzw 14.12.2010)
- Übungsblatt 10 (zum 10.01.2011 bzw 11.01.2011)
- Übungsblatt 11 (zum 17.01.2011 bzw 18.01.2011)
- Übungsblatt 12 (zum 24.01.2011 bzw 25.01.2011)
- Übungsblatt 13 (zum 31.01.2011 bzw 01.02.2011)
Praktische Aufgaben
- Formale Vorgaben für die Lösung der Programmieraufgaben (Deadline 8.11.2010 beachten!)
- Hinweise zur Bewertung der Programmieraufgaben
- Assignment 1 (zum 15.11.2010)
- Assignment 2 (zum 20.12..2010)
Zusatzaufgaben
- Assignment* (zum 31.01.2011)
Zusatzmaterial
Literatur
- Introduction to Information Retrieval, C.D. Manning, P. Raghavan, H. Schütze, Cambridge University Press, 2008. (Online-Version)
- Search User Interfaces, Marti Hearst, Cambridge University Press, 2009. (Online-Version)
- Soft Computing in Information Retrieval, Fabio Crestani and Gabriella Pasi, Physica Verlag, 2000.
- Modern Information Retrieval, Ricardo Baeza-Yates and Berthier Ribiero-Neto, Addison Wesley, 1999.
- Foundations of Statistical Natural Language Processing, Chris Manning and Hinrich Schütze, MIT Press, Cambridge, MA, 1999.
- Information Retrieval: Data Structures and Algorithms, William B. Frakes and Ricardo Baeza-Yates, Prentice-Hall, 1992.