Visipedia - Visuelle Suche und Wissensrepräsentation

http://hci.iwr.uni-heidelberg.de/MIP/Teaching/visipedia/
Thema: Pedro Perona hat in einer viel beachteten Arbeit die Umsetzung einer VISIPEDIA als Fernziel für die Forschung im Bereich Computer Vision ausgemacht:

"The web is not perfect: while text is easily searched and organized, pictures (the vast majority of the bits that one can find on-line) are not. In order to see how one could improve the web and make pictures first-class citizens of the web, I explore the idea of Visipedia, a visual interface for Wikipedia that is able to answer visual queries and enables experts to contribute and organize visual knowledge. Four distinct groups of humans would interact through Visipedia: users, experts, visual workers and machine vision scientists. The latter would gradually build automata able to interpret images. I explore some of the technical challenges involved in making Visipedia happen. I argue that Visipedia will likely grow organically, combining state-of-the-art machine vision with human labor." [P. Perona] Paper als PDF

Natürlich werden wir in disem Praktikum keine vollständige Visipedia implementieren können, aber wir werden Algorithmen zu verschiedenen Teilaspekten umsetzen...
Kurs: 11BINPR231
Zielgruppe: Studierende der Physik, Mathematik und Informatik ...
Credits: 6 ECTS-Punkte - alternative Anrechnung nach Absprache möglich!
Vorraussetzungen: Vorkenntnisse in C++ erforderlich.
Dozenten: Ullrich Köthe and Janis Fehr, Daniel Kondermann
HCI, Speyerer Strasse 6, 69115 Heidelberg
Zeit und Ort: noch offen, z.B. Montags von 13:00 - 18:00 Uhr
Praktikumsraum des HCI, Speyerer Strasse 6, zweiter Stock
Vorbesprechung + Themenvergabe: Montag, 18.10.2010 13:00-14:00 Uhr
Praktikumsraum des HCI, Speyerer Strasse 6, zweiter Stock
Unverbindliche Anmeldung:
Name:
Email:
Studienfach:
Modus: Arbeit in kleinen Gruppen (2 bis max. 3 Teilnehmer pro Gruppe)
Betreuung durch die Dozenten während der Präsenzzeit
Ein Verfahren pro Gruppe
Vorstellung der Theorie des Verfahrens in einem Seminarvortrag (im ersten Drittel des Semesters)
Präsentation der Ergebnisse am Ende des Semesters

Themen/Literatur (Vorschläge)

ThemaLiteraturBetreuerBeispiel
Gesichtserkennung Automatische Detektion und Erkennung von Personen in Bildern
  • Facedetector von Viola und Jones
  • Gesichtserkennung mit EigenFaces
  • Übersichtsartikel über den aktuellen Stand der Gesichtsdetektion (2010)
  • "Histogram of Oriented Gradients" zur Detektion von Personen von Dalal und Triggs
Janis Fehr
Objekterkennung Automatische Detektion und Erkennung von Objektklassen in Bildern
  • Bag-of-Features Ansatz von Freeman et al
Janis Fehr
Die Essenz einer Szene (Gist of a Scene) Automatische Erkennung der Bildkategorie (z.B. Innen vs. Aussen) und anderer Kontextinformationen
  • GIST-Merkmale von Oliva und Torralba
  • SIFT-Merkmale für die Szenenerkennung von Lazebnik et al
  • Histogram-of-Gradients Methode für die Szenenerkennung von Felzenszwalb et al
  • TinyImages-Methode von Wendel und Pinz
  • ARTSCENE Ansatz von Grossberg et al
  • Umfassender Vergleich verschiedener Ansätze
  • Experimentelle Analyse: Wie gut sind Menschen?
Ullrich Köthe
Bildästhetik The Good, the Bad, and the Ugly
  • Automatische Erkennung des Malers
  • Automatische Erkennung von Malstilen
  • Lernverfahren zur Schätzung der ästhetischen Qualität von Bildern
Ullrich Köthe
Interaktive Segmentierung Objektdetektion mit Benutzerunterstützung
  • Intelligent Scissors von Mortensen und Barrett und eine verbesserte Version derselben Idee
  • Interaktive Segmentierung in der GeoMap von Meine und Köthe
  • Hierachische Segmentierung von Arbelaez und Cohen
  • GrabCut von Rother et al
  • kann z.B. für LabelMe oder in Ilastik eingesetzt werden.
Ullrich Köthe
3D Rekonstruktion Automatische Rekonstruktion dreidimensionaler Szenen aus Einzelbildern und Videos
Daniel Kondermann
3D Stereoschätzung Automatische Schätzung von Tiefenkarten
  • Tiefenkartenerzeugung aus Bewegung
  • Tiefenkartenerzeugung aus Stereokameras
Daniel Kondermann
... weitere Themen sind möglich