Performance und Power

Künstliche Intelligenz: Algorithmus findet die einprägsamsten Fotos

Der Daumen soll sich nach oben heben und nicht von Langeweile getrieben weiterscrollen. Ob aber das unter hunderten Schnappschüssen ausgewählte Foto aus dem Bilderstrom im Internet hervorstechen wird, kann nun jeder selbst überprüfen. Denn das Projekt LaMem-Demo bewertet die Einprägsamkeit von Fotos und zeigt mittels eines Farbdiagramms auf, welche Bereiche das Bild besonders effektvoll machen. Die Grundlage dafür ist ein am Massachusetts Institute of Technology (MIT) entwickelter Algorithmus, der eine große Menge besonders einprägsamer Fotos aus einer Datenbank miteinander vergleicht und wiederkehrende Muster aufspürt.

Möchte also der Selfie-Fotograf und Social Network-Nutzer eine Erfolgsprognose oder Verbesserungstipps, muss er nur sein Werk hochladen und überprüfen lassen. „Das ist wie eine ständig bereitstehende Fokusgruppe, die einem sagt, mit welcher Wahrscheinlichkeit sich jemand an eine visuelle Nachricht erinnern wird“, erklärt Aditya Khosla vom MIT-Forschungsinstitut Computer Science and Artificial Intelligence Laboratory, kurz CSAIL. „Wenn wir verstehen, was Einprägsamkeit ausmacht, können wir Systeme entwickeln, die die wichtigsten Informationen festhalten oder umgekehrt jene Informationen speichern, die Menschen am ehesten wieder vergessen“. Wer möchte, kann das Tool hier direkt einmal ausprobieren:

Kommentierte Bilddatenbank mit 60.000 Fotos

Künstliche neuronale Netze schaffen neue Verbindungen

Für ihr Projekt legte Khosla gemeinsam mit seinen CSAIL-Kollegen Akhil Raju, Professor Antonio Torralba und Aude Oliva zunächst die kommentierte Fotosammlung LaMem mit 60.000 Bildern an. In einem Online-Experiment ließen die Forscher eine Probandengruppe die Einprägsamkeit der Fotos auf einer Skala bewerten. Mithilfe der erhobenen Daten brachte sich der Algorithmus schließlich selbst bei, welche Bilder im Gedächtnis blieben, indem er Muster und Ähnlichkeiten analysierte.

Sample images from LaMem arranged by their memorability score (decreasing from left to right). LaMem contains a very large variety of images ranging from object-centric to scene-centric images, and objects from unconventional viewpoints
Diese Beispielbilder aus der LaMem-Datenbank wurden so angeordnet, dass ihr Einprägsamkeitswert von links nach rechts abnimmt. LaMem enthält eine große Bandbreite unterschiedlicher, teils außergewöhnlicher Motive und Aufnahmeperspektiven.

Technische Grundlage dafür sind künstliche neuronale Netze. Dem Gehirn ähnlich führen sie verschiedene zufällige Berechnungen des zu bearbeitenden Datensatzes durch und schaffen selbstständig neue Verbindungen. Diese als Deep Learning bezeichnete Methode aus dem Forschungsbereich der künstlichen Intelligenz kommt auch in Apples Siri, Googles Autovervollständigung und der Fotoerkennung von Facebook zum Einsatz. Je größer die zur Verfügung gestellte Datenmenge, desto besser funktioniert die Technik. Deshalb griffen die Forscher auch auf die bereits bestehenden CSAIL-Datenbanken SUN und Places zurück, die vor allem Bilder von Landschaften beinhalten.

Deep Learning macht Algorithmus erfolgreich

Fast die gleiche Trefferquote wie menschliche Tester

„Während Deep Learning schon für große Fortschritte bei der Erkennung von Objekten und Landschaften gesorgt hat, wurde das Vorhersagen der menschlichen Erinnerung bisher oft als ein höherer kognitiver Prozess angesehen, der sich niemals von der Informatik bewältigen lassen wird“, lacht Oliva. „Nun, wir können es und wir haben es getan!“ Wie leistungsfähig der geschaffene Algorithmus wirklich ist, prüften die Forscher, indem sie ihn in einem Experiment gegen eine menschliche Testgruppe antreten ließen.

method2
Um zu testen, ob die Probanden sich an bestimmte Motive erinnern können, wurden ihnen diese in festen Zeitabständen und getrennt von Füllbildern immer wieder vorgeführt. Dadurch ermittelten die Forscher den Einprägsamkeitswert.

Dabei ging es um die Frage, wer besser voraussagen kann, wie gut sich eine weitere Gruppe an nie zuvor gesehene Bilder erinnern können würde. Während die Probanden 68 Prozent der Bilder korrekt als besonders einprägsam bewerteten, schaffte der Algorithmus 64 Prozent. Damit ist er fast so gut wie ein Mensch und um 30 Prozent besser als alle bisherigen Algorithmen seines Typs.

Neue Erkenntnisse zur Bildgestaltung

Grundlage zur Entwicklung effektiverer Lernmethoden

„Diese Art der Forschung eröffnet uns ein besseres Verständnis für jene visuellen Informationen, auf die Menschen besonders achten. Für Vermarkter, Regisseure und andere Gestalter ergeben sich daraus interessante neue Möglichkeiten, auf die Befindlichkeit von Betrachtern einzuwirken“, sagt Alexei Efros, Associate Professor für Informatik an der Berkeley-Universität. Künftig möchten die CSAIL-Wissenschaftler unter anderem eine App entwickeln, die Fotos automatisch leicht verändert und damit einprägsamer macht. Neben der Verbesserung von Postings, Werbung und Logodesign ergeben sich aber noch weitere Möglichkeiten.

low-high-meduim

Denn die Forschung liefert Einblicke in die Funktionsweise des menschlichen Gedächtnisses. Die Erkenntnis, wie und warum wir uns Bilder besser merken können, schafft dabei die Grundlage für die Entwicklung effektiverer Lehr- und Lernmethoden. Tatsächlich ergaben die CSAIL-Experimente, dass sich die Probanden mit der Erhöhung einprägsamer Fotos in einem Datensatz auch an mehr Motive erinnerten. „Das bedeutet, dass wir möglicherweise das Gedächtnis von Menschen verbessern können, indem wir ihnen besonders einprägsame Bilder zeigen“, sagt Khosla mit Blick auf künftige Forschungsfelder.

Cover-Foto: Flickr – R4vi (CC BY-SA 2.0)
Bild 1 & 2: Massachusetts Institute of Technology – LaMem
Bild 3: MIT News – CSAIL

 

Artikel empfehlen

Zugehörige Themen

Unterhaltung

Als Nächstes lesen

Read Full Story