Wird geladen ...
Beim Laden des Inhalts ist leider ein Fehler aufgetreten.

117TELEPOLIS: Erkennungstests bevorzugen Computer

Nachrichten erweitern
  • larrycook08@yahoo.es
    18. Aug. 2008
      Dieser TELEPOLIS Artikel wurde Ihnen
      von <larrycook08@...> gesandt.
      ------------------------------------------------------------
      Erkennungstests bevorzugen Computer
      Matthias Gräbner 26.01.2008

      Manchmal ist Fortschritt nur scheinbar: Dass Computer so gut gelernt
      haben, Objekte zu erkennen, liegt zumindest teilweise daran, dass die
      Forscher ihnen diese Aufgabe zu sehr erleichtert haben

      Wenn Fahrzeuge sich in nachgebauten Städten Rennen liefern oder
      Überwachungskameras automatisch auf gefährlich erscheinende Situationen
      reagieren sollen, benötigen sie die Fähigkeit, sich visuell über ihre
      Umwelt klarzuwerden. Wenigstens auf dem Papier hat sich in diesem
      Bereich eine Menge getan: Bei Tests an Datenbanken von Fotos erreichen
      einige Algorithmen bereits Objekt-Erkennungsraten von 60 Prozent. Da
      die Motive hierbei vom Computer in 102 verschiedene Kategorien (etwa
      Gesichter oder Autos) einzuteilen sind, liegt die Chance, zufällig
      einen Treffer zu landen, bei weniger als einem Prozent. Dem visuellen
      Erkennungsprozess des Menschen jedoch gelingen in der Regel 100 Prozent
      problemlos.

         

      Das ist angesichts der Schwierigkeit der Aufgabe ja auch kein Wunder:
      jedes Objekt hinterlässt, abhängig von seiner Position und der Position
      des Betrachters, aber auch von der Beleuchtung und der Gestalt, die es
      gerade einnimmt, auf der Netzhaut ganz verschiedene Spuren. Dass wir
      unser Gegenüber trotzdem erkennen, egal ob es über oder unter uns liegt
      oder neben uns läuft, ist eine ganz erstaunliche Leistung des Gehirns.

      Dass die vom Menschen erdachten Algorithmen wohl noch weiter davon
      entfernt sind, als die oben genannten 60 Prozent Erkennungsleistung
      vermuten lassen, zeigen US-Forscher in einem Aufsatz im
      Wissenschaftsmagazin Computational Biology.

      Erkennungsleistung des einfachen Modells bei "natürlichen" Fotos von
      menschlichen Fotografen (Bild: Pinto at al)

      Die am Massachusetts Institute of Technology beschäftigten Forscher
      stießen darauf, als sie ein sehr simples Modell der Objekterkennung
      konstruierten - einen grundlegenden Baby-Algorithmus, der nur den
      allerersten Schritt unseres Erkennungsprozesses nachahmt. Die Software
      betrachtet einfach nur jeden Punkt des Bildes und sucht nach Kanten -
      mehr nicht. Sie hat also keinerlei Verständnis von Umrissen und kann
      Position oder Objektgröße nicht auswerten.

      Eigentlich sollte dieses Modell bei den üblichen Tests schmählich
      versagen - doch es schlug sich erstaunlich gut. Es konnte bei den
      Fehlerraten mit den fortgeschrittensten Konkurrenten mithalten und
      übertraf diese sogar teilweise, und das selbst dann, wenn es kaum
      trainiert worden war.

      Verminderte Erkennungsleistung des einfachen Modells, wenn Position und
      Größe des Motivs wie in der Natur stark variieren (
      Grafik in voller Größe ansehen)

      Fehlerquelle: der menschliche Blick

      Das Ergebnis zeugt nun nicht unbedingt davon, dass aktuelle
      Objekterkennungssystem schlecht sind: Es verrät vor allem, dass die zu
      deren Test benutzten Bild-Datenbanken grundlegend fehlerhaft sind. Die
      Forscher machen dafür vor allem verantwortlich, dass die hier
      enthaltenen Fotos von menschlichen Fotografen aufgenommen wurden. Und
      die haben einen ganz bestimmten Blick für Motive, sie platzieren diese
      nicht zufällig, sondern nach Regeln, die Geschmack und Konventionen
      vorschreiben. Es findet also nicht die in der Natur normale
      Variationsbreite hinsichtlich der Position und Größe des Motivs
      Berücksichtigung.

      Das überprüften die Forscher mit einem Gegentest: Sie erzeugten ein
      Testset von Motiven, die nur zwei Kategorien angehörten (Flugzeuge und
      Autos). Schon die Zufallschance, die richtige zu treffen, liegt also
      bei 50 Prozent. Jegliche Programme sollten mit diesem Testset also
      besser zurechtkommen als mit dem sonst verwendeten. Allerdings bauten
      die Forscher eine künstliche Hürde ein: sie sorgten bewusst dafür, dass
      Position und Größe der Objekte stark variierten. Und tatsächlich
      änderte sich die Erkennungsrate des Algorithmus und näherte sich bei
      starker Variation von Winkel, Position und Maßstab der
      Zufallswahrscheinlichkeit.

      SUBTEXTE (**)

      Grafik in voller Größe ansehen

      Bild: Pinto at al)

      Telepolis Artikel-URL: http://www.heise.de/tp/r4/artikel/27/27145/1.html

      Copyright © Heise Zeitschriften Verlag