teachSam- Arbeitsbereiche:
Arbeitstechniken - Deutsch - Geschichte - Politik - Pädagogik - PsychologieMedien - Methodik und Didaktik - Projekte - So navigiert man auf teachSam - So sucht man auf teachSam - teachSam braucht Werbung


 

Objektwahrnehmung

Objekterkennung durch Ableitung von Formelementen

Computational theory of vision (Marr 1982)


PSYCHOLOGIE

Glossar Entwicklungspsychologie Persönlichkeitspsychologie Kognitionspsychologie Emotionspsychologie Motivationspsychologie Kommunikationspsychologie Wahrnehmungspsychologie Überblick Neurobiologische Grundlagen der Wahrnehmung Modelle der Wahrnehmung Empfindung und Wahrnehmung Aufmerksamkeit [ Identifikations- und Wiedererkennungsprozesse Überblick Bottom-up- und Top-down-Verarbeitung ObjektwahrnehmungÜberblick Objekterkennung durch Ableitung von Formelementen (Marr)Geone (Biederman)Pandämonium-Modell (Selfridge) Das Bindungsproblem  ]
 

Pandämonium-Modell (Selfridge 1959)

»David Marr (1945- 1980) (1987) entwickelte eine vielzitierte Theorie zur ▪ Objektwahrnehmung, die ein mehrstufiges Verarbeitungsmodell zur Repräsentation visueller Wahrnehmungen (representational framework for vision) vorsieht. Seine Überlegungen wurden später von »Irving Biederman (*1939) (1987) in seiner Recognition-by-components theory (Theorie des Erkennens dreidimensionaler Formen anhand elementarer Teilkörper) weiterentwickelt.

Die grundlegenden theoretischen Überlegungen, die Marrs Computational Theory of Vision mit ihrem Computational approach und den dazu verwendeten mathematischen Modellen zugrundeliegen, lassen wir hier außen vor.

Soviel nur: Für Marr war die visuelle Wahrnehmung nichts anderes als eine Informationsverarbeitungsaufgabe. Daher könne eine solche Aufgabe auf drei Ebenen beschrieben werden: (1) der Ebene der Computertheorie, (2) der Ebene spezifischer Algorithmen und der (3) Ebene der physikalischen Implementierung. Diese drei Ebenen entsprechen in etwa der Definition des Problems (1) und der Festlegung, wie es im Prinzip gelöst werden kann, dem Entwurf einer detaillierten Simulation des Prozesses (2) und dem Aufbau eines funktionierenden Systems, das es ausführen wird (3). (vgl. Glennerster 2002; Kitcher 1988)

Auf der Basis dieser Überlegungen entwickelte Marr ein Modell der visuellen Objektwahrnehmung, das von einem mehrstufigen Verarbeitungsprozess ausgeht. Dieserbeginnt mit dem zweidimensionalen Abbild des jeweiligen Objekts auf der Netzhaut (Retinaabbild) und führt am Ende zu einem subjektiven Wahrnehmungseindruck des dreidimensionalen Objektes, der mit Hilfe von "Berechnungen der silhouettenartigen, schemenhaften Konturen in der primären Rohskizze bis hin zu den Berechnungen, die zu ausgereiften dreidimensionalen Objektpräsentationen führen" (Müsseler 2017, S.41), entsteht.


Für größere Ansicht bitte an*klicken*tippen!

Allem voran geht dabei das räumliche Abbild, das auf der Retina durch die auf sie bzw. entsprechende Rezeptoren treffenden Lichtwellen entsteht und zugleich die Wahrnehmung der Intensität, in der sie empfangen werden.
Die Rohskizze (primal sketch)

Auf der ersten Stufe (stage) der Verarbeitung entsteht die sogenannte Rohskizze (primal sketch).  Die Roh wird durch die Extraktion bzw. die Identifikation elementarer Merkmale von Muster von Kanten, Konturen oder Flächen auf der Grundlage wahrgenommener Lichtintensitätsschwankungen (Helligkeit, Intensität) gewonnen. Dabei lassen sich die Prozesse auf dieser Stufe noch unterteilen: Am Anfang kommt es zur sogenannten primären Rohskizze (raw primal sketch), in der die erkannten Elemente noch ungeordnet sind. Diese werden zur vollständigen Rohskizze (full primal sketch), bei der die bis dahin ungeordneten Elementarmerkmale gruppiert und dadurch zueinander in Beziehung gesetzt werden, z. B. auf Basis der Gestaltgesetze, die aber vor allem auf der nächsten Stufe wirken.

Die 2 1/2-D-Skizze (2 1/2-D-sketch)

Auf der zweiten Stufe des Objekterkennungsprozesses werden die globalen Flächen aus der Rohskizze weiterverarbeitet. Dies erfolgt zunächst unter den Aspekten Tiefe und Orientierung im Raum. Als Ergebnis dieser Verarbeitung entstehen orientierte (Ober-)Flächen mit Richtungszuweisungen. Am Ende kommt dabei die sogenannte 2 1/2-D-Skizze (2 1/2 -D-sketch) heraus. Sie bildet die subjektzentrierte Reizstruktur ab, die von der Perspektive des Beobachters auf das Objekt abhängt.

 
Für größere Ansicht bitte an*klicken*tippen!

Das 3-D-Modell (3-D-model representation)

Auf der dritten Stufe des Prozesses zur Objekterkennung erfolgt die Transformation in das sogenannte 3-D-Modell ( 3-D-model representation), das für die Identifikation und das Wiedererkennen dreidimensionaler Objekte, wie sie uns in unserer Umwelt begegnen, von zentraler Bedeutung ist.

Zugleich vollzieht sich auf dieser Verarbeitungsstufe eine Umwandlung: Die subjektabhängige (subjektzentrierte) Reizstruktur, die noch die 2. Stufe ausmachte, wird nämlich in eine objektzentrierte Reizstruktur transformiert, die zu einer von der Betrachtungsperspektive unabhängigen Objektrepräsentation führt, d. h. die besondere Position oder Ausrichtung der Objekte spielt für ihre Repräsentation keine Rolle mehr. Oder, wie Müsseler (2017, S.41) es mit anderen Worten ausdrückt: "Mit dieser Repräsentation liegt ein Modell der real existierenden Welt vor, wie sie der Betrachter wahrnimmt." Wie man sich diesen Vorgang im einzelnen vorstellen muss, sprengt hier allerdings den Rahmen.

An dieser Stelle wichtig ist freilich noch der Hinweis, dass die Identifikation des Objektes nicht abgeschlossen ist, bis die gewonnene 3-D-Skizze mit den Objektmodellen verglichen ist, die im ▪ Langzeitgedächtnis gespeichert sind. Erst wenn eine Übereinstimmung besteht, wird das Objekt als wirklich erkannt, was heißen soll: Erst wenn dieser Abgleich erfolgreich erfolgreich war, findet die bewusste Wahrnehmung statt. Was vorher, auf dem Weg der Objekterkennung passiert ist, ist uns dagegen ganz und gar unbewusst.

Mit dem sogenannten ▪ Pandämonium-Modell (Selfridge 1959), das allerdings sehr viel früher entstanden ist, lassen sich die Überlegungen Marrs zur mehrstufigen Verarbeitung visueller Reize verdeutlichen.

Selbst wenn offenbar einzuräumen ist, dass computionale Ansätze, um damit noch einmal auf die theoretische Fundierung der Vision-Theorie von Marr zurückzukommen, auch gerade im Hinblick auf die Erforschung Künstlicher Intelligenz verschiedene Disziplinen, darunter auch Computerwissenschaften, dürfte die Vorstellung, man könne visuelle Wahrnehmung nur mit Algorithmen erklären, die bei der "Berechnung" eingesetzt werden, um den Transformationsprozess der Eingangsinformationen in mentale Repräsentationen zu erklären, aber entschieden zu kurz greifen. (vgl. Müsseler (2017, S.41)

 Gert Egle, zuletzt bearbeitet am: 17.12.2023

 
 

 
ARBEITSTECHNIKEN und mehr
Arbeits- und ZeitmanagementKreative ArbeitstechnikenTeamarbeit ▪ Portfolio ● Arbeit mit Bildern  Arbeit mit Texten Arbeit mit Film und VideoMündliche KommunikationVisualisierenPräsentationArbeitstechniken für das Internet Sonstige digitale Arbeitstechniken 

 

 
   
  Creative Commons Lizenzvertrag Dieses Werk ist lizenziert unter Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International License (CC-BY-SA)
Dies gilt für alle Inhalte, sofern sie nicht von
externen Quellen eingebunden werden oder anderweitig gekennzeichnet sind. Autor: Gert Egle/www.teachsam.de
-
CC-Lizenz