▪
Pandämonium-Modell
(Selfridge 1959)
»David
Marr (1945- 1980) (1987)
entwickelte eine vielzitierte Theorie zur ▪
Objektwahrnehmung, die ein
mehrstufiges Verarbeitungsmodell zur Repräsentation visueller
Wahrnehmungen (representational framework for vision)
vorsieht. Seine Überlegungen wurden später von »Irving
Biederman (*1939) (1987)
in seiner Recognition-by-components
theory (Theorie des Erkennens dreidimensionaler Formen anhand
elementarer Teilkörper) weiterentwickelt.
Die grundlegenden theoretischen Überlegungen, die Marrs
Computational Theory of Vision mit ihrem Computational
approach und den dazu verwendeten mathematischen Modellen
zugrundeliegen, lassen wir hier außen vor.
Soviel nur: Für
Marr war die visuelle Wahrnehmung nichts anderes als eine
Informationsverarbeitungsaufgabe. Daher könne eine solche Aufgabe
auf drei Ebenen beschrieben werden: (1) der Ebene der
Computertheorie, (2) der Ebene spezifischer Algorithmen und der (3)
Ebene der physikalischen Implementierung. Diese drei Ebenen
entsprechen in etwa der Definition des Problems (1) und der
Festlegung, wie es im Prinzip gelöst werden kann, dem Entwurf einer
detaillierten Simulation des Prozesses (2) und dem Aufbau eines
funktionierenden Systems, das es ausführen wird (3). (vgl.
Glennerster
2002;
Kitcher 1988)
Auf der Basis dieser Überlegungen entwickelte Marr ein Modell der visuellen Objektwahrnehmung, das von einem mehrstufigen
Verarbeitungsprozess ausgeht. Dieserbeginnt mit dem zweidimensionalen
Abbild des jeweiligen Objekts auf der Netzhaut (Retinaabbild)
und führt am Ende zu einem subjektiven
Wahrnehmungseindruck des dreidimensionalen Objektes, der mit
Hilfe von "Berechnungen der silhouettenartigen, schemenhaften
Konturen in der primären Rohskizze bis hin zu den Berechnungen, die
zu ausgereiften dreidimensionalen Objektpräsentationen führen" (Müsseler
2017, S.41), entsteht.
Für
größere Ansicht bitte an*klicken*tippen!
Allem voran geht dabei das räumliche
Abbild, das auf der Retina durch die auf sie bzw. entsprechende
Rezeptoren treffenden Lichtwellen entsteht und zugleich die
Wahrnehmung der Intensität, in der sie empfangen werden.
Auf
der ersten Stufe (stage) der Verarbeitung entsteht die sogenannte
Rohskizze (primal
sketch). Die Roh wird durch die Extraktion bzw. die
Identifikation elementarer Merkmale von Muster von Kanten,
Konturen oder Flächen auf der Grundlage wahrgenommener
Lichtintensitätsschwankungen (Helligkeit, Intensität) gewonnen.
Dabei lassen sich die Prozesse auf dieser Stufe noch
unterteilen: Am Anfang kommt es zur sogenannten primären
Rohskizze (raw primal sketch),
in der die erkannten Elemente noch ungeordnet sind. Diese werden
zur vollständigen Rohskizze (full
primal sketch), bei der die bis dahin ungeordneten
Elementarmerkmale gruppiert und dadurch zueinander in Beziehung
gesetzt werden, z. B. auf Basis der
Gestaltgesetze,
die aber vor allem auf der nächsten Stufe wirken.
Auf
der dritten Stufe des Prozesses zur Objekterkennung erfolgt die
Transformation in das sogenannte 3-D-Modell (
3-D-model representation), das für die Identifikation und
das Wiedererkennen dreidimensionaler Objekte, wie sie uns in
unserer Umwelt begegnen, von zentraler Bedeutung ist.
Zugleich vollzieht
sich auf dieser Verarbeitungsstufe eine Umwandlung: Die
subjektabhängige (subjektzentrierte) Reizstruktur, die noch die 2.
Stufe ausmachte, wird nämlich in eine objektzentrierte Reizstruktur
transformiert, die zu einer von der Betrachtungsperspektive
unabhängigen Objektrepräsentation führt, d. h. die besondere
Position oder Ausrichtung der Objekte spielt für ihre Repräsentation
keine Rolle mehr. Oder, wie
Müsseler (2017,
S.41) es mit anderen Worten ausdrückt: "Mit dieser Repräsentation
liegt ein Modell der real existierenden Welt vor, wie sie der
Betrachter wahrnimmt." Wie man sich diesen Vorgang im einzelnen vorstellen muss,
sprengt hier allerdings den Rahmen.
An dieser Stelle wichtig ist freilich noch
der Hinweis, dass die
Identifikation des Objektes nicht abgeschlossen ist, bis die
gewonnene 3-D-Skizze mit den Objektmodellen verglichen ist, die
im ▪ Langzeitgedächtnis gespeichert sind. Erst wenn eine
Übereinstimmung besteht, wird das Objekt als wirklich erkannt,
was heißen soll: Erst wenn dieser Abgleich erfolgreich
erfolgreich war, findet die bewusste Wahrnehmung statt. Was
vorher, auf dem Weg der Objekterkennung passiert ist, ist uns
dagegen ganz und gar unbewusst.
Mit dem sogenannten ▪
Pandämonium-Modell
(Selfridge 1959), das allerdings sehr viel früher
entstanden ist, lassen sich die Überlegungen Marrs zur mehrstufigen
Verarbeitung visueller Reize verdeutlichen.
Selbst wenn offenbar
einzuräumen ist, dass computionale Ansätze, um damit noch einmal auf
die theoretische Fundierung der Vision-Theorie von Marr
zurückzukommen, auch gerade im Hinblick auf die Erforschung
Künstlicher Intelligenz verschiedene Disziplinen, darunter auch
Computerwissenschaften, dürfte die Vorstellung, man könne visuelle
Wahrnehmung nur mit Algorithmen erklären, die bei der "Berechnung"
eingesetzt werden, um den Transformationsprozess der
Eingangsinformationen in mentale Repräsentationen zu erklären, aber
entschieden zu kurz greifen. (vgl.
Müsseler (2017,
S.41)
Gert Egle, zuletzt bearbeitet am:
17.12.2023