3.4.3 Visuelle Objektbildung

3.4.3 Visuelle Objektbildung

Ein Objekt (oder seine Bedeutung) kann in kartographischer und damit auch zeichentheoretischer Hinsicht durch ein Zeichen repräsentiert werden, das – ausgenommen bei bestimmten Modellkonstruktionen, die in Teil B der Arbeit noch ausführlich beschrieben werden – optisch (syntaktisch) als visuelle Einheit wahrgenommen wird. In der Regel ist damit verbunden, dass dieser Zeicheneinheit eine Bedeutung zukommt, die unmittelbar aus dem Zeichen visuell-kognitiv abgeleitet werden kann oder durch Erläuterungen (in einer Legende) vermittelt wird. Bei der visuell-kognitiven Identifizierung von Objekten (bzw. Sachverhalten) aus Zeichen bzw. Figurationen müssen zum einen die syntaktisch angebotenen graphischen Elemente des Zeichens konstruktiv extrahiert werden (in der Wahrnehmungspsychologie häufig auch als „Musterbildung“ bezeichnet) und zum anderen die Bedeutung des Zeichens ermittelt werden. Die vieldiskutierte Frage, ob sich Objekt- oder Musterbildung aus elementaren Vorgängen aufbaut und daraus abgeleitet erst zu größeren Einheiten führt oder ob Elemente von Objekten unmittebar als zusammengehörige Einheiten visuell erfasst werden, soll in diesem Zusammenhang nicht weiter diskutiert werden. Bei der visuell-kognitiven Identifizierung von Objekten aus Zeichen müssen zum einen die angebotenen graphischen Zeichenelemente konstruktiv extrahiert und zum anderen muss die Bedeutungen der Zeichen ermittelt werden.
Kartographische Zeichen oder Figuren bilden eine weite Palette an Darbietungsformen und unterliegen verschiedenen inhaltlichen Identifizierungsvorgängen. Um zu versuchen, Parallelen zu Fragestellungen und Forschungsschwerpunkten der Wahrnehmungspsychologie aufzuzeigen, sollen im Folgenden beispielhaft Zeichen betrachtet werden, die in kartographischen Medien häufig eine Rolle spielen (vgl. Kap. 4.4) .
Im Folgenden sollen zwei Zeichenklassen im Zusammenhang mit der visuellen Objektbildung diskutiert werden, die in der kartographischen Praxis weit verbreitet sind. Als Beispiele dienen die Zeichkonstrukte „Grundriss eines Flugzeugs“ mit der Bedeutung Flugplatz und „gekreuzte Werkzeuge“ mit der Bedeutung Kohleindustrie. In beiden Fällen kommt die Wirkung von bildlichen Konstrukten zum Tragen: Als Primärreize (vgl. Kap. 4.1.1.) werden graphische Elemente (Form, Farbe, Grauton und Textur) extrahiert. Als Expressive Reize werden Eigenschaften von Relationen der Elemente abgeleitet, woraus sich Vorstellung vom abgebildeten Gegenstand ergeben (Flugzeug, Werkzeuge). Und schließlich, als abschließender Schritt, ergibt sich die zugeordnete Bedeutung der Zeichens (Flugplatz, Kohleindustrie). Insgesamt zeigt die Zusammenschau dieser Schritte die angebotene syntaktische und semantische Struktur von  kartographischen Zeichengebilden: Zwei Beispiele:
–  „Grundriss eines Flugzeuges“ mit der Bedeutung „Flugplatz“;
–   Ansicht von „gekreuzten Schlägel und Eisen“ mit der Bedeutung „Kohleindustrie“;
  • Die bildliche Konstruktion eines „Flugzeuges“ kann als ein unverwechselbares Merkmal („invariantes Merkmal“) der Objektklasse oder des Begriffs „Flugplatz“ gesehen werden (vgl.
    Klix 1971 Klix, F. (1971): Information und Verhalten. Kybernetische Aspekte der organismischen Informationsverarbeitung. Einführung in naturwissenschaftlichen Grundlagen der Allgemeinen Psychologie. Bern; Klaus et al. 1972 Klaus, G. u. Buhr, M. (Hrsg.) (1972): Wörterbuch der Philosophie. Hamburg u. Bollmann 1977 Bollmann, J. (1977): Probleme der kartographischen Kommunikation. Bonn). Da diese Kennzeichnung nicht unmittelbar gedanklich verfügbar sein muss und ihr, wie noch in Teil B Kap. 4.5 der Arbeit ausgeführt wird, gegebenenfalls ein nicht zwangsläufig eindeutiger „metaphorischer Charakter“ zukommt, bietet sich zur konkreteren Deutung des Zeichens zusätzlich der inhaltlich-georäumliche Kontext der jeweiligen Karte an, wie etwa verkehrstechnische oder wirtschaftliche Einrichtungen des entsprechenden Raumes. Außerdem kann die Konventionalität des Zeichengebrauchs, also eine sich stabilisierende und festsetzende Präferenz bei der Verwendung des Zeichens eine Rolle spielen. Diese drei Merkmale bilden vor allem den Rahmen zur Identifizierung bildlicher Zeichen und stehen damit für die Klasse kartographischer Ikonischer Zeichen.
Die bildliche Reproduktion eines Flugzeuges bilden das  Merkmal zur Identifizierung der Zeichenbedeutung „Flugplatz“ und kann der Klasse der Ikonischen Zeichen zugeordnet werden.
  • Die bildliche Konstruktion eines gekreuzten „Schlägel und (Berg-) Eisens“ kann als Merkmal für die Objektklasse oden den Begriff „Kohleindustrie“ stehen. Es ist aber eher unwahrscheinlich, dass die konkrete Bedeutung eines Schlägels, als „ein Werkzeug zum Schlagen im Bergbau“ gedanklich verfügbar ist, da die Kenntnis dieses Sachverhalts heute nicht mehr relevant ist und wahrscheinlich auch in der Vergangenheit nicht allgemein verbreitet war. Außerdem wurden Schlägel zwar vor allem im Bergbau genutzt, sie kamen aber auch in verschiedenen anderen Bereichen zum Einsatz und zwar mit unterschiedlichen äußeren Formenmerkmalen. Ihre Bedeutung und Form sind also nicht eindeutig. Die Abbildung „Schlägel und Eisen in gekreuzter Position“ stellt damit repräsentativ kein invariantes, unverwechselbares Merkmal einer Klasse oder eines Begriffs dar, sondern symbolisiert aufgrund ihres konventionellen gesellschaftlichen Gebrauchs eine heute nicht mehr nachvollziehbare Zeichenbedeutung für Institutionen oder Einrichtungen, die in enger Beziehung zum Bergbau stehen, wie etwa für die Kenntlichmachung von Bergbaugesellschaften und als „Wappen“ für Zechensiedlungen oder Bergbaugemeinden. Damit handelt es sich insgesamt bei den gekreuzten Werkzeugen um eine bildliche Reproduktion, die nicht die abgebildeten Gegenstände selbst repräsentieren soll und daher auch nicht die Vermittlungsfunktion eines Ikonischen Zeichens zukommt. Aus zeichentheoretischen Sicht handelt es sich bei der Reproduktion um ein Symbol und kann aus kartographischer Sicht der Klasse der Symbolischen Zeichen zugeordnet werden (vgl. z.B. Eco 1972 Eco, U. (1972): Einführung in die Semiotik. München, Prieto 1972 Prieto, L.J. (1972): Nachrichten und Signale. Berlin, Bollmann 1977, S. 52ff Bollmann, J. (1977): Probleme der kartographischen Kommunikation. Bonn).
Die „Schlägel und (Berg-) Eisen“ sind nicht unmittelbar zuordbare bildliche Repräsentationsmerkmale für die Zeichenbedeutung „Kohleindustrie“. Aus zeichentheoretischer Sicht handelt es sich um eine konventionell geprägte symbolische Kennzeichnung, der insgesamt die Eigenschaft eines Symbolischen Zeichens zukommt.
Neben den ikonischen und symbolischen Zeichenformen finden in kartographischen Medien Zeichen „ohne bildliche oder symbolische Repräsentanz“ Verwendung, die vor allem zur Gliederung oder hierarchischen Abstufung von Sachverhalten, denen ein theoretischer und abstrakter Hintergrund zukommt, genutzt werden. Diese Zeichen werden in der Regel farblich und vor allem durch geometrische Formen und Texturen gegliedert (vgl. die Beispiele in Kap. 4.4, Abb. 44.6). Ihre Enkodierung stützt sich vor allem auf elementare visuelle Wahrnehmungsleistungen, da ihre Bedeutung durch eine separate Erklärung (in einer Legende) vermittelt wird und daher nicht visuell im räumlichen Gesichtsfeld identifiziert werden muss (kann). Es werden aber beispielsweise euklidische Formenmerkmale, wie „Kreis“, „Quadrat“ oder „längliches Rechteck“ („Säule“) abgeleitet, vermutlich mit dem Ziel, die Figurationen besser behalten und im Rahmen eines Interpretationsprozesses effektiver visuell-gedanklich verarbeiten zu können. Neben den ikonischen und symbolischen Zeichenformen werden Zeichen „ohne bildliche oder symbolische Repräsentanz“ verwendet, die vor allem zur Gliederung oder hierarchischen Abstufung von „theoretischen Sachverhalten“ genutzt werden.
3.4.3.1 Allgemeine Kriterien der Objekt- und Zeichenwahrnehmung
Für die visuell-gedankliche Objektbildung wird in der Wahrnehmungspsychologie und in benachbarten Disziplinen eine große Anzahl theoretischer Ansätze, die zum Teil aufwendig empirisch überprüft wurden, verfolgt. Dabei wird meistens vorausgesetzt, dass die visuellen Mechanismen, die der Identifikation von Position und Form eines Objektes zugrunde liegen, zum großen Teil angeboren sind und damit schon im frühen Alter zur Verfügung stehen (vgl. Anderson 2007, S. 60 Anderson, J.R. (2007): Kognitive Psychologie. Berlin, Heidelberg (Nachdruck 2012) und z.B. Granrud 2012 Granrud C.E. (2012): Judging the size of a distant object: strategy use by children and adults. In: Visual Experience: Sensation, Cognition, and Constancy. Oxford).
Diese Annahme korrespondiert mit der Verarbeitungsgeschwindigkeit, die bei der Wahrnehmung von Objekten (Zeichen) zu erwarten ist (Thorpe et al. 1996 Thorpe, S.J., Fize, D. u. Marlot, C. (1996): Speed of processing in the human visual system. Nature, 381, 520–522; Thorpe 2009 Thorpe, S.J. (2009): The Speed of Categorization in the Human Visual System. Nuron, 62):
Es wird vorausgesetzt, dass die Fähigkeiten zur Identifikation von Position und Form eines Objektes zum großen Teil angeboren sind und damit schon im frühen Alter zur Verfügung stehen.
  • Kanten werden im Areal V1 des primären visuellen Cortex nach ca. 50 – 80 msec extrahiert,
  • ein Gegenstand (z.B. ein Tier) wird ca. 80 msec später identifiziert,
  • das entspricht ungefähr 5 – 8 Synapsen (Verarbeitungsschritte)
Bei dieser hohen Geschwindigkeit ist von einem geringen Aufwand an visuell-kognitiver Leistung auszugehen und es kann vermutet werden, dass der Identifizierungsprozess zum großen Teil automatisch abläuft. Die hohe Geschwindigkeit bei der Objektbildung lässt einen geringen Aufwand an visuell-kognitiver Leistung vermuten.
Bei neurowissenschaftlichen Untersuchungen haben Campbell et al. 1968Campbell; F.W. u. Robson, J.G. (1968): Application of Fourier analysis to the visibility of gratings. The Journal of Physiology, 197, 551-566 Hinweise gefunden, dass verschiedene Ortsfrequenzen in voneinander unabhängigen kortikalen Kanälen verarbeitet werden. Unter Ortsfrequenz wird die Anzahl von Perioden pro Streckeneinheit eines Musters verstanden (z. B. abwechselnd ein weißer und ein schwarzer Streifen). Das bedeutet, dass bei verschiedenen Ortsfrequenzen ein Streifenmuster in unterschiedlicher Dichte oder Auflösung (fein-grob) auftritt und neuronal getrennt verarbeitet wird (vgl. Regensburger 2002 Regensburger, K. (2002): Ortsfrequenz. In: Lexikon der Kartographie und Geomatik. 2, Heidelberg). Dies wird im Rahmen eines sogenannten „Ortsfrequenzmodells“ (Multi-Channel-Model) erklärt, mit dem vermutet wird, dass die rezeptiven Felder von Neuronen im primären visuellen Kortex unterschiedliche Größen aufweisen und dies daher für unterschiedliche Ortsfrequenzen empfindlich macht. Damit wird eine lokale Spektralanalyse des Netzhautbildes durchgeführt bzw. ein Bild in Ortsfrequenz-Komponenten (-Kanäle) zerlegt. Mit diesem Ansatz kann sehr gut vorhergesagt werden, wie bestimmte Muster oder Objekte entdeckt werden, allerdings nicht, wie sie erkannt werden können. Es wird vermutet, dass die rezeptiven Felder von Neuronen im primären visuellen Kortex unterschiedliche Größen aufweisen und daher für verschiedene Feinheitsabstufungen von Mustern (Ortsfrequenzen) empfindlich sind.
Schwarzfischer 2014Schwarzfischer, K. (2014): Integrative Ästhetik: Schönheit und Präferenzen zwischen Hirnforschung und Pragmatik. Regensburg hat für den visuell-ästhetischen Bereich untersucht, wie durch die sogenannte Bandpass-Filterung („Ortsfrequenzbereichsfilterung“) sukzessiv Details wahrgenommen werden. Es hat sich gezeigt, dass niedrige Ortsfrequenzen früher wahrgenommen werden als hohe, das bedeutet, dass nur wenige Details bei sehr kurzer Betrachtungszeit (wenige Millisekunden) wahrgenommen werden. Dies betrifft auch große Distanzen zu Objekten, von denen hochfrequente Anteile nicht mehr vom Auge aufgelöst werden können. Danach lässt sich der Wahrnehmungsprozess als ein Vorgang vorstellen, bei dem „nacheinander stufenweise von den größeren Strukturen hin zu den feinen Details analysiert wird“ (Schwarzfischer 2014, S. 53 Schwarzfischer, K. (2014): Integrative Ästhetik: Schönheit und Präferenzen zwischen Hirnforschung und Pragmatik. Regensburg). Als Folgerungen kann vermutet werden, dass im visuellen Kortex in verschiedenen Ortsfrequenzkanälen visuelle Analysen vorgenommen werden (zur Anzahl von Ortsfrequenzkanälen vgl. Wilson et al. 2004Wilson, H.R. u. Wilkinson, F. (2004): Spatial Channels in Vision and Spatial Pooling. In: The visual Neurosciences. 2, Cambridge), die zu einer Separierung von unterschiedlich feinen Strukturen isolierter Elemente (Objekte) führen, die auf der Netzhaut abgebildet sind (vgl. auch Höger 2001, S. 20fHöger, R. (2001): Raumzeitliche Prozesse der visuellen Informationsverarbeitung. Magdeburg). Der Wahrnehmungsprozess lässt sich als ein Vorgang vorstellen, bei dem nacheinander stufenweise von den größeren Strukturen hin zu den feinen Details analysiert wird.
Die getrennte neuronale Verarbeitung von optischen Elementen bezieht sich nicht nur auf unterschiedliche Ortsfrequenzen, sondern vermutlich auch auf eine große Anzahl Einzelelemente. Das heißt, im temporalen Kortex wurden Bereiche identifiziert, die spezifisch auf ganz bestimmte Objektkategorien antworten (vgl. Gegenfurtner et al. 2010 Gegenfurtner, K.R.; Walter, S. u. Braun, D.I. (2010): Visuelle Informationsverarbeitung im Gehirn. Allgemeine Psychologie, Justus-Liebig-Universität, Gießen). Besonders bei der Gesichtswahrnehmung sind differenzierte Zellaktivitäten nachgewiesen worden. So verringern Neuronen ihre Antwort, wenn das Gesicht verändert wird, indem man Teile weglässt oder im Profil zeigt (Bruce et al. 1981 Bruce C., Desimone, R. u. Gross, C.G. (1981): Visual properties of neurons in a polysensory area in superior temporal sulcus of the macaque. Journal of Neurophysiology. 46, 369-384). Insgesamt scheinen Neuronenverbände zu existieren, die auf individuelle Gesichtsformen reagieren und es ist wahrscheinlich, dass auch für andere Objektkategorien spezifische Neuronen im temporalen Kortex zuständig sind (vgl. Kreiman et al. 2000Kreiman, G.; Koch, C. u. Fried, I. (2000): Imagery neurons in the human brain. Nature, 408, 357-361). Insgesamt scheinen für Merkmale bestimmter Objektkategorien spezifische Neuronen im temporalen Kortex zuständig zu sein.
3.4.3.2 Theoretische Ansätze der Objektbildung
In der Wahrnehmungspsychologie werden seit Jahrzehnten verschiedene Möglichkeiten der visuellen Identifizierung von Objekten diskutiert. In der Literatur haben sich dabei bestimmte Grundlagen der Objektwahrnehmung herausgebildet, die die Diskussion bisher beeinflusst haben:
  • Gestaltprinzipien:
    Auf der Basis von Gestaltprinzipien (vgl. Kap. 3.4.2.2) werden sowohl Einzelelemente als auch organisierte Objektstrukturen bzw. Reizkonfigurationen, die diesen zugrunde liegen, als ganzheitliche Konfigurationen wahrgenommen. Dabei werden die betroffenen Elemente aufgrund von spezifischen Beziehungswirkungen in ihrem relativen Zusammenhalt als auch im Ganzen festgelegt. Für die Objekterkennung bedeutet dies, dass im Wahrnehmungsprozess in der gesamten Reizkonfiguration, die einem Objekt zukommt, bestimmte Reizstrukturen visuell als enger zusammengehörig als andere organisiert werden.
 

Auf der Basis von Gestaltprinzipien werden sowohl Einzelelemente als auch organisierte Objektstrukturen als ganzheitliche Konfigurationen wahrgenommen.

  • Schablonenabgleich:
    Beim Schablonenabgleich wird erwartet, dass ein Netzhautbild eines Objektes direkt mit bereits gedanklich gespeicherten Mustern (Schablonen) verglichen wird. Nach dieser Annahme versucht das Wahrnehmungssystem, die Schablone mit der besten Übereinstimmung zu identifizieren, indem das Bild einer Figuration mit allen Schablonen verglichen wird, die es für entsprechende Figurationen gespeichert hat.
 

Beim Schablonenabgleich wird erwartet, dass ein Netzhautbild eines Objektes mit gedanklich gespeicherten Mustern verglichen wird.

  • Merkmalanalyse
    Mit dem Ansatz der Merkmalanalyse wird die Objektbildung als eine Folge von Schritten angenommen, bei der aus Einzelelementen gedanklich ein zusammengehöriges Konstrukt entsteht. In einem ersten Schritt werden automatisch (ohne Einfluss von Aufmerksamkeit) elementare Reizmerkmale extrahiert. In einem zweiten Schritt werden zugehörige Merkmale dann zu einem Objekt kombiniert, wozu eine gezielte Aufmerksamkeitsausrichtung erforderlich ist.
 

Die Merkmalanalyse wird als eine Folge von Schritten angenommen, bei der aus Einzelelementen ein zusammengehöriges Objekt entsteht.

  • Erkennen durch Komponenten:
    Objekte sind, ganz ähnlich wie Buchstaben des Alphabets zum Aufbau von Wörtern, aus elementaren dreidimensionalen Formen (Geonen) zusammengesetzt. Durch das Erkennen dieser Geone werden auch die Merkmale erkannt, auf deren Grundlage die Geone konstruiert sind (z.B. runde, längliche, zylindrische, kegelförmige Körper). Diese elementaren Körper sind aus fast allen Ansichten leicht zu unterscheiden, das heißt, sie sind blickwinkelunabhängig erkennbar. Nach dieser Theorie der „komponentialen Erkennung“ (recognition-by-components theory) können aus 36 Geonen visuell beliebige Objekte visuell zusammengefügt werde, wobei sie aufgrund der Anordnung ihrer Merkmale der Form des zugrunde liegenden Objektes entsprechen.
 

Objekte werden visuell aus elementaren dreidimensionalen Formen (Geonen) zusammengesetzt.

Kritikpunkte zur Wirkung von Gestaltprinzipien sind schon in Kap. 3.4.2.2 genannt worden. Vor allem wird eingeschränkt, dass die Wahrnehmungswirkungen nur beschreibenden Charakter haben, anstatt sie erklären zu können. Unabhängig davon ist der Stellenwert der Einflussfaktoren Ähnlichkeit, Nähe, Kontinuität und Verbundenheit von Reizelemente für Gruppierungen oder zur Objektbildungen unbestritten. Sie lassen allerdings keine allgemeingültige Interpretation zu und ihre Überprüfung mit Hilfe empirischer Methoden erweist sich als äußerst schwierig. Unabhängig davon finden sie noch in späteren Erklärungsansätzen als „Basisvoraussetzung der Objekt- und Mustererkennung“ Verwendung (vgl. z.B.
Palmer 1977Palmer, S.E. (1977): Hierarchical structure in perceptual representation. Cognitive Psychology, 9, 441-474; Marr 1982Marr, D. (1982): Vision. A Computational Investigation into the Human Representation and Processing of Visual Information. San Francisco; Hoffman et al. 1985Hoffman, D. D. u. Richards, W. (1985): Parts of Recognition. Cognition, 18, 65-96; Anderson 2007 Anderson, J.R. (2007): Kognitive Psychologie. Berlin, Heidelberg (Nachdruck 2012)).
Bei den Gestaltprinzipien wird eingeschränkt, dass die unterschiedenen Wahrnehmungswirkungen nur beschreibenden Charakter haben, anstatt sie erklären zu können.
Eine nicht unmittelbar zur Objektbildung gehörende Wirkungseigenschaft der Gestaltwahrnehmung ist die Prägnanztendenz von Formen, Mustern und Figurationen. Diese Wirkung tritt auf, wenn sich Elemente durch Regelmäßigkeit und Geordnetheit auszeichnen, sie fallen in der Menge der ungeordneten, unregelmäßigen Formen auf. Nach Lexikon der Neurowissenschaft 2000Lexikon der Neurowissenschaft (2000a): Prägnanztendenz. Heidelberg„können beispielsweise auch unvollständig dargestellte Figuren zur guten Gestalt ergänzt werden, um die Symmetrie wiederherzustellen (Gesetz der guten Gestalt). Weitere Charakteristika der Prägnanztendenz sind: Vereinfachung von Figuren, Verschärfung der Unterteilung und Kontraste, Isolation unpassender Details, Schließen von Grenzlinien, Wiederholen ähnlicher Formbestandteile und Begradigung von Schiefen. All dies trägt dazu bei, die Ordnung, Einfachheit und Vollkommenheit eines Gebildes mit dem Ziel besseren Erkennens zu vergrößern“. Insgesamt lassen sich diese Eigenschaften auch als „Anweisung zur Gestaltung“ entsprechender Figurationen auffassen, um in kartographischen Präsentationen den Wahrnehmungsprozess zu unterstützen. Eine nicht unmittelbar zur Objektbildung gehörende Wirkungseigenschaft der Gestaltwahrnehmung ist die Prägnanztendenz von Formen, Mustern und Figurationen.
Beim sogenannten Schablonenabgleich (template matching) wird von einem naheliegenden Mechanismus der Objekterkennung ausgegangen: Allgemein wird versucht, eine Übereinstimmung zwischen den von einer Figuration stimulierten Netzhautzellen und den für eine Figurationsschablone spezifizierten Zellen zu erzielen (vgl. Anderson 2007, S. 61f Anderson, J.R. (2007): Kognitive Psychologie. Berlin, Heidelberg (Nachdruck 2012)). Dazu wurde versucht, den eher einfachen „eins-zu-eins Mechanismus“ differenzierter zu erklären: Beispielsweise werden Objekte im Gedächtnis anhand von „Schnappschüssen“, die aus einem bestimmten Blickwinkeln aufgenommen sind (gelernte Ansichten), repräsentiert. Diese gelernten Ansichten werden am besten wiedererkannt; für andere Ansichten müssen dagegen die gespeicherten Vorlagen interpoliert werden. Allgemein wird versucht, eine Übereinstimmung zwischen den von einer Figuration stimulierten Netzhautzellen und den für eine Figurationsschablone spezifizierten Netzhautzellen zu erzielen.
Anderson 2007 Anderson, J.R. (2007): Kognitive Psychologie. Berlin, Heidelberg (Nachdruck 2012) hat einige Kriterien zusammengestellt, nach denen Probleme bei einem Vergleich von Bildern (Schablonen) auftreten können:
  • das Bild trifft auf einen falschen Teil der Netzhaut;
  • das Netzhautbild besitzt die falsche Größe;
  • das Bild besitzt nicht die passende Ausrichtung;
  • die Bilder weichen durch minimale Merkmale von einem Standard ab.
Obwohl das „Schablonen-Verfahren“ für die Erklärung menschlicher Wahrnehmungsprozesse und -effekte eher nicht geeignet erscheint, besaß und besitzt es dagegen für den digitalen Bereich der Bild- und Mustererkennung durchaus einen hohen Stellenwert (vgl. z.B. Bishop 2006 Bishop, C.M. (2006): Pattern Recognition and Machine Learning. Berlin). Der „Schablonenabgleich“ hat für den digitalen Bereich der Bild- und Mustererkennung einen hohen Stellenwert.
Die Vorstellung, dass Bilder, Ansichten, Figurationen als Ganzes gedanklich gespeichert sind, um die Umwelt mit ihrer unendlichen Anzahl von Objekten vergleichen und identifizieren zu können, wurde durch die Überlegung weiterentwickelt, dass als Basis der visuellen Objektbildung die Zusammenstellung von Objekten oder Figurationen aus ihren Einzelelementen wahrscheinlich ist. Diese Grundüberlegung wurde mit der dynamischen Komponente verbunden, dass der Erkennungsprozess zuerst unbewusst und vom Reizmaterial ausgeht, dann aber zunehmend durch Aufmerksamkeitsprozesse gedanklich gesteuert wird. Diese Überlegung wird durch mehrere theoretische Ansätze gestützt und in der Wahrnehmungspsychologie diskutiert sowie empirisch untersucht. Diese Grundüberlegung der Merkmalanalyse wurde mit einer dynamischen Komponente verbunden, dass nämlich der Erkennungsprozess zuerst unbewusst vom Reizmaterial ausgeht, dann aber zunehmend durch Aufmerksamkeitsprozesse gedanklich gesteuert wird.
Einen großen Einfluss auf die Entwicklung dieses Zusammenhangs hatte der Ansatz der „computational theory“ von David Marr 1982 Marr, D. (1982): Vision. A Computational Investigation into the Human Representation and Processing of Visual Information. San Francisco, mit dem der Wahrnehmungsvorgang als ein Prozess der Informationsverarbeitung gesehen wird und vergleichbar mit Analysevorgängen in der Computertechnik (Informatik) in Schritten erfolgt:
  • Grundlage ist das Netzhautbild mit Helligkeits- oder Farbinformationen der Außenwelt;
  • daraus wird eine sogenannte „Skizze“ abgeleitet, mit einer Analyse von Helligkeitsänderungen an Kanten, zusammenhängenden Flächen und Oberflächentexturen;
  • danach erfolgt der „2½-D-Entwurf“, bei dem durch räumliche Orientierung grobe Oberflächeninformationen bestimmt werden;
  • und schließlich das „3-D-Modell“, das durch vollständige gedankliche Verarbeitung der beiden retinalen Bilder (Querdisparation) zu einem stabilem räumlichen Bild der Umwelt kommt.
Dieser theoretische Ansatz war und ist nicht unumstritten, hat aber maßgeblich zur Etablierung der sogenannten „Neuroinformatik“ beigetragen (vgl. z.B. Koch 1999Koch, C. (1999): Biophysics of Computation: Information Processing in Single Neurons, Oxford), die u.a. das Verständnis für dynamische Abläufe bei neuronalen Prozessen gefördert hat. Dieser theoretische Ansatz von Marr hat maßgeblich zur Etablierung der sogenannten „Neuroinformatik“ beigetragen.
Ein Ansatz, der unmittelbar die Erklärung der Objektbildung zum Ziel hat, ist die sogenannte „Merkmalintegrationstheorie“ (Treisman et al. 1980Treisman, A. u. Gelade, J. (1980): A feature-integration theory of attention. Cognitive Psychology, 12, 97–136; Treisman et al. 1985Treisman, A. u. Souther, J. (1985): Search Asymmetry: A Diagnostic forPreattentive Processing of Separable Features. Journal of Experimental Psychology: General, 144 (3), 285–310). Bei diesem theoretischen Ansatz wird vor allem die Funktion der Aufmerksamkeit bei der visuellen Objektwahrnehmung in den Mittelpunkt gestellt (vgl. Wühr 2014 Wühr, P. (2014): Merkmalsintegrationstheorie. In: Dorsch Lexikon der Psychologie, Bern). Es werden für die Objektwahrnehmung „Merkmalskarten“ zur retinotopen Organisation (vgl. Kap. 3.4.1.2) von Objektmerkmalen und ihren Positionen sowie „Generalkarten“ zur Steuerung der Aufmerksamkeit unterschieden. Auf einer präattentionalen Stufe werden die Objektmerkmale im visuellen Feld identifiziert und in Form von Merkmalskarten kodiert, in dem sie parallel, das heißt ohne Aufmerksamkeit, verarbeitet werden. Allerdings kann auch ein Objekt, das aus einem einzelnem Merkmal besteht, mit Hilfe singulärer Aufmerksamkeit schon auf der präattentionalen Stufe identifiziert werden. Dieses Phänomen, bei dem es zu einem sogenannten „Pop-out-Effekt“ kommt, wurde im Rahmen der sogenannten Merkmalsuche mit Hilfe empirischer Untersuchungen mehrfach differenziert und überprüft (z.B. Hansen et al. 1988 Hansen, C. u. Hansen, R. (1988): Finding the Face in the Crowd: An Anger Superiority Effect. Journal of Personality and Social Psychology, 54, 917-924). Zur Identifizierung eines Objektes auf der attentionalen Stufe der Wahrnehmung wird die Aufmerksamkeit auf eine bestimmte Position in der Generalkarte ausgerichtet, „indem die Informationen über einzelne Objektmerkmale an korrespondierenden Positionen in den Merkmalskarten integriert (gebunden) werden“ (Wühr 2014 Wühr, P. (2014): Merkmalsintegrationstheorie. In: Dorsch Lexikon der Psychologie, Bern). Beim Ansatz der Merkmalintegrationstheorie wird vor allem die Funktion der Aufmerksamkeit bei der visuellen Objektwahrnehmung in den Mittelpunkt gestellt.
Die Merkmalintegrationstheorie kann auch für die in kartographischen Medien ablaufenden Suchprozesse wichtige Erkenntnisse liefern, sie ist allerdings, aufgrund starker Polarisierungen im Rahmen wissenschaftlicher Auseinandersetzungen, durch neuentstandene Theorieansätze nicht immer sinnvoll interpretierbar (z.B. „visuelle Suche“, „Konjunktionssuche“). Die Merkmalintegrationstheorie kann auch für die in kartographischen Medien ablaufenden Suchprozesse wichtige Erkenntnisse liefern.
Eine weiterer Ansatz zur Objekterkennung, ist die Theorie der „komponentialen Erkennung“ (recognition-by-components theory) nach Biedermann 1987 Biedermann, I. (1987): Recognition-by-components: A theory of human image understanding. Psychological Review, 94, 115-147. Sie versteht die Objektbildung als ein dreistufiges Modell, nach dem ein Objekt visuell als Konfiguration einfacherer Komponenten entsteht: Die Objektbildung wird als ein dreistufiges Modell betrachtet, nach dem ein Objekt visuell als Konfiguration einfacherer Komponenten entsteht:
  • Ein Objekt gliedert sich als eine Menge elementarer Teilobjekte.
  • Die Teilobjekte repräsentieren eine bestimmte Merkmalkategorie, die als sogenannte Geons klassifiziert sind.
  • Ist ein Objekt durch seine beteiligten Geons bestimmt, so wird es als diejenige Figuration erkannt, aus deren Teilmerkmalen sie zusammengesetzt ist.
Bei diesem Ansatz der visuellen Objektbildung wird davon ausgegangen, dass aus dem Erkennen eines Geons das Erkennen der Merkmale erfolgt, die es definieren. Diese Merkmale sind dann Elemente zur visuellen Erzeugung der zugrunde liegenden Form des zu identifizierenden Objektes. Die Gültigkeit der „komponentialen Erkennung“ ist durch mehrere Untersuchungen überprüft wurden, bei denen z.B. Geone experimentell weggelassen worden sind und dadurch das Erkennen des zugehörigen Objektes erschwert war (Biedermann et al. 1985 Biederman, I.; Beiring, E.; Ju, G. u. Blickle, T. (1985): A comparison of the perception of partial vs. Degraded objects. Unveröfft. Manuskript, State University of New York at Buffalo) Die Gültigkeit der „komponentialen Erkennung“ ist durch mehrere Untersuchungen überprüft wurden.
Zusammenfassung und Resümee der viuellen Objektbildung
Wie angedeutet wurde, existieren zur Objektwahrnehmung bzw. Mustererkennung in der Wahrnehmungspsychologie und verwandten Disziplinen eine große Anzahl von Theorieansätzen und empirische Untersuchungen, vor allem auch in den Neurowissenschaften einschließlich der Neuroinformatik. Insgesamt kann konstatiert werden, dass noch kein anerkannter Ansatz vorliegt, der die visuellen und neuronalen Faktoren, Prozesse und Mechanismen der Objektbildung abschließend beschreibt. Insgesamt kann konstatiert werden, dass noch kein anerkannter Ansatz vorliegt, der die visuellen und neuronalen Faktoren, Prozesse und Mechanismen der Objektbildung abschließend beschreibt.
Allgemein wird favorisiert, dass die Objektbildung auf der Wahrnehmung von Merkmalen beruht und dass dazu im visuellen Cortex bestimmte Merkmalsdetektoren zur Verfügung stehen. Ein Vergleich mit Schablonen kann ausgeschlossen werden, dagegen ist es wahrscheinlicher, dass ein dynamischer Prozess der Merkmalanalyse stattfindet, indem verschiedene Merkmale kombiniert werden und die Prozesse sowohl bottom-up als auch top-down geleitet sind. Den Gestaltprinzipien kommt dabei die Funktion zu, den Wahrnehmungsverlauf aufgrund vorliegender Reizbedingungen hinsichtlich der Organisation beteiligter Merkmale „gestaltbildend“ zu beeinflussen. Allgemein wird vermutet, dass die Objektbildung auf der Wahrnehmung von Merkmalen beruht.
Für die Wahrnehmung in kartographischen Medien können aus diesen vorliegenden Erkenntnissen wichtige Impulse gewonnen werden. Auf der anderen Seite sind durch die spezifischen Merkmale und Relationen georäumlicher Figurationen und durch die durch Konventionen und Erfahrungen beeinflusste „Kartographische Bildsprache“ ganz eigene Abbildungsbedingungen und -eigenschaften entstanden, die – wie schon mehrmals angedeutet wurde – nicht ohne weiteres mit den geschilderten Wahrnehmungsbedingungen der genannten Disziplinen verglichen werden können. Für die Wahrnehmung in kartographischen Medien können wichtige Impulse gewonnen werden, wobei aber aufgrund einer eigenen „Kartographischen Bildsprache“ spezifische Abbildungsbedingungen existieren.