Kitabı oku: «Bilder - Schilder - Sprache», sayfa 4

Yazı tipi:

3 Linguistic Landscapes und Multimedialität

Multimedialität wird in der Linguistic Landscape-Forschung ebenso wie in der Bildlinguistik für die Beschreibung unterschiedlicher Dimensionen gebraucht. Der Begriff bezieht sich einerseits auf grafische Darstellungen, die auf einem Sign das sprachliche Element ergänzen und als solches zur Gesamtaussage eines Signs beitragen können und steht andererseits für die konkrete Form der schriftlichen Präsentation von Sprache und zielt hier dann auf die verwendeten Fonts und Farben der Schrift bzw. des Schrifthintergrundes.

Da geschriebene Sprache im öffentlichen die zentrale Datenbasis der Linguistic Landscape-Forschung darstellt, wird im Folgenden zunächst auf die Gestaltungsmöglichkeiten eingegangen, die sich durch die gezielte Verwendung von Fonts, Farben etc., also typografischen und Designelementen ergeben und die Schrift ggf. zu einem mehrdimensionalen Element werden lassen, das sowohl sprachlich als auch grafisch wirken und Botschaften über die reine Textbedeutung hinaus transportieren kann (ausführlich zu den sich hieraus ergebenen Implikationen und der Bedeutung der Sichtbarkeit von Sprache bzw. Kommunikation vgl. Spitzmüller 2013).

3.1 Typografische Aspekte

Die typografische Gestaltung kann auf unterschiedlichste Weise zur Bedeutung einzelner Worte oder komplexerer Aggregate beitragen (Stöckl 2008). So kann mit der Wahl bestimmter Fonts unter Rückgriff auf kulturelle/gesellschaftliche Prägungen über die reine Wortbedeutung hinaus verwiesen und diese zusätzlich mit einer Konnotation versehen werden, die allein durch den Font ausgelöst wird (vgl. das Konzept der Sehschulung von Friedrich & Schweppenhäuser 2010 in Kapitel 2.2). Dieser Einfluss zeigt sich z.B. auch in der Verwendung bestimmter Fonts im Modebereich. Zahlreiche Labels oder Zeitschriftentitel verwenden ähnliche Fonts oder Abwandlungen eines Fonts, z.B. des Engravers Gothic bei Strenesse, Zara, Balenciaga oder Givenchy oder des Didot oder Bodoni bei Modezeitschriften des Luxussegments wie der Vogue (Wichert 2016).

In LL-Studien fällt die Analyse der Verwendung spezieller Fonts häufig mit besonderen Farbgestaltungen der Schildfläche oder der Schrift selbst zusammen, wobei sich eine bestimmte funktionale Ausrichtung erkennen lässt. Während die von Friedrich & Schweppenhäuser (2010) beschriebene Verbindung von Fonts und bestimmten Produkten für die Linguistic Landscape vernachlässigbar sind, da sie kein die Linguistic Landscape prägendes Element sind, kommt solchen Verbindungen im Bereich des Tourismus und der Gastronomie häufig eine zentrale Bedeutung zu.1

Moriarty (2014) und Reershemius (2011) zeigen an sehr unterschiedlichen Beispielen, wie die Kombination aus Font und Farbe im Bereich des Tourismus gezielt eingesetzt wird um Emotionen (vor allem Authentizität und Bodenständigkeit) zu transportieren. Während die Verwendung der Fonts in diesen Fällen vergleichsweise homogen ist und sich im Wesentlichen am Vorhandensein bestimmter Merkmale wie Serifen orientiert, ist die Auswahl an Farben nur scheinbar größer. Um die gewünschten Informationen transportieren zu können, muss auf in der Zielgruppe verankerte prototypische, mit dem Referenten fest verbundene Zuschreibungen zurückgegriffen werden, um die gewünschten Assoziationen aufrufen zu können (vgl. z.B. Metten 2011: 86). In Bezug auf Irland kommt beispielsweise der Farbe Grün eine besondere Bedeutung zu. Der Beiname Irlands „die grüne Insel“ ist zumindest als passives (möglicherweise opaques) Wissen so weit verbreitet, dass die Verwendung der Farbe auch zusammen mit weiteren semiotischen Ressourcen wie Fonts und bildlichen Darstellungen (s.u.) möglich wird, um die Region zu referieren. Die Konnotation der Farbe – Natur und Natürlichkeit und darauf aufbauend Bodenständigkeit und Authentizität – wird auf das Denotat Irland übertragen, das entsprechend aufgeladen wird. Die Verwendung einer bestimmten Sprache (hier: Irisch), die das eigentliche Zielobjekt der Linguistic Landscape Forschung ist, ist in größerem Umfang dann in vielen Fällen nicht mehr nötig.

Auch im Untersuchungsraum der vorliegenden Studie gibt es Beispiele für den gezielten Einsatz bestimmter Fonts, die in diesem Falle mit einer bestimmten Sign-Gestaltung einhergehen, um dem Stil des Gebäudes Rechnung zu tragen, an dem die Schilder befestigt sind, wodurch sie unmittelbar mit der Gestaltung des öffentlichen Raumes in Zusammenhang stehen und weniger ökonomische Ziele verfolgen. In diesen Fällen läuft der Sign-Inhalt der durch die Sign-Form geweckten Erwartungshaltung zuwider, bricht also in einem gewissen Sinne mit der Konvention, um die Homogenität der Wahrnehmung zu erhalten.

Über den Eingängen zu den Theatiner Höfen in der Theatinerstraße befinden sich beispielsweise wappenartige Signs (vgl. Bild 7), die dem historischen Charakter des Gebäudes Rechnung tragen, aber erst im Zuge der Neugestaltung der Anlage in den 1970er Jahren angebracht wurden. Diese ‚historisierenden‘ Signs nehmen aber, anders als erwartet, nicht auf ein historisches Ereignis Bezug, sondern eben auf die erwähnte Neugestaltung und die Fertigstellung der Anlage im Jahr 1972. Dieser Sign-Gestaltung stehen in unmittelbarer Nähe modern gestaltete Signs mit Hinweisen auf die Nutzer der Höfe gegenüber.

Bild 7:

Theatinerhof.

Das gegenteilige Verfahren findet sich ebenfalls in der Weinstraße (vgl. Bild 8, Bild 9). Hier wird auf einem schlichten, sehr unauffälligen Plexiglasschild auf den Wohnort des Stadt- und Hofmalers Hans Mielich († 10.03.1573) hingewiesen. Das ursprüngliche Gebäude wurde während des 2. Weltkriegs stark zerstört, im Wiederaufbau mit Ladeneinbauten versehen und erhielt so vor allem im Erdgeschoss ein modernes architektonisches Gesicht, an dem sich die Gestaltung der Hinweistafeln orientiert (vgl. Enns 2013: 294 sowie 182-183 zu den allgemeinen Grundsätzen des Wiederaufbaus der Münchner Innenstadt. Siehe hierzu auch Meitinger 1946).

Bild 8:

Theatinerstraße, Gedenktafel Mielichhaus.

Bild 9:

Gedenktafel Hans Mielich.

Die genannten Beispiele zeigen auf, dass die Aussage eines Signs mehrschichtig sein kann und Text und Gestaltung auf unterschiedliche Referenten zielen können. Während die Texte der Signs jeweils auf bestimmte Ereignisse hinweisen, orientiert sich die Gestaltung der Signs einschließlich der gewählten Fonts nicht an der Textaussage, sondern an der Aussage bzw. Botschaft des Träger-Gebäudes und seiner Rolle im öffentlichen Raum.

Diese komplexe Beziehungsstruktur besteht nicht nur im Hinblick auf historische Ereignisse. Vielmehr ist sie auch für ökonomisch basierte (private) Signs anzunehmen, wie sie z.B. in der Kombination aus Firmenschildern/Logos und Schaufenstern oder ähnlichen Präsentationstrukturen im öffentlichen Raum zu finden sind.

3.2 Text und Bild

Die Kombination der sich ergänzenden Ansätze der Linguistic Landscape Forschung mit ihrer Konzentration auf Sprache im öffentlichen Raum, deren sozialer Aussagekraft und ihrer Wirkung auf die Rezipienten mit der stärker Produzenten-orientierten und die Interaktion unterschiedlicher Modi untersuchenden Bildlinguistik bieten einen neuen Ansatz zur Analyse öffentlicher Räume als multimodaler gesellschaftlicher Konstrukte. Dies gilt umso mehr, als dass Multimodalität in der Form, in der sie überwiegend Gegenstand moderner Forschung ist und die Linguistic Landscape ihre gemeinsame Basis in der in Kapitel 2.3 beschriebenen historischen Entwicklung haben.

Multimodalität im Sinne einer Kombination bzw. Integration unterschiedlicher Zeichensysteme (z.B. Grafik, Schrift, Bild) zu einer Gesamtaussage1 werden in der Linguistic Landscape nicht systematisch betrachtet. So berücksichtigt z.B. Blackwoods (2013: 69) Arbeit zu Korsika ausschließlich das korsische Wappen (tête de Maure) als Emblem auf den Dosen der lokalen Cola-Sorte und dies nur als Hilfsargument, ohne den Beziehungstyp zwischen Sprache und Grafik zu thematisieren. Gleiches gilt für Malinowskis (2009) Studie zum Koreanischen in Oakland, in der die Verwendung unterschiedlicher Modes lediglich am Rande und aus Produzentensicht angesprochen, aber nicht systematisch analysiert werden (besonders S. 119-123).

Während sich die Linguistic Landscape also auf die Präsenz geschriebener Sprache und die Verwendungsformen und –frequenz von Einzelsprachen in einem gegebenen Untersuchungsraum konzentriert, wird die Interaktion mit weiteren grafischen oder bildlichen Elementen weitestgehend außer Acht gelassen. Damit fällt der Einfluss, den diese komplexen Aggregate möglicherweise auf die Wahl2 der Sprache und ihre Repräsentationsform haben aus der Analyse ebenso heraus wie die Frage nach dem Grad der Konventionalisierung bestimmter Formen. In Kapitel 2.3 wird gezeigt, dass die Linguistic Landscape in ihrer aktuellen Erscheinungsform ein in einem bestimmten historischen Kontext und dessen Reflex in der Öffentlichkeit entstandenes Phänomen ist, dessen Entwicklung immer in diesem Rahmen verblieben und von diesem nicht zu trennen ist. Zu diesem Rahmen gehörte von Anfang an nicht nur ein bildliches bzw. grafisches Moment, sondern auch die bewusste Integration von geschriebener Sprache und Bild bzw. deren Kombination zu einer Gesamtaussage (vgl. Kapitel 3.3).

Die Linguistic Landscape Forschung berücksichtigt somit stärker die Wirkung einer LL auf die Rezipienten und fragt weniger nach der Motivation der Produzenten für eine bestimmte Sprachwahl (innerhalb der gegebenen rechtlichen Rahmenbedingungen). Sie hat aber nicht den Einzelnen oder die Rezipienten als große anonyme Masse und dessen bzw. deren gelernten und/oder automatisch ablaufenden kognitiven Prozesse im Auge. Die Linguistic Landscape zielt i.d.R. auf Gruppen, die sich vor allem anhand des Parameters (sprachliche) Minderheit definieren lassen (s.o.).

Der Unterschied zur Bildlinguistik und Medienwissenschaft liegt damit darin, dass nicht Modellentwicklung und die Beschreibung Einzelsprachen-unabhängiger Mechanismen (ggf. in ihrer Kombination mit grafischen Elementen) und deren Analyse im Zentrum der Forschung stehen, sondern die konkrete Verwendung von Einzelsprachen und die Annahme, dass sich daraus Aussagen über die politischen und gesellschaftlichen Machtverhältnisse zwischen einzelnen gesellschaftlichen Akteuren ableiten lassen. Dass die Daten für derartige Analysen Teil von durch ökonomische Nutzung geprägten, größeren Aggregaten sind, wird nur am Rande thematisiert z.B. in Studien zur Kommodifizierung von Sprache (s.o.).

Die Interaktion von (geschriebener) Sprache und Bild/Grafik in multimodalen Entitäten ist das Thema der Bildlinguistik, die sich diesem Bereich schwerpunktmäßig mit Blick auf moderne Massenmedien widmet (z.B. Stöckl 2004a, Stöckl 2004b, Stöckl 2011, Bateman 2014, Große 2011).3 Das Zusammenspiel von Sprache und Bild in vergleichbaren Strukturen im öffentlichen Raum wird bis dato von der Bildlinguistik ebenso wenig wie von den Medienwissenschaften zu ihrem Gegenstand gezählt. Dabei finden sich, wie oben erwähnt, im gleichen Erhebungsraum, in dem die Linguistic Landscape ihren Forschungsraum sieht, multimodale Aggregate, bei denen das Zusammenspiel von Schrift und Bild zentral für die Gesamtaussage ist. Zahlreiche Schaufenster bestehen nicht nur aus ausgestellten Waren, sondern weisen eine komplexe Struktur auf, die aus Text, Bildern/Grafiken sowie Objekten in Form von Schaufensterpuppen und weiteren Elementen (z.B. Dekorationen) bestehen kann. Diese Aggregate können zusätzlich noch auf die jeweils zugehörigen Firmenschilder bezogen werden, so dass großflächige, mehrteilige Text-Bild-Kombinationen entstehen.

Die Bildlinguistik will einen Analyseapparat zur Verfügung stellen, der eine systematische Beschreibung der unterschiedlichen Beziehungen von Sprache und Bild/Grafik ermöglicht. Dabei steht nicht nur die jeweilige Leistungsfähigkeit der unterschiedlichen semiotischen Systeme und damit ihre jeweilige Funktion und textsortenspezifische Quantität in Text-Bild-Aggregaten im Zentrum der Betrachtung (vgl. Stöckl 2011: 48-50; 2004a: 3ff.), sondern auch die Frage nach dem informationellen ‚Mehrwert‘ solcher Kombinationen:

The idea is, that under the right conditions, the value of a combination of different modes of meaning can be worth more than the information (whatever that might be) that we get from the modes when used alone. (Bateman 2014:6, Hervorhebung im Original, vgl. auch Bucher 2011: 127)

Neben der Frage, welche Aggregatsteile in welchem Umfang Informationen zur Gesamtaussage beitragen und woraus das „more“ besteht, ist die Frage der Wahrnehmung und Verarbeitung solcher Aggregate ebenfalls von zentraler Bedeutung. Während die Wahrnehmung von Bildern holistisch ist und sie leichter und besser memoriert werden, weshalb Straßner (2002: 42) sie auch als „schnelle Schüsse ins Gehirn“ beschreibt, ist geschriebene Sprache an Linearität gebunden. Sicher kommt auch das Phänomen des Bildüberlegenheitseffekts (picture superiority effect, vgl. Nelson, Reed und Walling, 1976, Nelson, 1979, vgl. auch Miller 2011) zum Tragen, das heißt, dass Abbildungen von Objekten besser erinnert werden als die entsprechenden lexikalischen Repräsentationen, vgl. auch die Theorie der Doppelcodierung von Paivio (1986), wonach die Verarbeitung von Bildern mit der Aktivierung der entsprechenden lexikalischen Repräsentationen einher geht, während dies umgekehrt nur eingeschränkt gilt. Das Phänomen des picture superiority effect kann damit in Verbindung gebracht werden, dass entsprechend kodierte Einheiten (Bilder im weitesten Sinn des Wortes) kognitiv mehr oder minder analog und nahezu simultan verarbeitet werden (Kuhlhavy, Stock und Kealy 1993: 52), während sprachliche Einheiten zumindest in Teilen phonetisch und kognitiv sequentiell repräsentiert und verarbeitet werden (in Bezug auf Schrift gilt die vornehmlich für phonografische, weniger für logografische Verfahren). Dennoch kann mit Holly (2009: 401) vermutet werden, dass diese Differenz selten zu einer autonomen Lesung der Sprach- oder Bildseite auf Signs führt, sondern eher im Sinne des ressource integration principle (Baldry & Thibault 2006: 19) multiplikativ wirksam wird.

Multimodale Text-Bild-Strukturen verlangen vom Rezipienten also in der Regel zwei unterschiedliche Wahrnehmungsformen, die in Kombination nacheinander oder wechselnd und in vielen Fällen in beliebiger Reihenfolge stattfinden können, womit die Linearität insgesamt aufgehoben wird (vgl. Bucher 2011: 125; 2016: 27; 2017). Bucher (2011: 126-127) bezieht sich im Zusammenhang mit dem Wahrnehmungsprozess auf zwei Modelle, die gegenläufige Aneignungsrichtungen aufweisen.

Die „Salience Theorie“ (Itti & Koch 2000) beschreibt ein bottom-up-Verfahren, bei dem auffällige Elemente (Farbe, Form, Position) eines Aggregats den Prozess der Aneignung steuern. Bei Aggregaten, die sich wie in der vorliegenden Studie im öffentlichen Raum und damit in gelernten Großstrukturen finden, können dies z.B. farbliche Elemente, Schriftgröße oder Position sein. So ist die Farbe Rot vor allem in Bezug auf Rabattaktionen und Sonderverkäufe zu finden (vgl. Kapitel 5) und Schaufenster oder Plakate, die diese Farbe zusammen mit weiteren Elementen verwenden, ziehen eine größere Aufmerksamkeit auf sich, ohne dass dies ein ‚bewusster‘ vom Rezipienten geplanter Vorgang ist. Dieses Verfahren könnte auch das Fehlen von erwarteten Elementen umfassen, so dass ‚Leerstellen‘ Aufmerksamkeit erregen. Itti & Koch (2000: 1490) weisen aber darauf hin, dass parallel zu diesem bottom-up-Verfahren ein top-down-Verfahren ablaufen kann, das eine willentliche, bewusste Fokussierung auf bestimmte Elemente umfasst, was im gegebenen Kontext beispielsweise im konkreten Suchen eines bestimmten Geschäfts, eines Zugangs zu oder einer Haltestelle des öffentlichen Personennahverkehrs bestehen könnte. Die Aufmerksamkeit ist in diesem Fall auf einen bestimmten Typ Schild bzw. Information fokussiert, dessen Form und/oder Positionierung gelernt sind. Andere Reize, die ansonsten über das bottom-up-Verfahren aktiviert werden, werden entsprechend ausgeblendet bzw. überlagert.

Das Modell von Schnotz et al. (2003) beschäftigt sich im Gegensatz zu Itti und Koch stärker mit der eigentlichen Verarbeitungsstruktur multimodaler Aggregate. Zentral sind getrennte Verarbeitungswege von Text (descriptive) und Bild (depictive), die jeweils in mental models resultieren. Die ‚Ergebnisse‘ der beiden getrennten Verarbeitungsprozesse werden hinterher in einem mapping miteinander abgeglichen und ergänzen sich gegenseitig. Dabei kann der Informationsgehalt der generierten mental models von ihrer ‚Konstruktionsvorlage‘ (Text oder Bild) abweichen, da mental models einerseits bereits bekanntes Wissen um das Thema/Objekt berücksichtigen können und andererseits für die in der aktuellen Situation unnötige Informationen nicht berücksichtigt werden.

Bucher stellt über den Verweis auf die obigen Modelle Aneignung und Verarbeitung multimodaler Aggregate und damit die Rezipientenseite ins Zentrum der Überlegungen, während sich die Modelle der Bildlinguistik auf die strukturelle, syntagmatische Komposition multimodaler Entitäten konzentrieren und damit tendenziell eher auf die Produzentenseite abzielen.

Dies zeigt sich auch in der Entwicklung Grammatik-orientierter und damit linearer Modelle, die die strukturellen Beziehungen der einzelnen Elemente eines multimodalen Aggregats analysierbar machen sollen und so eine systematische und vergleichbare Beschreibung der Funktionsweise multimodaler Komplexe anstreben4. Diese Modelle werden an massenmedialen Objekten entwickelt und reichen in ihren elaborierteren Versionen für die vorliegende Studie zu weit: Wie schon mehrfach betont weist der öffentliche Raum in hohem Grade historisch gewachsene und konventionalisierte Elemente mit eingeschränktem, themen- und raumspezifischem bildlich/grafischem und sprachlichem Inventar auf. Daraus ergibt sich ein ‚Analysedreieck‘, das sich auf die Beziehungen zwischen den Analysegrößen Bild, Schild und Sehfläche beschränkt (für eine Definition der Analysegrößen siehe Kapitel 4.3). Darüber hinaus ist der öffentliche Raum in den vorgegebenen Strukturen statischer, so dass weniger Variationsmöglichkeiten in der Anordnung von Elementen gegeben sind. Schaufenstergrößen und ihre Position im Gebäude sowie weitere architektonische Gegebenheiten sind beispielsweise nicht ohne Weiteres beeinflussbar und über lange Zeit als feste Größe vorgegeben. Dadurch gelten, wie sich auch in der Analyse zeigen wird, die von Straßner (2002: 42) genannten Prämissen hinsichtlich der Kürze und Prägnanz von Texten sowie dem Corporate Design5 in besonderer Weise, da die Funktion dieser öffentlichen Repräsentation nicht nur auf reine Werbung beschränkt ist.

Einerseits ist sie Teil des Placemaking, also der (stadtplanerischen) Gestaltung von Teilen des öffentlichen Raums, die auch die Umwandlung von Raum in einen sozialen (konstruierten und interaktiven) Raum beinhaltet, welche hier einer dauerhaften Präsenz von Unternehmen entspricht, die durch entsprechende Marker wie Label, Schilder, Slogans etc. sichtbar gemacht werden6. Sie weisen damit dem Raum nicht nur eine spezifische Funktion zu, sondern profilieren ihn auch in eine bestimmte Richtung und geben ihm so ein typisches ‚Gesicht‘. Gleichzeitig wird in der Warenpräsentation und Schaufenstergestaltung nicht nur analog zu anderen Werbemedien für konkrete Produkte geworben, sondern ggf. eine Auswahl unterschiedlicher Ausführungen des gleichen Produktes häufig Anlass- oder Lifestyle-spezifisch situiert präsentiert (vgl. Bild 2 und Bild 3). Die unmittelbare Nähe zum Verkaufsraum mag dabei ein implizites „im Laden/hier gibt es X“ oder „hier gibt es mehr davon“ beinhalten, ähnlich wie dies auch für virtuelle Räume bzw. Online-Shops gelten mag, und den kommunikativen Charakter und die soziale Komponente dieser öffentlichen Strukturen betonen. Anders als reine Print- oder Fernsehwerbung kann das Werbemedium Schaufenster nicht nur unmittelbar auf den Betrachter einwirken, sondern auch direkte und spontane Handlung initiieren und so auch Personen am Rande oder außerhalb der eigentlichen Zielgruppe ansprechen.

Vor dem Hintergrund dieser gewachsenen und konventionalisierten Strukturen und ihren zugehörigen Kommunikations-, Interaktions- und Handlungsformen muss gefragt werden, inwieweit Modelle zur Text-Bild-Integration die Existenz dieser Formen in Rechnung stellen sollten. In der konkreten Ausgestaltung sind die Möglichkeiten der Nutzung dreidimensionaler Räume zentral, weil sie eine zusätzliche Informationsebene zur Verfügung stellen und damit, auch in Abhängigkeit von der Analysegröße (s.u.), komplexere Aggregate ermöglichen.

Bei der Analyse der Rezeption dieser Aggregate muss auf allgemein zugängliche Wissensbestände der Wahrnehmenden zurückgegriffen werden. Dieser Vorgang wird durch eine grundsätzliche Voreinstellung des Wahrnehmenden (Erwartungshaltung) erleichtert, die im konventionalisierten Wissen um die Struktur, die Formen und die Intentionen des vorgefundenen Raums begründet liegt, durch die Handlungen der im Raum Agierenden ständig reproduziert wird und dadurch Stabilität erlangt. Als Beschreibungsmodell für diese stereotypen Situationen und ihre Handlungen bietet sich die Frame Semantics an (Fillmore 2006), die eine hierarchische, ontologische Systematisierung des öffentlichen Raumes und damit auch die Aneignung und Analyse von einzelnen multimodalen Aggregaten über Segmentierung in Frames und Subframes ermöglicht. Ebenso wie die oben angesprochenen Verfahren von Itti & Koch (2000) und Schnotz et al. (2003) handelt es sich bei der Frame Semantics um ein kognitives Verfahren, das den Rezipienten multimodaler Aggregate in das Zentrum stellt.

Die Analysemodelle der Bildlinguistik wie das unten vorgestellte, von Martinec & Salway (2005) entwickelte und auf Barthes (1964) basierende Modell (vgl. auch Bateman 2014: 190-198), konzentrieren sich ausschließlich auf die formale Beschreibung der Beziehung von Bild und Text in multimodalen Aggregaten und fragen damit weder nach den Aneignungswegen der Rezipienten noch nach den Intentionen der ‚Kompositeure‘. Die nicht-lineare kommunikative Struktur des öffentlichen Raums sowie das sich aus der historischen Entwicklung ergebende Kontextwissen hinsichtlich möglicher und/oder erwarteter Daten- und Informationsstrukturen sowie daraus abgeleitete Handlungen der Wahrnehmenden, also deren Interaktion mit dem und im Raum werden in der Modellbildung nicht berücksichtigt. Es kann nicht ausgeschlossen werden, dass gerade durch die Situiertheit mittels einzelner Aggregatselemente Informationswege und –strukturen aktiviert werden, die sich einer formalen Beschreibung entziehen.

Da aber im öffentlichen Raum multimodale Aggregate existieren, die in ihrer Form große Ähnlichkeit zu den Untersuchungsgegenständen der Bildlinguistik haben, wird in Kapitel 5.3.2 und 5.3.3 auf Basis von Martinec & Salway (2005) ein Modell vorgeschlagen, das mit leichten Anpassungen die Integration aller wesentlichen Komponenten eines multimodalen Konstrukts im Sinne der vorliegenden Studie ermöglicht und gleichzeitig die gegebene feste, stereotype Struktur beschreibbar macht, so dass den unterschiedlichen Analyseebenen des öffentlichen Raumes ebenso Rechnung getragen werden kann, wie seinen Besonderheiten im Hinblick auf die gemeinsame Wahrnehmung von eigentlich unabhängigen Elementen.

Zentral sind vor allem die auf der Dreidimensionalität von Schaufenstern und weiteren Aggregaten basierenden und damit zusätzlich gegebenen Bedeutungsebenen. Aber auch die Beziehung von Firmenschildern und Sehflächen/Schaufenstern sowie von Firmenschildern und den Gebäuden, an denen sie befestigt sind, stellen eine Analysegröße dar, die zweidimensionale multimodale Aggregate nicht erklären müssen, aus denen sich jedoch eine Struktur ergibt, in der mehrere Bild- und Textelemente in einem einzigen Aggregat zusammentreffen und sich die Aussagen nicht über eine 1:1 Zuweisung von einzelnen Text- und Bildelementen zu einander ergeben, sondern ggf. Zwischenstufen mit Subaggregaten entstehen.

Dieser Datenstruktur wird durch die Einführung einer weiteren Analyseebene, die in Anlehnung an Fix (1996) Supertext genannt wird, Rechnung getragen. Dieser Supertext kann als α-modale Zwischenstufe7 dann als Vergleichsgröße für die verbleibenden Elemente dienen und nimmt jeweils die komplementäre Rolle ein (bildartig in Beziehung zu Text und textartig in Beziehung zu Bild/Grafik).

Damit spricht das vorgeschlagene Modell die von Klemm & Stöckl (2011: 12) aufgeworfene Frage nach den Prinzipien der Bild-Text-Verknüpfung an. Die darüberhinaus von Klemm & Stöckl (2011: 12) angesprochenen Fragen hinsichtlich der Komposition und kommunikativen Funktion des Bildes als eigenständigem semiotischen Mittel ergeben sich in diesen Modellen indirekt über die Beschreibung ihrer Funktion in Bezug auf den Text. Neben seiner kommunikativen und interaktiven Ausrichtung weist der öffentliche Raum jedoch weitere zu berücksichtigende Besonderheiten auf, die Anpassungen im Modell von Martinec & Salway, aber auch in allen anderen bildlinguistischen Ansätzen notwendig machen, sofern sie sich als grundsätzlich angemessene Modelle für die Beschreibung des öffentlichen Raumes erweisen.

Somit stellt sich die oben bereits angedeutete Frage, ob sich die grundsätzlichen Beziehungsstrukturen von Text/Schild und Bild in Schaufenstern und auch im öffentlichen Raum insgesamt aufgrund dieser Differenz von zweidimensionalen Aggregaten unterscheiden, oder ob Modelle zur Analyse multimodaler Strukturen, die in der Regel für das bzw. am gedruckten Aggregat entwickelt wurden auch auf dreidimensionale Aggregate im öffentlichen Raum und diesen selbst anwendbar sind (vgl. Kapitel 5.3.2 und 5.3.3).

Die Wahl von Martinec & Salway (2005) als Basis für ein Analysemodell begründet sich zunächst in der ausreichenden Differenzierung der möglichen logisch-semantischen Beziehungen der Text und Bild-Komponenten. Andere Modelle weisen hier eine größere Differenzierung auf, ohne jedoch damit die oben angesprochenen Besonderheiten des öffentlichen Raumes zu adressieren. Entsprechend erscheint es sinnvoller, ein ausreichend ausführliches Modell auf notwendige Veränderungsmöglichkeiten und Anknüpfungspunkte hin zu untersuchen, als ein Modell mit vielen nicht benötigten Elementen zunächst zu kürzen und dann anders zu erweitern.

Wesentlich und für den öffentlichen Raum unabdingbar ist bei der Wahl zusätzlich das Vorhandensein einer zweiten Beschreibungsebene, nämlich Status. Der Aspekt Status bei Martinec & Salway (2005: 343-349) beschreibt zunächst auf rein formaler Ebene die Text-Bild-Beziehungen. Dabei werden equal und unqual unterschieden und jeweils in zwei weitere Subkategorien untergliedert. Diese Subkategorien bestimmen auf der equal-Ebene den Grad der Eigenständigkeit der einzelnen Elemente: Bild und Text unabhängig (independent) von einander oder komplementär zu einander (complementary). Vor allem der Parameter independent ist für eine Analyse im öffentlichen Raum wichtig, da dort Text-Bild-Aggregate existieren, die nicht komponiert, sondern der besonderen Situation geschuldet sind und ein Nebeneinander unterschiedlicher Einheiten darstellen. Solche Aggregate sind z.B. Schilder von Arztpraxen, die unmittelbar neben dem Schaufenster eines Ladens angebracht sind und nicht getrennt von diesem rezipiert werden können (vgl. Bild 64 und Bild 70, sowie ausführlich Kapitel 5.3.3) Die Untergliederung des Parameters unequal nimmt auf die beiden Subordinationsrichtungen (Text → Bild oder Bild → Text) Bezug. Die formalen Beziehungen zwischen unterschiedlichen Analyseebenen eines Aggregats des öffentlichen Raumes können über die Unterscheidungen des Parameters Status umfassend berücksichtigt werden, da die Beziehung zwischen einem Firmenschild und einem Schaufenster sowie dessen unmittelbarer Umgebung eben so beschrieben werden können wie die Beziehungen von Text auf der Fensterfläche und solchem, der Teil der Präsentation im Schaufenster ist (vgl. Kapitel 5.3.2 und 5.3.3).

Als zweiten Aspekt führen Martinec & Salway (2005: 349-355) die logico-semantic relations8 aus, die die unterschiedlichen inhaltlichen Beziehungen zwischen Text und Bild/Grafik in einem mehrstufigen System beschreibbar machen. Der Parameter projection wird von Martinec & Salway (2005: 352) zwei bestimmten Text-Bild-Typen zugewiesen (Comic und Text-Diagramm-Aggregate), die sich durch eine Wiederholung zentraler Elemente der Aussagen auszeichnen, also präsente Aussagen im Text, oder zentrale Textaussagen grafisch wiederholen. In der nachstehenden grafischen Darstellung fehlt dieser Aspekt daher. Der Parameter expansion beschreibt im Gegensatz dazu die unterschiedlichen Möglichkeiten der gegenseitigen Ergänzung der in einem Medium gegebenen Informationen. In den gegebenen Strukturen des öffentlichen Raums spielen vor allem die Dimensionen elaboration und extension eine zentrale Rolle, da sie die weitere Erläuterung einer Information durch das jeweils andere Medium bzw. die Präsentation von Zusatzinformationen umfassen. Die Dimension enhancement leistet im Wesentlichen eine räumlich-zeitliche Situierung einer Information.

Abbildung 1:

Grafische Darstellung der relevanten Aspekte des Modells von Martinec & Salway (2005).

Die Überlegung, die derzeit in unterschiedlichen Teildisziplinen getrennt betrachteten rein sprachlichen oder multimodalen Daten unter Rückgriff auf ein einziges bildlinguistisch basiertes Modell zu analysieren und ihre Funktion in urbanen Räumen zu beschreiben, liegt in der historisch gegebenen Verbindungslinie zwischen LL und Bildlinguistik begründet. Dabei werden neue Perspektiven auf Sprache im öffentlichen Raum insgesamt eingenommen, die zunächst auf eine grundsätzliche Beschreibung der Verwendungskontexte und deren Implikationen abzielen.

Ücretsiz ön izlemeyi tamamladınız.