Kitabı oku: «Sprachtherapie mit Kindern», sayfa 3

Yazı tipi:

physiologische Prozesse Im weiteren Kapitel erfolgt nun eine kurze Darstellung der physiologischen Prozesse im Deutschen (Tab. 2).

Physiologischer Prozess: Ein Prozess gilt dann als physiologisch, wenn er in genau der Form und in dem Alter auftritt, wie er in der physiologischen Entwicklung bei Regelkindern sichtbar ist (Fox-Boyer 2014a).

Tab. 2: Auflistung physiologischer phonologischer Prozesse im Deutschen – nach Überwindungsalter hierarchisch aufgelistet (nach Fox-Boyer 2016a)

Systemische Prozesse
Abkürzung	Erläuterung	Beispiel	Auftretensalter
Plos	Plosivierung: Ein Frikativ wird durch einen Plosiv ersetzt. pathologisch: Plosivierung aller Frikative bzw. konstante Plosivierung > 1 Frikative	/fo:gəl/→ [po:dəl] /zͻnə/ → [tͻnə]	<2;6 J.
Glott Er ʁ	Glottale Ersetzung /ʁ/: Das Phonem /ʁ/ wird durch das glottal gebildete Phonem (/h/) ersetzt. pathologisch: glottale Ersetzungen [h ʔ] bei allen anderen Phonemen	/ʁͻlɐ/ → [hͻlɐ]	<2;6 J.
DeAffr	Deaffrizierung: Eine Affrikate wird auf ihren frikativen Lautanteil reduziert.	/topf/→ [tof] /tsaŋə/ → [saŋə]	<2;6 J.
VV /k, g, ŋ/	VV /k, g, ŋ/ Ein Velar wird durch ein weiter vorn gebildetes, sonst merkmalsgleiches Phonem ersetzt.	/kanə/ → [tanə]	<2;5 /ŋ/ <3;6 /k, g/
VV / ʃ, ç/	Vorverlagerung /ʃ, ç /: Ein Sibilant wird durch ein weiter vorn gebildetes, sonst merkmalsgleiches Phonem ersetzt.	/ʃulə/ → [sulə] /iç / → [is]	<4;0 /ç/ <5;0 /ʃ/
Ass	Assimilation: Ein Phonem wird an ein anderes Phonem im Wort angeglichen. pathologisch: > 5 Mal Auftreten in Bezug auf die 99 Items der PLAKSS-II + konstante Kontaktassimilation (> 4;0 J.)	Progressive A.: /man/ → [mam] Regressive A.: /gabəl/ → [babəl] Ferna.: /banane/ → [banabe] Kontakta.: /dʁai/ → [gʁai]	<3;0 J.
RV	Rückverlagerung /z, s, ʃ/: Die Phoneme /z, s oder ʃ/ werden durch ein weiter hinten gebildetes, sonst merkmalsgleiches Phonem ersetzt.	/zͻnə/ → [çͻnə]	<3;0 J.
TFK/TsfK	Tilgung von (silben)finalen Konsonanten: Am Ende eines Wortes bzw. einer Silbe wird ein Konsonant ausgelassen. pathologisch: > 5 Mal oder bei fast allen finalen Konsonanten	/gabəl/ → [gabə] /lampe/ → [lape]	<2;5 J.
TUS	Tilgung unbetonter Silben: Innerhalb eines Wortes wird eine unbetonte Silbe in präbetonter Position ausgelassen pathologisch: > 5 Mal	/bananə/ → [nanə]	<3;0 J.
RCC (RCCi & RCCf)	Reduktion Konsonantenverbindungen: Am Anfang eines Wortes oder einer Silbe (RCCi) oder am Ende eines Wortes oder einer Silbe (RCCf) wird eine Konsonantenverbindung um ein oder zwei Element(e) reduziert.	/fʁͻʃ/ → [ʁͻʃ] /blume/ → [bume]	<4;0 J.

Phonologische Prozesse lassen sich generell in strukturelle Prozesse und systemische Prozesse unterteilen.

Strukturelle Prozesse sind Prozesse, die eine Vereinfachung der Wortstruktur mit sich bringen. Es verändert / reduziert sich die Silbenzahl oder die Anzahl der Phoneme innerhalb des Zielwortes (Fox-Boyer 2016a). Sie sind der prosodischen bzw. segmental-phonologischen Entwicklung zuzurechnen (Kauschke 2012).

Bei den physiologischen Prozessen lassen sich hierunter die Prozesse Tilgung unbetonter Silben (TUS), Tilgung finaler Konsonanten (TFK) oder silbenfinaler Konsonanten (TsfK) und Reduktion initialer (RCCi) oder finaler (RCCf) Konsonantenverbindungen fassen (Tab. 2). Die drei Prozesse werden im Folgenden in der zeitlichen Abfolge ihrer „Überwindung“ dargestellt.

Der Prozess der Tilgung finaler Konsonanten (TFK) oder silbenfinaler Konsonanten (TsfK) liegt dann vor, wenn ein konsonantischer Auslaut eines Wortes bzw. am Ende (Coda) einer Silbe mitten im Wort ausgelassen wird.

Dieser Prozess tritt nur sehr früh, also bei kleinen Kindern unter 2;5 Jahren auf. Es kommt dann häufig zu einer (silben)finalen Tilgung von / l / , wenn davor ein Schwa-Laut Ziellaut ist (Tab. 2).

Die Tilgung anderer finaler Konsonanten tritt generell nur vereinzelt auf (einbis fünfmalig auf 100 Wörter). Als pathologischer Prozess ist dieser zu werten, wenn er vom Kind sehr häufig (mehr als fünf Mal) oder bei fast allen (silben) finalen Konsonanten gezeigt wird (Kap. 2.3.3).

Dieser Prozess kann nicht als Beschreibung herangezogen werden, wenn von einer wort- bzw. silbenfinalen Konsonantenverbindung der letzte Laut getilgt wird. Dann spricht man von dem Prozess einer Reduktion der Konsonantenverbindung (RCC).

Die Tilgung unbetonter Silben (TUS) kann nur innerhalb eines mindestens zweisilbigen Wortes auftreten, in dem eine oder mehrere unbetonte Silben vor betonten Silben stehen. Das Kind lässt dann eine oder beide unbetonten Silben aus und vereinfacht somit die Wortstruktur (Tab. 2).

Nach Fox-Boyer (2016a) tritt dieses Phänomen nur bis zum Alter von 2;11 Jahren auf. Wenn dieser Prozess ungewöhnlich häufig zu beobachten ist (mehr als fünf Mal), gilt er als pathologischer Prozess (Kap. 2.3.3). Allein die Tilgung der Vorsilbe / gǝ / kann noch vereinzelt bei vierjährigen Kindern auftreten.

Der Prozess der Reduktion von Konsonantenverbindungen (RCC) beschreibt die Vereinfachung von Konsonantenverbindungen durch die Auslassung von einem (bei CC) oder ein bis zwei Konsonanten (bei CCC), ohne jedoch die gesamte Konsonantenverbindung zu tilgen. Es kann zwischen wort- bzw. silbeninitialer (RCCi) oder wort- bzw. silbenfinaler (RCCf) Reduktion von Konsonantenverbindungen unterschieden werden.

Kinder realisieren schon im Alter von 2;0 Jahren initiale Konsonantenverbindungen (Kap. 2.3.3). Daher ist es als ungewöhnlich anzusehen, wenn über Dreijährige sehr viele oder alle initialen Konsonantenverbindungen reduzieren. Generell kann jedoch die Reduktion von initialen Konsonantenverbindungen bis zum Alter von 3;11 Jahren auftreten. In Bezug auf finale Konsonantenverbindungen kann schon ab dem Alter von 2;5 Jahren eine Reduktion als ungewöhnlich angesehen werden. Detaillierte Informationen zur Reduktionsart gibt Fox-Boyer (2016a).

Systemische Prozesse: Bei systemischen Prozessen bleibt die Struktur des Wortes erhalten. Hierbei werden Phoneme durch andere Phoneme ersetzt (Substitution) oder angeglichen (Assimilation).

Der Prozess der Plosivierung charakterisiert sich durch die Ersetzung eines Frikativs durch einen Plosiv. Die Artikulationsstelle und Stimmhaftig- bzw. -losigkeit wird meistens beibehalten, nur der Überwindungsmodus ändert sich.

Es kommen nur vereinzelte Plosivierungen von Frikativen bis zum frühen Alter von 2;5 Jahren vor. Als pathologisch zu werten ist daher eine Plosivierung aller Frikative und / oder Affrikaten bzw. eine konstante Plosivierung eines oder mehrerer Frikative (Fox-Boyer 2016a).

Unter dem physiologisch auftretenden Prozess der glottalen Ersetzung versteht man die Ersetzung des Phonems / ʁ / durch den glottalen Laut / h /.

Diese physiologische Ersetzung tritt nur bis zum Alter von 2;5 Jahren auf. Glottale Ersetzungen durch [h] oder den glottalen Stop [ʔ], die bei allen anderen Phonemen auftreten, sind immer als pathologisch zu werten.

Das Deutsche ist eine Sprache mit hartem Stimmeinsatz, wobei silbeninitiale Vokale immer durch einen glottalen Stopp [ˀa] vorgeschaltet begleitet werden. Daher wird die Ersetzung eines wortinitialen Konsonanten durch / ʔ / als Auslassung eines initialen Konsonanten gewertet und nicht als glottale Ersetzung, wie dies für andere Sprachen üblich ist.

Bei dem Prozess der Deaffrizierung handelt es sich um die Auslassung des plosiven Teils einer Affrikate, wenn dieser regional sonst realisiert wird. Es bleibt der frikative Anteil der Affrikate übrig, z. B. wird / ts / zu [s]. Zu beachten ist, dass in weiten Teilen Deutschlands die Affrikate / pf / im Anlaut nicht vorkommt und durch [f] ersetzt wird.

Die Deaffrizierung von / ts / und / pf / sollte schon früh (mit 2;5 Jahren) überwunden sein. Wenn eine Affrikate auf den plosiven Teil reduziert wird, fällt dies unter den Prozess der Plosivierung.

Der Prozess der Vorverlagerung bezeichnet die rein auf die Artikulationsstelle bezogene vordere (z. B. alveolare) Realisation eines Phonems, das sonst an einer hinten liegenden Artikulationsstelle (z. B. velar) realisiert werden würde. Dabei bleibt in der Regel das Merkmal Stimmhaftigkeit vs. Stimmlosigkeit erhalten.

Die Überwindung des Prozesses der Vorverlagerung ist in Bezug auf verschiedene Phoneme sehr unterschiedlich. Daher müssen die beiden physiologischen Prozesse „Vorverlagerung von / ç / und / ʃ / “ und „Vorverlagerung von Velaren“ voneinander abgegrenzt werden.

■ Vorverlagerung von Velaren: Die Vorverlagerung des velaren Nasals / ŋ / zu [n] konnte in wortmedialer und -finaler Position nur bis zum Alter von 2;5 Jahren dokumentiert werden. Die Vorverlagerung velarer Plosive wird jedoch bis zum Alter von 3;5 Jahren beobachtet.

■ Vorverlagerung von / ç / und / ʃ/ : Der Sibilant / ç / wird bei einer sehr kleinen Anzahl von Kindern noch bis zum Alter von 3;11 Jahren vorverlagert. Bei 10 % der Kinder kann das Phonem / ʃ / noch konstant bis zum Alter von 4;11 Jahren vorverlagert werden.

Bei dem Prozess der Assimilation werden zwei Laute oder Silben im Wort einander angeglichen. Ein Phonem wirkt sich auf einen anderen Laut aus, so dass dieser z. B. an die Artikulationsstelle des ersten angepasst wird.

Nach Fox-Boyer (2016a) ist die häufigste Form dieses Prozesses die regressive Assimilation, wobei es zu einer Angleichung eines Phonems im vorderen Teil des Zielwortes an einen weiter hinten stehenden Laut kommt. Umgekehrt würde man von einer progressiven Assimilation sprechen, während man eine Anpassung silbenübergreifend Fernassimilation nennt. Eine Kontaktassimilation ist durch eine Anpassung zweier direkt nebeneinanderstehender Phoneme charakterisiert (Tab. 2).

Assimilationen treten nach Fox-Boyer (2016a) bis zum Alter von 2;5 Jahren sehr häufig auf, nehmen aber dann bis Ende des dritten Lebensjahres stark ab (Auftretenshäufigkeit ein bis fünf Mal auf 100 Wörter). Als pathologisch sind sie zu werten, wenn sie ab dann sehr häufig auftreten (mehr als fünf Mal).

Der Prozess der Rückverlagerung stellt das Gegenteil der Vorverlagerung dar. Das Kind ersetzt ein Phonem einer vorderen Artikulationsstelle durch ein Phonem einer hinteren Artikulationsstelle. Dabei bleibt in der Regel das Merkmal Stimmhaftigkeit- vs. -losigkeit erhalten.

Als physiologischer Prozess ist hierbei die Rückverlagerung der Sibilanten / z s ʃ / auf den Laut / ç / bis zum Alter von 2;11 Jahren zu betrachten. Rückverlagerte Phoneme / t / , / d / und / n / sind als pathologisch zu werten.

Ein ursprünglich stimmhaftes / stimmloses Phonem wird durch sein stimmloses / stimmhaftes Gegenstück ersetzt. Der Prozess der Sonorierung beschreibt die Ersetzung eines stimmlosen Lauts durch seinen stimmhaften Konterpart, der in der Regel in Artikulationsstelle und -modus gleichbleibt. Die Entstimmung als physiologischer Prozess wird durch das Gegenteil definiert. Ein stimmhaftes Phonem wird vom Kind durch seinen stimmlosen Gegenspieler realisiert.

Nach Fox-Boyer (2016) treten sowohl Sonorierungen wie auch Entstimmungen bei Kindern auf, sind aber in Diagnostik und Therapie zu vernachlässigen. Dies ist auf der Tatsache begründet, dass deutschlandweit regional eine große Heterogenität darin vorherrscht, ob verschiedene Phoneme stimmhaft oder stimmlos realisiert werden.

Ein artikulatorischer Prozess bezeichnet eine rein phonetische Veränderung eines Zielphonems. Es kommt dabei nie zum Verlust eines phonemischen Kontrastes. Der artikulatorische Prozess der Interdentalität (oder Addentalität) ist eine meist konstante Ersetzung von / s / und / z / durch die, nicht im Deutschen Phoninventar vorkommenden Substitutionsphone [θ] und [ð]. Diese beeinträchtigen die phonemische Diskrimination nicht.

Der Prozess der Interdentalität tritt noch spät in der phonetisch-phonologischen Entwicklung von Kindern auf: bei 35 % der Kinder im Alter von 5;6 bis 5;11 Jahren und sogar noch im Alter von acht bis zehn Jahren bei 25 % der untersuchten Kinder (Fox-Boyer 2016a).

phonologische EntwicklungEine neue Analyse von Daten, die zwischen 1999 und 2015 in ganz Deutschland erhoben wurden (N = 701, Fox-Boyer 2016a), konnte fundierte Normdaten zum Auftreten und Überwindungsalter von phonologischen Prozessen darlegen. Um in der neuen Analyse eine Regelhaftigkeit widerzuspiegeln, musste ein Prozess, bevor er als Prozess gewertet wurde, bei einem Kind mindestens dreimal anstatt zweimal beobachtet werden können. Fox-Boyer (2016) konnte hieran zeigen, dass sowohl die Anzahl als auch die Auftretenshäufigkeit der phonologischen Prozesse mit voranschreitendem Alter sinken.

Bereits im Alter von 3;0 bis 3;5 Jahren ließ sich bei monolingual deutschsprachigen Kindern im Durchschnitt pro Kind nur noch eine geringe Anzahl an Prozesstypen (M = 2,1) beobachten (Fox-Boyer / Schäfer 2015). Darunter zeigte sich bei 46 % der Kinder der Prozess der Vorverlagerung von / ʃ / zu [s] und bei 35 % der Kinder vereinzelte Reduktionen von Konsonantenverbindungen (CC). Nur bei 10 bis 20 % der Kinder ließen sich noch Vorverlagerungen von / k g / zu [t d] und von / ç / zu [s] ausmachen (Fox-Boyer et al. 2014a).

In der Altersgruppe von 3;6 bis 3;11 Jahren zeigte sich noch bei 34 % der Kinder die Vorverlagerung von / ʃ / . Bei 10 bis 20 % der untersuchten Kinder ließen sich noch die Prozesse der Vorverlagerung von / ç / , der Reduktion von Konsonantenverbindungen sowie vereinzelte Kontaktassimilationen feststellen (Fox-Boyer et al. 2014a).

In der letzten Altersgruppe von 4;0 bis 5;11 Jahre wurde bei wenigen Kindern (20 %)im Alter von vier Jahren nur noch die Vorverlagerung von / ʃ / beobachtet. Bei 90 % der Fünfjährigen konnten keinerlei phonologische Prozesse mehr dokumentiert werden (Fox-Boyer et al. 2014a).

1.6 Phonetisch-phonologische Entwicklung bei deutsch-bilingualen Kindern

Pilotstudien Zur phonetisch-phonologischen Entwicklung bei mehrsprachigen Kindern liegen in Bezug auf Deutsch als L2 nur sehr wenige Studien vor (Fox-Boyer / Salgert 2014). Gerade „großflächige Normdatenerhebungen, die den Phonemerwerb und gerade auch die physiologischen phonologischen Prozesse einer bilingualen Bevölkerungsgruppe darstellen, gibt es bislang nicht“ (Fox-Boyer / Salgert 2014, 111). Bisher wurden eher Pilotstudien in Form von sprachtherapeutischen Abschlussarbeiten initiiert, die nur eine kleine Stichprobe berücksichtigten und weitgehend nicht veröffentlicht sind. Erste Pilotierungen als Querschnittstudien zum deutsch-türkischen Phonologieerwerb wurden aus der Arbeitsgruppe von Fox-Boyer vorgelegt (Fox-Boyer / Salgert 2014). Die Autoren berichten von einem teilweise verzögerten Phonologieerwerb der türkisch-deutsch bilingualen Kinder im Vergleich zu monolingualen Kindern im selben Alter. Die untersuchten bilingualen Kinder zeigten Frikative und Affrikate häufig etwas verspätet. Des Weiteren wurden bidirektionale Transferphänomene der Sprachen und eine hohe Anzahl von Vokalfehlern festgestellt.

Büttner (2012) konnte bei deutsch-russischen unauffällig entwickelten Kindern (3;0 bis 4;8 Jahre) sowohl für das Deutsche typische wie auch untypische phonologische Prozesse (z. B. Tilgung des wortfinalen Schwa-Lauts und Vokalfehler) herausstellen.

Lleó und Kollegen lieferten zum deutsch-spanischen Bereich des Ausspracheerwerbs erste Daten von fünf typisch entwickelten bilingualen Kindern im Alter von 1;0 bis 3;0 Jahren. Die Kinder zeigten stimmhafte Frikative sowie unbetonte Silben in Jamben später als ihre monolingual spanischen Peers (Fox-Boyer / Salgert 2014).

Diese ersten Studienergebnisse geben einen kleinen Einblick in den Phonologieerwerb bei deutsch-bilingualen Kindern, die jedoch noch nicht zu verallgemeinern sind. Hier besteht zukünftig noch ein großer Forschungsbedarf in den Wissenschaftsbereichen der Linguistik, Psycholinguistik und akademischen Sprachtherapie im deutschsprachigen Bereich. Aussagekräftige Daten wären insbesondere für die Interpretation phonologischer Leistungen von bilingualen Kindern mit Verdacht auf Aussprachestörungen von enormer Relevanz (Fox-Boyer / Salgert 2014).

Fox-Boyer, A., Salgert, K. (2014): Erwerb und Störungen der Aussprache bei mehrsprachigen Kindern. In: Chilla, S., Haberzettl, S. (Hrsg.): Handbuch Spracherwerb und Sprachentwicklungsstörungen (Mehrsprachigkeit). Elsevier, München, 109-121

Zusammenfassung

Kinder erwerben die Aussprache ihrer Muttersprache in der Regel ohne große Anstrengung in ihren ersten Lebensjahren. Der Phonologieerwerb vollzieht sich in verschiedenen Phasen, die vom Lallen bis hin zu korrekten Wortrealisationen reichen. Kinder zeigen bereits vor der Geburt wichtige phonetisch-phonologische Perzeptionsleistungen, die sich kontinuierlich weiterentwickeln und die spätere phonologische expressive Entwicklung entscheidend beeinflussen. Durch den ständigen Kontakt zur Muttersprache werden deren phonetische Merkmale und Kontraste zunehmend besser erkannt, selektiert und gespeichert. Im ersten Lebensjahr entdeckt das Kind seine Fähigkeit zur Realisation von Sprachlauten und es beginnt seine Vokalisationen stetig der phonetischen Struktur der Zielsprache anzunähern. Die Phase der sprachlichen Entwicklung beginnt mit dem Stadium der ersten Wortproduktionen im Alter von neun bis 15 Monaten. Kinder zeigen physiologische phonologische Prozesse, die ihrer regulären phonologischen Entwicklung entsprechen. Zu der phonetisch-phonologischen Entwicklung und deren Störungen bei mehrsprachigen Kindern liegen in Bezug auf Deutsch als L2 nur sehr wenige Pilotstudien vor.

2 Störungen der Aussprache

Ca. 10 bis 15 % der Kinder zeigen eine Abweichung vom regelrechten Ausspracheerwerb im Hinblick auf zeitliche oder inhaltliche Aspekte. Zeitlich bedeutet, dass sie physiologische Vereinfachungsprozesse noch zu einem untypisch späteren Zeitpunkt zeigen. Unter inhaltlichen Aspekten versteht man Veränderungen der kindlichen Aussprache, die so im regelrechten Ausspracheerwerb nicht auftreten. Das Ziel des vorliegenden Kapitels ist es, auf der Basis des zuvor beschriebenen regelrechten Ausspracheerwerbs, Ursachen, Klassifikationsmodelle und Arten von kindlichen Aussprachestörungen zu skizieren. Des Weiteren werden diagnostische und therapeutische Möglichkeiten vorgestellt und in ihrem Einsatz begründet.

2.1 Begriffsklärung

Unter einer Aussprachestörung versteht man mögliche Schwierigkeiten im Bereich Perzeption, Artikulation / Motorische Produktion und / oder phonologischer Repräsentation der Sprech-Segmente (Konsonanten und Vokale), der Phonotaktik (Silben und Wortformen) und der Prosodie (lexikalische und grammatikalische Töne, Rhythmus, Betonung und Intonation), die sich negativ auf die Verständlichkeit und Akzeptanz der Kinder auswirken können (International Expert Panel on Multilingual Children‘s Speech 2012).

Aussprachestörungen können als alleiniges Symptom einer sprachlichen Problematik, aber auch als Teilsymptom einer generellen Sprachentwicklungsstörung auftreten. Oftmals werden Kinder insbesondere wegen ihrer Ausspracheprobleme an Logopäden bzw. Sprachtherapeuten überwiesen, da Lautbildungsschwierigkeiten in der pädiatrischen Früherkennungsuntersuchung am einfachsten zu diagnostizieren sind.

organische und funktionelle Aussprachestörungen Grundsätzlich muss zwischen organischen und funktionellen Aussprachestörungen unterschieden werden. Bei organisch bedingten Aussprachestörungen lässt sich eine Ursache anamnestisch feststellen. Hierunter fallen Aussprachestörungen, die zum Beispiel durch angeborene Hörstörungen, durch Zerebralparesen (kindliche Dysarthrie), durch LKGS-Fehlbildungen oder durch kognitive Einschränkungen z. B. im Rahmen genetischer Syndrome verursacht sein können (für einen Überblick über Risikofaktoren für Aussprachestörungen s. Fox-Boyer 2016a).

Funktionelle Aussprachestörungen, d. h. Aussprachestörungen, bei denen die gesicherte Feststellung einer Ursache nicht möglich ist, treten weitaus häufiger auf. Eine Aussprachestörung mit bisher ungeklärten Status ist die verbale Entwicklungsdyspraxie. Laut Definition müsste bei einer Dyspraxie eine neurologische Grunderkrankung vorliegen. Es ist allerdings nur in sehr seltenen Fällen möglich, diese tatsächlich nachzuweisen (Schulte-Mäter 2009), so dass die verbale Entwicklungsdyspraxie unter den funktionellen Aussprachestörungen abgehandelt wird. Das folgende Kapitel bezieht sich ausschließlich auf funktionelle Aussprachestörungen.

Wandel in der Terminologie Auch Kinder mit funktionellen Aussprachestörungen stellen keine homogene Gruppe dar, wie dies ursprünglich von Van Riper (1939) angenommen wurde. Sie unterscheiden sich in ihrer Symptomatik, dem Schwergrad, ihrer Ätiologie und der Reaktion auf Therapieansätze. In seinen ersten Veröffentlichungen in den Jahren 1939 bis 1963 ging Van Riper davon aus, dass Aussprachestörungen durch mangelnde Reifung der Artikulationsbewegungen eine motorisch bedingte Problematik darstellten. Erst Ende der 1960er Jahre begannen theoretische Phonologen, sich mit der kindlichen Ausspracheentwicklung zu befassen, und mit Beginn der klinischen Phonologie in den 1980er Jahren (Grunwell 1987) wurden Aussprachestörungen auch aus linguistischer, insbesondere aus psycholinguistischer Sicht betrachtet (Ingram 1989). Seit diesem Zeitpunkt wird davon ausgegangen, dass es sich bei Aussprachestörungen um vielfältige Störungsarten innerhalb des Sprachverarbeitungsprozesses handelt.

speech sound disorder Der Wandel über die Sicht der Ursachen und Störungsebenen im Sprachverarbeitungsprozess von Aussprachestörungen reflektiert sich auch in der Terminologie: Wurden zunächst Aussprachestörungen mit dem Begriff „Artikulationsstörung“ der „Dyslalie“ belegt, setzte sich nun der Begriff der „phonetisch-phonologischen Störungen“ durch. All diese Begriffe wurden und werden in der Literatur vielfältig definiert, so dass bis heute nicht von einer einheitlichen Terminologie ausgegangen werden kann. Im Jahr 2017 kann festgestellt werden, dass sich der Begriff „speech sound disorder“ als Oberbegriff in der internationalen Literatur durchgesetzt hat.

speech sound disorder Im Deutschen wird der Begriff „speech sound disorder“ mit dem Begriff „Aussprachestörung“ als Oberbegriff für die verschiedenen Arten der Ausspracheproblematiken übersetzt. Da ein Oberbegriff Unterkategorien erfordert, ist es notwendig, sich mit Ausdifferenzierungen und damit mit veröffentlichten Klassifikationssystemen für Aussprachestörungen zu befassen. In der Literatur finden sich linguistisch-deskriptive, ätiologische, quantitative und psycholinguistische Klassifikationsansätze (Waring / Knight 2013). Daneben stehen Autoren, die davon ausgehen, dass die Klassifikation von kindlichen Aussprachestörungen nicht sinnvoll sind (Stackhouse / Wells 1997).

linguistisch-deskriptive Beschreibungen Die älteste Form der Klassifikation stellen linguistisch-deskriptive Beschreibungen dar. Sie beschreiben die Symptomatik einer Aussprachstörung entweder mithilfe einer Benennung der betroffenen Laute (veraltet: z. B. Sigmatismus, Kappazismus, Rhotazismus) oder von phonologischen Prozessen (z. B. Vorverlagerung der Velare, Plosivierung der Frikative). Ihr Ziel ist es nicht, Aussprachestörungen zu klassifizieren. Sie bieten daher weder Aussagen über mögliche Störungsebenen oder Ursachen, noch lassen sich daraus therapeutische Schritte ableiten.

Ein weiterer Ansatz der Darstellung von Aussprachestörungen sind ätiologische Klassifikationssysteme, wie z. B. von Shriberg (1994; 1997) vorgeschlagen. Dieser Ansatz entstammt der medizin-orientierten Sichtweise logopädischer Störungsbilder. Untersuchungen konnten allerdings zeigen, dass es mit ihrer Hilfe nicht möglich ist, alle betroffenen Kinder eindeutig den verschiedenen vorgeschlagenen Untergruppen zuzuteilen (Fox et al. 2002). Während einige Kinder keine ätiologischen Auffälligkeiten zeigen, zeigen sich bei anderen Kindern gleich mehrere Faktoren parallel. Ein weiterer Nachteil ist, dass sich auch hier keine therapeutischen Schritte ableiten lassen.

Quantitative Einteilungen (Van Riper 1963; Shriberg / Kiatkowski 1982) bestimmen den Schweregrad einer Aussprachestörung mithilfe der Berechnung der Anzahl betroffener Phoneme (z. B. PCC = Prozentwert korrekter Konsonanten). Untersuchungen zeigten, dass nicht alle Kinder mit einer Aussprachestörung sich in der Anzahl ihrer betroffenen Phoneme oder Konsonanten von Kindern, die sich im Regelerwerb gleichen Alters befinden, unterscheiden (Clausen / Fox-Boyer, in Vorbereitung) und auch hieraus lassen sich keine therapeutischen Schritte ableiten.

Klassifikationsansatz von Dodd In der internationalen Literatur (Überblick siehe Waring / Knight 2013) findet sich neben dem ätiologischen Klassifikationsansatz von Shriberg (1994) der psycholinguistische Klassifikationsansatz von Dodd (1995; 2005). Letzterer ist ein Ansatz, der für viele Sprachen unterschiedlicher Sprachfamilien als anwendbar beschrieben worden ist, z. B. für das Englische (Dodd 1995; 2005), Deutsche (Fox / Dodd 2001), Türkische (Topbas / Yavas 2006), Cantonesische (So 2006), Spanische (Goldstein 1996), Putonghua (Hua / Dodd 2000) und das Dänische (Clausen / Fox-Boyer, in Vorbereitung).

Waring / Knight (2013) kritisierten allerdings, dass sich der Ansatz zwar für viele Forschungsfragen eindeutig bewährt habe, der Nachweis darüber aber fehle, inwieweit eine Implementierung dieses Ansatzes in den klinischen Alltag möglich ist. Clausen und Fox-Boyer (in Vorbereitung) konnten jedoch zeigen, dass eine Implementierung in einem Land (Dänemark), in dem dieser Ansatz bislang nicht bekannt war, mit wenigen Publikationen und kurzen Schulungen implementierbar war. Diese Erfahrung konnte auch für Deutschland seit Beginn des 21. Jahrhunderts gemacht werden, auch wenn dies nicht wissenschaftlich evaluiert wurde. Bis zum Jahr 2000 wurden Aussprachestörungen in Deutschland nicht in Untergruppen eingeteilt, sondern alle Formen von Aussprachestörungen wurden in der Regel mit dem Begriff „Dyslalie“ belegt. Therapeutisch wurde fast ausschließlich die klassische Artikulationstherapie (Van Riper 1939) als einziges therapeutisches Vorgehen gelehrt und angewendet. Mithilfe zahlreicher Publikationen und Fortbildungen wurde der psycholinguistische Klassifikationsansatz von Dodd (1995; 2005) durch Fox in Deutschland implementiert, so dass es sich nun um den in Deutschland am häufigsten verwendeten Klassifikationsansatz handelt. Aus diesem Grund werden im Rahmen dieses Kapitels der Terminologie von Dodd (1995; 2005) folgend diese Unterbegriffe verwendet:

■ Artikulations- bzw. Phonetische Störung,

■ Phonologische Verzögerung,

■ Konsequente Phonologische Störung,

■ Inkonsequente Phonologische Störung.

2.2 Prävalenz

Studien zur Prävalenz von funktionellen Aussprachestörungen konnten zeigen, dass diese die häufigste Form einer Sprachentwicklungsproblematik bei Kindern darstellen, so dass Kinder mit Aussprachestörungen einen sehr großen Anteil der Klienten von Sprachtherapeuten in verschiedenen Ländern ausmachen (McLeod / Baker 2014, Mullen / Schooling 2010). Vorläufige Prävalenzangaben für Aussprachestörungen im Deutschen gehen von ca. 16 % betroffenen Kindern im Alter von drei Jahren bis zur Einschulung aus (Fox-Boyer 2014b). Diese Zahlen bestätigen Ergebnisse aus dem angloamerikanischen Bereich (Fox-Boyer 2014c).

2.3 Definitionen und Symptomatologie

Im Folgenden werden die verschiedenen Störungsarten, ihre Symptomatik, die angenommenen Störungsebenen im Sprachverarbeitungsprozess und die am häufigsten vermuteten Ursachen beschrieben. Um die angenommenen Störungsebenen innerhalb des Sprachverarbeitungsprozess und die später daraus resultierenden Therapieableitungen besser einordnen zu können, soll zunächst das Sprachverarbeitungsmodell von Stackhouse / Wells (1997) eingeführt werden (Abb. 4).

Abb. 4: Sprachverarbeitungsmodell nach Stackhouse / Wells (1997)

Sprachverarbeitungsmodell von Stackhouse / Wells (1997) Dieses Sprachverarbeitungsmodell stellt international das einzige Modell dar, das das Ziel verfolgt, den Erwerbsprozess der kindlichen Aussprache und deren Grundlagen für den späteren Lese-Rechtschreib-Erwerbsprozess darzustellen.

Repräsentation Die drei dickumrandeten Kästchen phonologische Repräsentation, semantische Repräsentation und motorisches Programm stellen Ebenen innerhalb des Langzeitgedächtnisses dar.

Als phonologische Repräsentation versteht man die Abspeicherung der korrekten Wortform, während die semantische Repräsentation die korrekte Abspeicherung der Wortbedeutung darstellt. Das motorische Programm enthält sogenannte „gestische Targets“ für die Artikulation. Hier sind Informationen über die Stellung und Bewegung der Artikulationsorgane gespeichert. Bei den gestischen Targets handelt es sich also um gespeicherte, automatisierte Bewegungsabfolgen.

Inputverarbeitung Auf der linken Seite des Modells finden sich die rezeptiven Sprachverarbeitungsanteile. Auf der Ebene der peripheren auditiven Verarbeitung findet eine Feststellung dahingehend statt, ob eine akustische Schallübertragung (z. B. das Hören eines Wortes) stattgefunden hat. Auf der Ebene der Diskrimination Sprache / Nicht-Sprache wird entschieden, ob der akustische Reiz ein Sprachsignal oder ein anderes akustisches Signal (z. B. ein Geräusch) beinhaltet. Bei Sprachsignalen findet – je nach Alter unterschiedlich detailliert – ein phonologisches Erkennen statt, d. h., die phonologischen Bestandteile des Inputs werden analysiert.

Outputverarbeitung Auf der rechten Seite des Modells finden sich die expressiven Anteile der Sprachverarbeitung. Die Ebene der motorischen Planung bestimmt z. B. den Sprechfluss, die Sprechgeschwindigkeit oder die Lautstärke, während auf der Ebene der motorischen Ausführung eine tatsächliche Umsetzung des Geplanten stattfindet.