Het spraaksignaal

Hoofdstuk 6 van de cursus Klank en Letter

Marc van Oostendorp

Samenvatting van dit hoofdstuk:

In dit hoofdstuk wordt ingegaan op de akoestische analyse van taal: hoe valt uit de trillingen van luchtdeeltjes af te leiden welke klank er gezegd is. Uitgelegd wordt hoe elk geluid kan worden geanalyseerd als een optelling van golfpatronen, wat de algehele verschillen zijn tussen de verschillende klassen van klanken, en hoe de structuur van een spectrum ons nadere informatie kan verschaffen over de aard van de uitgesproken klinker.

6.0. Inleiding

Als we praten brengen we lucht tot stroming en tot trilling op een manier die is uiteengezet in hoofdstuk 3. Die luchtstroom verplaatst zich vervolgens door de buitenlucht tot hij het oor van een luisteraar bereikt. Die voelt de luchtdeeltjes tegen zijn trommelvlies botsen op een manier waaruit hij kennelijk kan concluderen wat er precies gezegd is. Hoe doet die luisteraar dat? Wat zijn de eigenschappen van de luchttrillingen die het mogelijk maken de klanken van het Nederlands van elkaar te onderscheiden? Dat is het onderwerp van dit hoofdstuk.

Eerst iets over de manier waarop geluid zich in het algemeen door de lucht verplaatst. De lucht bestaat uit deeltjes die — als het tenminste niet 273 graden vriest — voortdurend in beweging zijn en daarbij doorlopend tegen elkaar botsen. In een ruimte die helemaal van de buitenwereld is afgesloten (zodat hij geluidsdicht is en de rust er ook anderszins niet verstoord wordt) is de gemiddelde afstand tussen twee naast elkaar liggende deeltjes constant. De deeltjes zijn (gemiddeld genomen) regelmatig over de ruimte verdeeld.

Geluid is een verstoring van deze regelmatige verdeling, in de vorm van verdichtingen en verdunningen van de luchtdruk. In sommige delen van de ruimte zitten de deeltjes relatief dicht op elkaar, in andere delen zitten ze relatief ver van elkaar af. Het lijkt net alsof de verdichtingen en verdunningen zich door de ruimte verplaatsen. Op een bepaalde plaats zijn de deeltjes afwisselend ver van elkaar af en dicht bij elkaar. Zodra er ergens relatief weinig deeltjes zijn, hebben de deeltjes van de naastliggende dichterbevolkte gebiedjes de neiging zich naar het 'vacuüm' toe te bewegen. Hierdoor ontstaat dan een relatieve verdichting. (In hoofdstuk 3 hebben we gezien hoe de stembanden een regelmatige luchtstroom op een dergelijke manier in beweging kan brengen.)

6.1. De regelmatige golfvorm

Geluid valt daarom te begrijpen in termen van golven: op een bepaalde plaats zijn afwisselend veel en weinig deeltjes te vinden. De luchtdeeltjes zelf maken ook een golfbeweging: ze bewegen heen en weer tussen twee posities. Als er een zuivere toon in een ruimte klinkt (in een dusdanig ideale omstandigheid dat hij zelfs in het laboratorium niet te bereiken valt) legt een individueel deeltje in die ruimte een pad af dat we op de volgende manier kunnen tekenen:

bron: A.C.M. Rietveld en V.J. van Heuven. Algemene fonetiek. Coutinho, Bussum, 1997.

De tijd is uitgezet van links naar rechts. Het deeltje begint op punt -1, gaat naar 0, naar +1, terug naar 0, naar -1, enzovoort. Je hoeft niet heel veel wiskunde gehad te hebben om te weten hoe een dergelijke figuur genoemd wordt: een sinus.

In de bovenstaande figuur zie je de term amplitude bij de verticale as staan. Dit is de een maat voor de lengte van het pad dat het deeltje aflegt. Hoe groter de bewegingen die het deeltje maakt, des te groter de amplitude. Voor het menselijk oor staat de amplitude gelijk aan luidheid: hoe hoger de amplitude van de bewegende luchtdeeltjes, des te luider klinkt de toon.

Bij de horizontale as zouden we zo de term periode kunnen schrijven. Dit is de tijd die verloopt tot het deeltje weer op een van de extreme posities terug is — bijvoorbeeld de tijd die het deeltje erover doet om van positie -1 weer terug te keren op positie -1.

De frequentie is het omgekeerde van de periode: de hoeveelheid keren dat een deeltje zijn pad aflegt per seconde. Als we de periode T noemen en de frequentie f, krijgen we dus een formule:

Frequenties geven we weer in Herz (Hz). Als een deeltje er bijvoorbeeld 0,01 seconde over doet om naar zijn uitgangspositie terug te keren, heeft het een frequentie van 1/0,01=100 Hz. De frequentie is dus een maat voor de snelheid waarmee het deeltje heen en weer beweegt: hoe sneller het deeltje heen en weer schiet, des te hoger is de frequentie. Voor het oor staat frequentie gelijk aan toonhoogte: hoe hoger de frequentie, des te hoger klinkt de toon.

6.2 Sinussen optellen

Een regelmatige golfvorm zoals die hierboven gegeven is, komt in werkelijkheid niet voor. Een mens kan zo'n golfvorm zeker niet maken, en in menselijke talen worden deze klanken dan ook niet gebruikt. De paden die de luchtdeeltjes afleggen als iemand Nederlands staat te praten zijn vele malen grilliger dan de hierboven beschreven pure sinus. Het aardige is nu echter dat alle geluiden, en dus ook alle spraakklanken, beschreven kunnen worden als de optelling van sinussen. Het makkelijkst is dat te begrijpen bij periodieke geluiden. De complexe golfvorm (dat wil zeggen de ingewikkelde manier waarop een deeltje zich beweegt) in de eerste grafiek kan worden uiteengerafeld in een drietal regelmatige sinussen, die u eronder ziet. Als we die sinussen bij elkaar 'optellen' krijgen we de complexe sinus de bovenste figuur.

bron: S.G. Nooteboom en A. Cohen Spreken en verstaan. Een nieuwe inleiding tot de experimentele fonetiek. Van Gorcum, Assen, 1984.

De hier weergegeven figuur is periodiek, omdat hij nog steeds een periode heeft: als de klank lang genoeg wordt aangehouden, komt hetzelfde (grillige) pad weer terug. De reden hiervoor is dat alle drie de betrokken sinusen veelvouden van dezelfde periode hebben: b is precies 2x zo snel als a, en c weer precies 2x zo snel als b. Een belangrijk begrip is hier dat van de boventoon: omdat b en c een frequentie hebben die gehele veelvouden zijn van de frequentie van a, noemen we ze boventonen. A zelf noemen we de grondtoon. Overigens hebben de boventonen in de regel een veel lagere amplitude dan de grondtoon; in die zin is het bovenstaande plaatje niet helemaal reëel.

De klanken die de menselijke stembanden voortbrengen zijn periodieke samengestelde geluiden. Klinkerklanken hebben daarom een dergelijke structuur. Fricatieven daarentegen worden gekarakteriseerd door turbulentie die niet periodiek is. Er zit geen regelmaat in de golfvorm van een fricatief. Hoe lang we een fricatief ook aanhouden, het blijft onvoorspelbaar hoe het amplitudeverloop er in het vervolg zal uitzien. De grafiek voor een s ziet er bijvoorbeeld als volgt uit:

bron: A.C.M. Rietveld en V.J. van Heuven. Algemene fonetiek. Coutinho, Bussum, 1997.

Ook dit soort patronen kunnen we in theorie ontbinden in een aantal sinussen, maar het aantal sinussen dat daarvoor nodig zou zijn is op de keper beschouwd oneindig.

6.3 De karakteristieken van de klassen van klanken

Elke klank die een spreker maakt brengt weer een net iets ander patroon van bewegende luchtdeeltjes teweeg. De luisteraar heeft de taak om uit het patroon waarop de tegen zijn trommelvlies aan botsende luchtdeeltjes zich bewegen af te leiden welke klank er precies bedoeld wordt, zoals dicteercomputers tegenwoordig trouwens de taak hebben om uit de manier waarop luchtdeeltjes tegen een microfoon bewegen af te leiden wat de gebruiker probeert te zeggen.

Het is nuttig om eerst een onderverdeling te maken in de grofste categorieën van klanken. In de volgende paragraaf zullen we dan nog kort beschouwen hoe er verschil gemaakt kan worden binnen één klasse — die van de klinkers.

6.4 De karakteristieken van klinkerklassen

Met een paar eenvoudige criteria (periodiek/niet-periodiek, hoogte van de amplitude, aan- of afwezigheid van stilte) kunnen we de klanken al onderverdelen in een aantal grove klassen. Maar daarmee hebben we bijvoorbeeld nog niet alle klinkers van het Nederlands uit elkaar gehaald.

Om dat nu te doen moeten we nog iets verder gaan in onze analyse van het spraaksignaal. Klinkers bestaan uit periodieke geluidstrillingen, die kunnen worden geanalyseerd als een optelling van sinussen die zich tot elkaar verhouden als een grondtoon en een verzameling boventonen. De boventonen hebben een frequentie die een veelvoud is van die van de grondtoon. Bovendien is de amplitude van de boventonen kleiner dan die van de grondtoon: hoe hoger de frequentie van de boventoon des te lager de amplitude.

Om een complexe golf te kunnen bestuderen, hebben we dus twee gegevens nodig: de frequentie en de amplitude van de grondtoon en de amplitudes van de boventonen. We kunnen deze gegevens uittekenen in een spectrum, dat er voor een heldere toon als volgt uit zou kunnen zien:

bron: A.C.M. Rietveld en V.J. van Heuven. Algemene fonetiek. Coutinho, Bussum, 1997.

Dit is het spectrum van een golf die bestaat uit een grondtoon van 100 Hz met een amplitude van 120 (decibel) en boventonen van (in ieder geval) 200, 300 e 400 Hz, met afnemende amplitudes.

Dit is het spectrum van een zuivere toon; dat wil zeggen, min of meer van een toon zoals deze door de stembanden wordt voortgebracht. Een klinker is echter geen zuivere toon; bij de articulatie van een klinker worden de tong en de lippen in een bepaalde positie gebracht. Dit heeft een sterk vervormend effect op het spectrum. Sommige boventonen worden erdoor versterkt, terwijl andere er juist door worden afgezwakt. Het spectrum van een reële klinker ziet er dan ook niet uit als een mooie aflopende grafiek. Het spectrum voor de Nederlandse [a], bijvoorbeeld, ziet er ongeveer als volgt uit:

bron: A.C.M. Rietveld en V.J. van Heuven. Algemene fonetiek. Coutinho, Bussum, 1997.

Zoals u hier kunt zien, worden de eerste drie toppen (versterkte boventonen, formanten) in de op deze manier ontstane grafiek genummerd als F1, F2, F3. U ziet dat er ook nog een vrij duidelijke top is op ongeveer 3,75 kHz en een in de buurt van de 5 kHz, maar deze worden meestal buiten beschouwing gelaten.

Ook de hoogte van de grondtoon (in deze nummering F0 genoemd) is van minder belang voor de determinatie van klinkers; hij geeft de algehele hoogte van de klinker weer en is daarom wel belangrijk om bijvoorbeeld intonatie te bepalen. De frequentiewaarde van F1 en F2 (en in veel mindere mate die van F3) kunnen we echter gebruiken om de verschillende klinkers van elkaar te onderscheiden. Deze waarden (gemiddeld over vijftig Nederlandse mannen) worden in de onderstaande tabel gegeven:

bron: S.G. Nooteboom en A. Cohen Spreken en verstaan. Een nieuwe inleiding tot de experimentele fonetiek. Van Gorcum, Assen, 1984.

Een klinkers zoals [a] heeft kennelijk een relatief hoge waarde voor F1, terwijl een [i] een relatief lage waarde heeft voor deze formant. Anderzijds is de waarde voor F2 van [i] juist veel hoger dan de waarde van [a]. Als we nu F1 tegen F2 afzetten in een grafiek krijgen we de volgende tabel:

bron: A.C.M. Rietveld en V.J. van Heuven. Algemene fonetiek. Coutinho, Bussum, 1997.

Het aardige is dat dit plaatje een aardige weergave geeft van de plaats in de mond waar de verschillende klinkers gearticuleerd worden: de [i] helemaal voor in de mond, de [u] helemaal achterin; [i], [y] en [u] bovenin de mond, [a] onderin; enzovoort. Kennelijk geldt: hoe hoger F1, des te opener (lager) de klinker, en hoe hoger de F2, des te meer naar voren de klinker. De plaats waar een klinker is gearticuleerd kan dus worden afgeleid uit de precieze manier waarop hij de luchtdeeltjes in beweging heeft gebracht.

6.11. Opgaven bij dit hoofdstuk

1. Leg uit waarom een lage klinker gemiddeld iets luider klinkt dan een hoge.

2. In het Nederlands lijkt langzamerhand het verschil tussen [f] en [v] en tussen [s] en [z] te verdwijnen. Geef hier voorbeelden van en probeer een akoestische verklaring te bedenken.

3. Wat is een spectrum?

4. a. Hoe zou het spectrum van een fricatief er ongeveer uitzien?
b. En dat van een plosief?

5. Beschrijf de sonoriteitsprincipes over de structuur van de lettergreep in termen van akoestiek.