Klangsynthese durch Frequenzmodulation

Inhalt

1. Historisches

Die Frequenzmodudulation als Möglichkeit zur Synthese von Klängen wurde erstmals von John M. Chowning im Jahre 1973 im Journal of the AES (Volume 21, Nr. 7) vorgestellt. Die Frequenzmodulation an sich war jedoch bereits vorher im Bereich der Nachrichten- und Radioübertragung gebräuchlich. Erster Lizenznehmer von Chownings Verfahren war die Firma Yamaha, die dann 1983 den überaus erfolgreichen FM-Synthesizer DX 7 auf den Markt brachte. Die typischen Klänge des DX 7 werden meist als glockenählich beschrieben und wirkten prägend auf den Sound der populären Musik der 80'er Jahre.

2. Konzept

Bei der Frequenzmodulation wird eine Trägerschwingung c (Carrier) von einer Modulatorschwingung m (Modulator) in ihrer Frequenz moduliert. Dabei liegen die Frequenzen von beiden Schwingungen im Audiobereich. Die Tiefe der Modulation (also der Frequenzhub) wird durch die Amplitude d (Peak Deviation) des Modulators bestimmt. Der Quotient aus Frequenzhub und Modulatorfrequenz ergibt den Modulationsindex I - eine zentrale Größe bei der Frequenzmodulation.

I = d/m

Im Gegensatz zu den langsamen Tonhöhenmodulationen von LFO's, die als Vibrato wahrgenommen werden, treten hier aufgrund der Modulation Klangfarbenänderungen auf - also Änderungen in der spektralen Zusammensetzung des Signals. Im einfachsten Fall sind sowohl der Carrier c als auch der Modulator m reine Sinusschwingungen. In diesem Fall wird das Ausgangssignal der Frequenzmodulation im Zeitbereich durch folgende Formel beschrieben:

e = A * sin (ωct + I * sin (ωmt ))

e: momentaner Wert des Ausgangssignals
A: Faktor für die Amplitude des Gesamtsignals
I: Modulationsindex
ωc = 2π * fc: Kreisfrequenz des Carriers
ωm = 2π * fm: Kreisfrequenz des Modulators

3. Seitenfrequenzen

Für das menschliche Ohr ist natürlich nicht die Zeitfunktion interessant, sondern das Spektrum. Im Spektrum eines frequenzmodulierten Sinuscarriers treten außer der Carrierfrequenz selbst oberhalb und unterhalb des Carriers sogenannte Seitenfrequenzen auf - und zwar im Abstand der Modulatorfrequenz und allen ganzzahligen Vielfachen davon. Die Seitenfrequenzen entstehen also bei:

c ± n*m (n ganzzahlig)

Nehmen wir beispielsweise an, unser Carrier c hat eine Frequenz von 1000 Hz und der Modulator m hat eine Frequenz von 200 Hz. Wenn die Amplitude des Modulators gleich Null ist - also keine Modulation vorhanden ist - besteht das Spektrum nur aus einer Linie bei 1000 Hz. Wird die Amplitude des Modulators größer, dann erhalten wir folgende zusätzlichen spektralen Anteile: 1200 Hz und 800 Hz als erstes oberes und unteres Seitenband, 1400 Hz und 600 Hz als zweites oberes und unteres Seitenband, usw.. Wie man sieht, besteht in diesem Fall das Spektrum nur aus ganzzahligen Vielfachen der Modulatorfrequenz m = 200 Hz; es handelt sich also um ein harmonisches Spektrum mit einer Grundfrequenz von 200 Hz. Man beachte, dass die Grundfrequenz nicht die Carrierfrequenz ist!

4. Amplituden der Seitenfrequenzen

Die Amplituden der Seitenfrequenzen sind abhängig vom Modulationsindex I. Diese Abhängigkeit wird durch die Besselschen Funktionen beschrieben - diese sind Lösungen der Besselschen Differentialgleichung:

x2y'' + xy' + (x2 - p2)y = 0

Die Lösungen haben folgende Form:

Die folgende Grafik zeigt den Verlauf der ersten sechs Besselfunktionen (J0 bis J5):

Diese Besselfunktionen bekommen also als Argument den Modulationsindex I und liefern als Ergebnis die Amplitude der jeweiligen Seitenfrequenz. Die Amplitude des Carriers wird bestimmt durch die Funktion J0, die Amplituden des ersten oberen und unteren Seitenbandes durch J1, die des zweiten durch J2 usw.. Nun sieht man anhand dieser Grafiken, dass die Seitenfrequenzen mit steigendem Modulationsindex nicht einfach kontinuierlich lauter werden. Vielmehr hat jede im Spektrum auftretende Frequenz eine durch die jeweilige Besselfunktion definierte Amplitude die bei steigendem Modulationsindex auch schon mal fallen kann. So ist zum Beispiel die Amplitude des ersten Seitenbandes bei einem Modulationsindex I=2 sehr groß, bei I=3,8 verschwindet sie jedoch fast ganz. Man beachte außerdem, dass bei I=2,405 auch die Carrierfrequenz ganz aus dem Spektrum verschwindet, denn hier ist die erste Nullstelle von J0. An den Stellen, wo die Besselfunktionen negative Funktionswerte liefern, ist auch die Amplitude des jeweiligen Seitenbandes "negativ" - also phasengedreht. Die folgende Tabelle zeigt die ersten 9 Nullstellen der ersten 6 Besselfunktionen:

Nullstelle n=0 n=1 n=2 n=3 n=4 n=5
1 2,405 3,832 5,135 6,379 7,588 8,771
2 5,520 7,016 8,417 9,760 11,064 12,339
3 8,654 10,173 11,620 13,015 14,373 15,700
4 11,792 13,323 14,796 16,224 17,616 18,980
5 14,931 16,470 17,960 19,410 20,827 22,218
6 18,071 19,616 21,117 22,583 24,018 25,430
7 21,212 22,760 24,270 25,749 27,200 28,627
8 24,353 25,903 27,421 28,909 30,371 31,812
9 27,494 29,047 30,569 32,065 33,537 34,989

Die folgende Grafik zeigt die Spektren für verschiedene Modulationsindizes - auf der Y-Achse ist allerdings nur der Betrag der Amplitude aufgetragen, die Phaseninformation fehlt also.

Spektren bei verschiedenen Modulationsindizes Ein Klick in die entsprechende Zone der Grafik spielt einen Beispielklang vor mit c = 1000 Hz und m = 200 Hz.

Obwohl die einzelnen Seitenfrequenzen bei steigendem Modulationsindex nicht zwangsläufig in ihrer Amplitude ansteigen, so ist doch zu sehen, dass die Gesamtbandbreite des Signals umso größer wird, je höher der Modulationsindex ist. Chowning gibt als Faustregel für die Gesamtbandbreite folgende Formel an:

BW = 2*(d+m)

Theoretisch ist natürlich die Gesamtbandbreite auch schon bei kleinen Modulationsindizes unendlich groß, jedoch sind die Amplituden der Seitenbänder höherer Ordnung dann vernachlässigbar gering. In dieser Faustformel berücksichtigt Chowning nur diejenigen Seitenfrequenzen, deren Amplituden für die menschliche Wahrnehmung relevant sind. Die folgende Grafik zeigt eine Pseudo-3D-Darstellung der Abhängigkeit der Amplituden vom Modulationsindex für die ersten 15 Seitenfrequenzen. Diese Darstellung ermöglicht eine schnelle Einschätzung der resultierenden Bandbreite bei gegebenem Modulationsindex.

Pseudo 3-D Darstellung der ersten 15 Besselfunktionen

Mit Hilfe der Besselfunktionen läßt sich die Zeitfunktion:

e = A * sin ( ω ct + I * sin (ωmt ))

jetzt auch als Summe von Sinustermen schreiben, aus der man das Spektrum direkt ablesen kann:

e = A * { J0(I) * [ sin ω ct ]
+ J1(I) * [ sin (ω c+ ωm)t - sin (ω cm) ]
+ J2(I) * [ sin (ω c+2ωm)t + sin (ω c-2ωm) ]
+ J3(I) * [ sin (ω c+3ωm)t - sin (ω c-3ωm) ]
+ J4(I) * [ sin (ω c+4ωm)t + sin (ω c-4ωm) ]
+ J5(I) * [ sin (ω c+5ωm)t - sin (ω c-5ωm) ]
+ ...................................................
+ ...................................................
+ Jn(I) * [ sin (ω c+nωm)t ± sin (ω c-nωm) ] }

5. Reflektierte Seitenfrequenzen

Die Seitenbänder entstehen - wie gesagt bei c ± n*m (n ganzzahlig). In der bisherigen Betrachtung wurde völlig unterschlagen, was passiert, wenn c - n*m negativ wird - die unteren Seitenbänder also in den negativen Frequenzbereich fallen. In diesem Fall wird die jeweilige Seitenfrequenz an der Y-Achse gespiegelt und mischt sich phasengedreht mit den normalen Seitenfrequenzen. Um nochmal auf unser Beispiel zurückzukommen: sei c = 1000 Hz und m = 200 Hz. Dann entsteht für n=6 eine Seitenfrequenz von -200 Hz. Diese wird in der Phase gedreht und an der Y-Achse gespiegelt - also ist die Frequenz jetzt 200 Hz. Da im Spektrum die 200 Hz sowieso schon enthalten sind (für n = 4 entsteht 1000 Hz - 4*200 Hz = 200 Hz) ist dies kein grundsätzlich neuer spektraler Anteil, aber die Amplitude der 200 Hz ergibt sich jetzt als Überlagerung dieser beiden Seitenbänder.

Dies ist aber nicht immer so: sei beispielsweise c = 1000 Hz und m = 220 Hz. Dann entstehen folgende Seitenfrequenzen: 780/1220 Hz, 560/1440 Hz, 340/1660 Hz, 120/1880 Hz, -100/2100 Hz, -320/2320 Hz, -540/2540 Hz, usw. Im Spektrum treten also folgende Frequenzen auf: 100 120 320 340 540 560 780 1220 1440 1660 1880 2100 2320 und 2540 Hz. Man sieht natürlich sofort, dass zwischen diesen Frequenzen kein einfacher harmonischer Zusammenhang besteht. Harmonische Spektren entstehen immer dann, wenn c und m in einem einfachen mathematischen Verhältnis stehen (z.B. 5/1, 2/3, 4/3, etc.). Wie in diesem Zusammenhang der Begriff "einfach" zu definieren ist, ist nicht leicht zu beantworten. So könnte man auch das obige Spektrum durchaus als harmonisch ansehen - schließlich sind alle auftretenden Frequenzen ganzzahlige Vielfache von 20 Hz. Die Grenze zwischen einfach und kompliziert ist wohl dort zu suchen, wo das menschliche Ohr nicht mehr in der Lage ist, die harmonischen Zusammenhänge zwischen den einzelnen Teiltönen zu erkennen.

Man kann auch nicht sagen, dass harmonische Spektren nur dann entstehen, wenn die reflektierten mit den normalen Seitenfrequenzen zusammenfallen. Nehmen zur Verdeutlichung folgendes Beispiel: c = 400 Hz und m = 300 Hz (also c/m = 4/3) Es entstehen als untere Seitenfrequenzen: 100, -200, -500, -800, -1100 Hz usw.; als obere Seitenfrequenzen: 700, 1000, 1300 Hz usw., das resultierende Spektrum enthält also 100 200 400 500 700 800 1000 1100 1300 Hz. Die reflektierten Seitenfrequenzen fallen also zwischen die normalen. Dennoch sollte unser Ohr wohl in der Lage sein, zu merken, dass es sich bei allen im Spektrum auftretenden Frequenzen um ganzzahlige Vielfache von 100 Hz handelt und das Spektrum als harmonisch bewerten.

Die Möglichkeit, mit Hilfe der Frequenzmodulation Spektren zu erzeugen, die unser Ohr als nicht harmonisch wahrnimmt, war das grundsätzlich Neue an den FM-Klängen. Vorher war dies nur mit sehr großem Aufwand (additive Synthese) möglich. Vor allem aus diesem Grund waren die Klänge, die man z.B. mit dem DX 7 erzeugen konnte so völlig anders als alles, was man bisher von kommerziellen (Analog-) Synthesizern her kannte. Aufgrund der Tatsache, dass Glocken ähnlich komplexe und nichtharmonische Spektren haben, werden viele durch Frequenzmodulation erzeugten Klänge als "glockenähnlich" beschrieben.

6. Nützliche Regeln

Wie gesagt, entstehen harmonische Spektren immer dann, wenn Carrier und Modulator in einem einfachen ganzzahligen Verhältnis stehen, es also folgender Zusammenhang gilt:

c/m = N1/N2

wobei N1 und N2 ganzzahlig und hinreichend klein sind. Nach Kürzen des Bruches N1/N2 ergeben sich folgende Zusammenhänge:

- die Grundfrequenz f0 des Klanges ergibt sich aus: f0 = c/N1 = m/N2

- der Carrier ist immer die N1te Harmonische

- wenn N2 = 1, enthält das Spektrum alle Harmonischen und f0 = m

- wenn N2 gerade, treten im Spektrum nur ungerade Harmonische auf

- wenn N2 = 3, fehlt jede 3. Harmonische

7. Zusammenfassung

Zusammenfassend ist also zu sagen, dass das Frequenzverhältnis c/m von Carrier und Modulator die Positionen der Seitenfrequenzen bestimmt (und damit darüber, ob ein Klang ein harmonisches Spektrum aufweist) und der Modulationsindex I bestimmt, welche der Seitenfrequenzen signifikante Amplituden haben.

Es sei nocheinmal darauf hingewiesen, dass in der obigen Betrachtung von dem einfachen Fall ausgegangen wurde, dass sowohl Carrier als auch Modulator reine Sinusschwingungen sind. Wenn der Carrier selbst bereits ein obertonreiches Spektrum hat (wie z.B. eine Sägezahnschwingung), dann entstehen die Seitenfrequenzen natürlich nicht nur "links" und "rechts" von einer Carrierfrequenz, sondern auch "links" und "rechts" von jedem einzelnen Oberton des Carriers. Wenn die Modulatorschwingung ein obertonreiches Spektrum hat, entstehen Seitenfrequenzen nicht nur im Abstand von n*m, sondern zusätzlich im Abstand von k*n*m, wobei k die Nummer des Obertons im Modulatorspektrum ist. Da jedoch n selbst schon alle möglichen ganzzahligen Werte annimmt, entstehen so keine grundsätzlich neuen spektralen Anteile - die Amplituden der Seitenfrequenzen verhalten sich aber durch mehrfache Überlagerungen noch komplexer.

Es sollte klar geworden sein, dass, wenn man den Modulationsindex zeitlich varriert (z.B. mit einer Hüllkurve), sich eine sehr komplexe zeitliche Entwicklung der spektralen Zusammensetzung des Signals ergibt, die nicht sehr viel mit einer einfachen Filterhüllkurve gemeinsam hat und weitaus interessanter klingen kann. Man kann also mit Hilfe der FM-Synthese mit wenigen Parametern eine überaus komplexe zeitliche Entwicklung des Spektrums erreichen - dies ist die Stärke von FM!

8. FM zum Ausprobieren

Wer den Einfluss der beiden Parameter (Verhältnis c/m, Modulationsindex I) selbst ausprobieren möchte, kann sich das Reaktor-Ensemble FM Didaktor herunterladen. Die Presets stimmen mit den Beispielen auf dieser Website überein. Reaktor ist ein modularer, nativer Software-Synthesizer für Mac und PC mit dem sich jeder Sounddesign-Interessierte seine eigenen Synthesizer zusammenbauen kann. Man braucht nur einen halbwegs schnellen Rechner mit einer (möglichst ASIO-kompatiblen) Soundkarte. Eine Demo-Version kann man sich auf der Seite von Native Instruments herunterladen.

Achtung: Die bei "FM Didaktor" im Oszilloskop angezeigte Wellenform ist mit Vorsicht zu genießen - sie ist nämlich abhängig von der Phasenlage von Carrier und Modulator. Wenn man bei eingeschaltetem Synthesizer die c/m Ratio ändert und dann wieder auf ihren Ursprungswert zurückstellt stimmt die Phase wahrscheinlich nicht mehr - daher wird die Wellenform möglicherweise anders aussehen. Das Amplitudenspektrum stimmt aber in jedem Fall. Wenn man den Synthesizer kurz aus- und wieder einschaltet, werden die beiden Oszillatoren neu getriggert. Damit stimmt auch die Phasenlage und somit auch die Wellenform wieder.

Diese Website entstand im Rahmen der Lehrveranstaltung "Elektronische Klanganalyse und -synthese" an der Technischen Universität Berlin (Fach: Kommunikationswissenschaftliche Grundlagen von Sprache und Musik) im Sommersemester 2001 unter der Leitung von Folkmar Hein. Die Seite wurde erstellt von Robin Schmidt.

Quellen:

John M. Chowning - The Synthesis of Complex Audio Spectra by Means of Frequency Modulation
(erschienen im Journal of the AES, Volume 21 Nr.7 im Septemeber 1973).
davon existiert auch eine deutsche Übersetzung von John Strawn im Studioarchiv

Der gleiche Beitrag wurde auch veröffentlicht

im Computer Music Journal Vol 1 Nr. 2
und in:
"Foundations of Computer Music", edited by Curtis Roads & John Strawn; MIT-Press 1985