Mi is a zene? - I. rész
Legutóbbi módosítás: 2011.04.08.
A zeneileg meghatározható hang jelensége
Zenei rendszerünk hangjainak teljes összehasonlítása
A címben rejlő talány engem már kezdettel fogva rendkívül érdekelt. Személyesen, azaz magánoktatás során soha nem kaptam választ a kérdésre egyetlen oktatótól vagy zenetanártól sem, bár egy-két zeneelméleti könyv több-kevesebb sikerrel kísérletet tesz az átfogó magyarázatra. Ebben a fejezetben a magam eszközeivel, azaz (sokszor matematikai) analitikával, logikus gondolkodással és nem utolsósorban bizonyos szintű olvasottsággal igyekszem a rejtélyt megfejteni. (Olvasottság alatt azt értem, hogy nagyjából tudom mit és hol kell keresni és ez nem biztos, hogy mindig az Internet.)
Ám a rejtély megoldásának fellengzős kijelentése előtt le kell szögeznem, amely Gitáriskolámban már több helyen megállapítást nyert: a zene csoda kategóriája, amely végeredményben nem modellezhető. Ezzel kapcsolatban érdemes elolvasni egy évekkel ezelőtt keletkezett írásomat, amelyben tisztességgel mellébeszélek ☺, azaz fennkölt irodalmi stílusban írom körül, hogy mennyire nem tudjuk tisztázni a zene fogalmát. Lássuk először ezt az írást!
"El nem tudja képzelni a Tisztelt Olvasó, hogy hány tanítványom feltette már ezt a kérdést! Mert ők előbb-utóbb mindent tudni akarnak és ez így is van rendjén. Amelyik nem válik érdeklődővé, az kis idővel abba fogja hagyni.
Nos, azzal kezdeném, hogy már a ógörögök is…
A tréfát félretéve, valóban!
Az ógörögök, több filozófiai iskolával egyetemben például a püthagoreusok a Kozmoszban a számok és arányaik, valamint geometriai idomok tökéletes rendjét tisztelték. Ez egyfajta ezoterikus, de könnyen megérthető számmisztikát eredményezett. Ebbe a tökéletesnek gondolt konszonanciába csusszant be néha egy-egy apró disszonancia, számtani szépséghiba, például a √2 felfedezése (egységnyi hosszúságú négyzet átlója)...

...amivel Pithagorasz követői nemigen tudtak mit kezdeni. Ez azonban lényegében nem zavarta őket abban, hogy elméleteiket ne vetítsék ki arra, amely dolog éppen a kezük ügyébe akadt, például sok mással együtt a zenére. Valószínűleg ekkortájt alakult ki a „szférák zenéje” kifejezés is, amely egyértelmű szándék volt a matematika és a zene összekapcsolására. Ez hihetetlen ráérzésről tanúskodik, hiszen a zene matematikai alapja éppen az, hogy a hangok frekvenciái aránypárokban állnak egymással. Ez a konszonancia – disszonancia jelensége. A tiszta oktáv hangköz frekvenciaaránya például 2:1, a tiszta kvart 4:3, a tiszta kvint 3:2. Ahol nincs konszonancia, azaz a hangok bizonyos arányú összecsengése, ott nincs zene. Elég csak rátenyerelnünk a zongora billentyűire, hogy felfedezzük a kaotikus disszonancia fület gyilkoló jellegtelenségét. De tulajdonképpen itt meg is áll a tudomány, mert bár lehetséges, hogy a zene alapegységeinek létezik matematikai alapja, de Beethoven Holdfény-szonátája mégsem írható le matematikailag. Innentől kezdve a zene egy csodálatos rejtély. Rejtély, mert létezik és jelentős hatással van ránk, de mégsem modellezhető. Ezért tekintenek a laikusok a zenészekre mágusokként. Ezt a rejtélyt egy másik, fizikai példával szoktam körülírni: a fizikában járatosak ismerhetik a Heisenberg-féle határozatlansági relációt, voltaképp az egész kvantummechanika alapját, amely azt állítja, hogy az anyagot alkotó részecskék bizonyos tekintetben lényegében kaotikusan, megjósolhatatlanul viselkednek. Ez elméletileg azt eredményezné, hogy az anyag egyszerűen szétfolyna körülöttünk, azaz nem volnának rá alkalmazhatóak a megszokott fizikai törvények. Ennek azonban a tapasztalat ellentmond, hiszen a fizikai világ többé-kevésbé –kisebb vagy szélsőséges anomáliákat nem számítva-, még a newtoni világkép szerint is működik. A világ tehát noha szó szerint a káoszból épül fel, mégis rendezett, nagyjából kiszámítható alakot ölt. Ugyanez igaz a zenére is: nem tudjuk mi ez, de minket nem zavar, mert jó nagyon."
Ennél azért a Pénzes-féle Gitáriskolának többet kell nyújtania...☺
A jelen fejezetben tehát a természetből vett akusztikai jelenségből levezetjük a mai, európai gyökerű temperált hangrendszert. Az utóbbi fogalom honlapomon már rendkívül részletesen kidolgozásra került, most az előzményeket tárgyaljuk meg szintúgy analitikai részletességgel.
A magam részéről a zene "keletkezésének" öt, egymástól jól elkülöníthető állomását különböztetem meg:
-
A zeneileg meghatározható hang jelensége
-
A konszonancia jelensége
-
Skálaalkotás a természetből vett akusztikai jelenségek alapján
-
A tonalitás
-
A zene nagy belső, ritmikai szimmetriája
Két dolgot szeretnék hangsúlyozni:
-
Az érthetőség végett magyarázataimat -ha lehetséges és szükséges-, egyszerűsítem. Sok dolgot kihagyok, hogy ne bonyolítsam túl az érvelést, máshol viszont azt matematikával támasztom alá, hogy a zenei tapasztalatok logikus alapot kapjanak. Meglehet, ettől kissé nehéz lesz a téma feldolgozása, viszont zenei benyomásokkal ellentétben számokkal nemigen lehet vitatkozni.
-
Az alábbi levezetések kizárólag az európai gyökerű zenére vonatkoznak. Az ettől eltérő zenei rendszereket (indiai, kínai, stb.) csak korlátozottan ismerem, épp ezért a következtetéseket rájuk nem merem alkalmazni.
A zeneileg meghatározható hang jelensége
A rész tárgyalása során először én mindig stílusosan az asztalra csapok: vajon mitől különbözik ez a puffanó zörej a zenei hangtól, illetve zene ez egyáltalán?
A tanítványok egyik fele azt mondja, hogy ez az, mert az ütősöknél gyakran előfordul, míg a többiek szerint egyértelműen nem zene.
Először nézzünk meg egy tökéletesen steril, azaz számítógép-generálta zenei hangot:

Igen, az ilyen steril zenei hang egy szinuszgörbe, ebben a (steril) formában a természetben nem is fordul elő. Kissé leegyszerűsítve a zenei hangnak a fenti ábra alapján két, egymástól jól elválasztható tulajdonsága van:
-
amplitúdó (a szinuszgörbe függőleges kiterjedése, leegyszerűsítve a hang hangerejét határozza meg),
-
hangmagasság (a szinuszgörbe vízszintes kiterjedése).
A következő ábrán a jel már nem steril, mondhatjuk, hogy kissé zajos, de a fenti fontos paraméterek mégis megállapíthatók belőle. Ez egy A-dúr skála néhány hangja gitáromról bejátszva:

Majd vessünk egy rövid pillantást az ominózus asztalra csapás jelentős mértékben felnagyított görbéjére:

Az ábrán jól láthatjuk, hogy bár a csapásnak van hangereje (a görbe függőleges kiterjedése), de nincs, vagy legalábbis érdemlegesen nem állapítható meg konkrét hangmagassága (a görbe vízszintes kiterjedése). Klasszikus (akusztikai) értelemben ez a puffanó zörej tehát nem zenei hang, mert nincs jól behatárolható hangmagassága. Megállapíthatjuk a zenei hang egyik legfontosabb tulajdonságát: a zenei hangnak mindig van egy állandó és mérhető hangmagassága. Mértékegysége a hertz (Hz), amely azt jelenti, hogy a hang egy másodperc alatt mennyit "rezeg", azaz a fenti szinuszgörbe egy másodperc során mennyi "hegyet és völgyet" fut be (ezt nevezzük periódusnak):

Tudományosan fogalmazva: a zenei hang mindig periodikus, a zörej sohasem. A 440 Hz akusztikailag azt jelenti, hogy a hang egy másodperc alatt 440 teljes periódust fut be.
Gondolkodjunk el azon, hogy vajon tudnánk-e a fenti szinuszgörbét valamilyen elmés fizikai kísérlettel reprodukálni?
Igen, ehhez vennünk kell egy közönséges hangvillát, arra rá merőlegesen egy ceruzát kell erősítenünk, majd mikor megütjük a hangvillát, egyenletesen egy papírdarabot kell elhúznunk a ceruza alatt. Mivel a hangvilla (mindkét) ága rezeg, a ceruza egy tökéletes szinuszgörbét fog kirajzolni. Másik lehetőségünk pedig régi gramofonlemezek nagyítóval való tanulmányozása, mert a barázdákat felnagyítva ott is szinuszos görbéket fogunk észrevenni.
A minket körülvevő, folyamatos zörejtömegből tehát a fenti meghatározás alapján képesek vagyunk kiemelni azon (konkrét hangmagasságú) hangokat, amelyek zenei alapként egyáltalán szóba jöhetnek. Ebből a szempontból természetesen jóval többféle hangból válogathatunk, semmint gondolnánk, ilyenek például:
-
ipari készülékek hangjai,
-
az emberi beszéd (nem az éneklés),
-
a természet hangjai,
-
stb.
Valóban, a fenti dolgok sokszor képesek zeneileg egyértelműen felhasználható (azaz konkrét hangmagasságú és tiszta) hangok generálására, belőlük mégsem lesz az emberre ható, eksztatikus zene. Miért nem? Mert hiányzik belőlük a konszonancia...
A konszonancia két (és persze több) hang valamilyen arányú összecsengését jelenti. Legfontosabb jellemzője, hogy az emberi fül számára mindig kellemesen hat. Ez az igazi alapja a zenének, mert konszonancia nélkül nincs zene.
Innentől kezdve tehát minimum két hanggal, illetve a közöttük lévő akusztikai viszonyokkal kell foglalkoznunk. Már csak az a kérdés, hogy ez a két hang milyen távolságra lesz egymástól, zeneelméletileg így jönnek létre a hangközök, amelyek tehát két hang egymástól való távolságát jelentik. Funkcionálisan nézve ugyanolyanok, mint például a távolság mérésénél a méter.
De a magyarázat előtt azt kell tisztáznunk, hogy a hangközök, mint egyfajta hangösszecsengések egyáltalán miképpen alakulhatnak ki. Ez az akusztikában két helyen érhető tetten:
-
az egyik két hang egyidejű megszólalásakor,
-
a másik akusztikai szituáció pedig a felharmonikusok keletkezése, amely jelenséget később tisztázzuk.
A probléma megértéséhez először rá kell pillantanunk egy szinuszgörbére, mint a zenei hang legplasztikusabb megjelenítésére...

...ám ebből a görbéből most már nekünk 2 darab kell. Mivel belátható időn belül nem találtam köreimben szinuszgörbe-rajzoló programot (ha egyáltalán létezik ilyen), ezért kénytelen vagyok az alábbi absztrakciót bevezetni: képzeljük el a szinuszgörbét sematikus háromszög-ábrában...


Innentől kezdve tehát a szinuszgörbéket háromszögek helyettesítik. Ezzel egyébként nem is trafáltunk igazán mellé, hiszen a hang hullámformáját manipulálva különböző hangzások jönnek létre. Nagyjából ilyen például a teljesen torzított gitárhang hullámformája...

...de a fűrészfog-hullámforma sem ad tiszta zenei hangzást:

Ha erre az elvonatkoztatásra képesek vagyunk, akkor meg fogjuk érteni két hang egyidejű megszólalásakor fellépő akusztikai jelenségeket...
Nos, tételezzük fel, hogy van két tökéletesen azonos hangmagasságú hangunk, ám az egyik, a zöld színű feleakkora hangerejű a másiknál (a hangerő voltaképpen nem lényeges, csupán könnyebb lesz észrevenni rajtuk a változásokat):

A közöttük lévő frekvenciaarány ekkor 1:1. Ha ez a két hang egyszerre szólal meg, akkor a közöttük lévő konszonancia, együtthangzás tökéletes lesz. Az más kérdés, hogy a nagyobb hangerejű akusztikailag el fogja nyomni a kisebbet (ezt nevezzük pszichoakusztikus redundanciának, többek között ez az mp3 kódolás egyik fontos alapgondolata), de lényegében ennél tökéletesebb konszonancia 2 hang között nincs. Zeneelméletileg nézve ez a 2 hang egy prím hangközt alkot. Joggal vetődik fel a kérdés, hogy mi értelme a prím hangköznek, hiszen ez ugyanolyan, mintha azt mondanánk, hogy a 2 pont között lévő távolság 0 méter? Ez igaz, de szólhat 2 azonos hangmagasságú hang különböző hangforrásból (amely például egy szimfonikus zenekarban tipikus jelenség), a prím hangköznek tehát ez ad létjogosultságot. Az alábbi kottán például egy zongora és egy gitár játszik egy C prím hangközt, azaz voltaképpen ugyanazt a hangot:

A következő legkonszonánsabb hangköz az oktáv, ekkor a hangok közötti frekvenciaarány 2:1 lesz:

Ha például a piros hangunk 100 Hz, akkor a zöld garantáltan 200 Hz. Joggal vetődik fel a kérdés, hogy ezt a hangközt miért oktávnak nevezik, amely köztudottan a latin octava, nyolcadik szóból származik? Már az ógörögök is ismerték a hétfokú, (modernebb szóval diatonikus) skálabeosztást, amelyek a mi zenei rendszerünk legfontosabb alapját képezik. A skála 8. hangja, az oktáv után a zeneelméletileg igen fontos belső skálaszerkezetek már ismétlődnek, tehát elég ezen belső skálaszerkezeteket csakis az oktávig, azaz 8. fokig felvázolnunk.
A skálaépítési elvek teljes megértéséhez javaslatom, hogy az összes "Alapskálák" című fejezetet alaposan tanulmányozzuk át.
A következő legkonszonánsabb hangköz a kvint, ekkor a hangok közötti frekvenciaarány 3:2 lesz:

Ebben az esetben ha piros hangunk 100 Hz, akkor a zöld garantáltan 150 Hz.
A fenti három példából felállíthatjuk a konszonancia azon alapvető szabályát, amelyet már Pithagorasz is megtett: minél egyszerűbbek a frekvenciaarányok, annál konszonánsabb a hangköz. Illetve ebből következik még egy fontos szabály: ha nincs a hangok között nincs semmilyen frekvenciaarány, akkor nincs konszonancia. Ezt könnyen tudjuk modellezni a fenti ábrák segítségével...

...ugyanis ha a 2 hang periódusa sohasem találkozik, akkor nincs konszonancia. Ebben az akusztikai viszonyban a 2 hang teljesen "széthangzik", azaz disszonál. Pontosan emiatt nem ad ki a Deák téri csúcsforgalom egy óriási C-dúr akkordot (☺), bár ebben az irdatlan zajtömegben is rengeteg zenei (azaz mérhető hangmagasságú és hangerejű) hang keletkezik...
A klasszikus zeneelmélet azonban a disszonancia kifejezést más értelemben használja, mert szerinte disszonancia a zeneművekben is fellelhető, illetve pontosan eme két fogalom: a konszonancia és disszonancia viszonya határozza meg a zenei építkezést.
Ezzel a szemlélettel nem egészen értek egyet, hiszen a frekvenciaarányok, azaz alaphanghoz viszonyított hangközök segítségével tulajdonképpen európai zenei rendszerünk (nem a temperált!) egyik legfontosabb skálája, a dúr is felépíthető, sőt nemcsak az, hanem mind a 12 hang! Most lássuk ezt az aranyosan arányos építkezést! Az alábbi táblázatból egyértelműen kiderül, hogy zenei rendszerünkben lévő összes hangköz alapjában véve valamilyen frekvenciaarányon alapul:

Abszolút viszonyításként a normál zenei A hangot, azaz 440 Hz-et vettünk és ehhez képest, az aránypárok segítségével számoltuk ki a C-dúr skála, még pontosabban: a C hangról indított kromatikus, tehát 12 hangból álló skálát. Azért kellett így tennünk, mert a klasszikus zeneelmélet a hangközöket a dúr skálából vezeti le; ez a fenti táblázatból jól leolvasható. A táblázat ugyanakkor megmutatja a 440 Hz körüli oktáv hangjainak temperált és tiszta hangértékét, valamint azokat Hz-ben össze is hasonlítja. Észlelhetjük, hogy tiszta hangértékű kiindulások esetén is keletkeznek nem egész értékű frekvenciák.
A tiszta hangközarányokból logikusan következne a megállapítás: a hangközelvek alapján felépített zenei rendszerben nincs disszonancia. Persze ennél a jelenség jóval bonyolultabb, hiszen nehéz volna a kisszekund 25:24 hangközarányát konszonánsnak nevezni és hallani. Ám a konszonancia akusztikailag nézve mégis ott van még ebben az igen problémás hangközben is. Kompromisszumos megoldásként sajnos meg kell állapítanunk, hogy az átlagos emberi fül bizony a bonyolultabb aránypárú hangközöket is disszonánsnak hallja, ezt pedig egyértelműen természetes pszichológiai jelenségnek kell tekintenünk. Illetve maga az (európai gyökerű) zene is a tökéletes vagy ahhoz közeli konszonanciákban keresi a végső zenei megoldásokat...
További gondolatként jegyzem meg, hogy az akusztika tudománya különböző konszonancia-elveket állított fel, amelyekkel arra kereste-keresi a választ, hogy mitől hall az emberi fül két hangot konszonánsnak?
-
A legelsővel már foglalkoztunk, ez Pithagorasz nevéhez fűződik. Az úgynevezett proporció-elmélet szerint minél egyszerűbb egy frekvenciaarány, annál konszonánsabb érzetű a hangköz. Ennek azonban ellentmond a temperált hangrendszer szinte összes hangköze, hiszen azok nem követik a "természetes" frekvenciaarányokat (egyetlen kivétel a tiszta A-oktávok). A temperált kvint hangközaránya például 293:439.
-
A Helmholtz-féle hangzásrokonság-elmélet szerint két hang akkor konszonáns, ha egyezik egy vagy több felharmonikus hangjuk. Erről a jelenségről részletesen írok a következő, A felharmonikus-konszonancia című részben, illetve matematikailag is tanulmányozható Kertész Sándor villamosmérnök által alkotott táblázatban.
-
A Stumpf-féle hangösszeolvadás-elméletben annál konszonánsabb két hang, minél inkább egynek érzékeli (az átlagos zenei képességű) hallgató. Ez az eljárás azonban jelentős mértékben pszichológiafüggő, amely nem szerencsés kiindulópont egy tudományos igényű elmélet felállításakor.
A Hangközök című fejezetben az összes hangköz ábrázolásra kerül az összes lehetséges (temperált) hangnemben.
A zenei hangnak két fontos tulajdonsága fentebb már megállapítást nyert: az egyik a hangerő, a másik a hangmagasság. A következő fontos attribútum a hangszín (és még van egy: a dinamika). A kérdés egyszerű, ám sokan mégsem képesek rá válaszolni: ha két hangszer ugyanazt a zenei hangot adja ki magából, akkor ez azonos hangmagasságot jelent, de miért különböző a két hang hangszíne?
A válasz meglepő: egy természetes zenei hang megszólalásakor nemcsak az alaphang, hanem annak úgynevezett felharmonikusai is megszólalnak. A felharmonikusok az alaphang egész számú többszörösei. Egy természetes zenei hang tehát sohasem szinuszgörbe, hanem egy nagyon bonyolult görbekomplexum. Mivel az alaphang egész számú többszöröseiről van szó, előbb-utóbb nemcsak az alaphang oktávjai, hanem más hangok is meg fognak szólalni, igaz, hangmagasságban felfelé haladva egyre gyengébben.
A hangszín tehát attól alakul ki, hogy a hang milyen arányban tartalmazza a felharmonikusokat. Például a rézfúvósoknak harsány, éles hangjuk van, mert a réz erőteljesen kiemeli a felhangokat, ezzel ellentétben a fafúvósok hangja mindig lágy és tompa, mert a fa nagyobbrészt elnyeli. Így lesz minden egyes zenei hangforrásnak egy csakis önmagára jellemző hangszíne, tónusa, egyfajta zenei ujjlenyomata.
Most nézzük meg ezt táblázat-formátumban!
Az előző részben ismertetett összehasonlító táblázatból...

...pontosabban annak fő referenciahangjából (440 Hz - normál zenei A hang) kiszámoltunk egy alsó regiszterű (alsó hangtartományban lévő) C hangot, amely így 66 Hz lett. Ilyen tiszta C hang a temperált hangrendszerben nincs (ebben a pozícióban a temperált C hang értéke 65,4063 Hz); mi azért vettük ilyen formában, hogy a tiszta hangközarányokat figyelembe véve meg tudjuk állapítani a felharmonikusok és egy tiszta hangolású zenei rendszer frekvenciáinak esetleges egyezését.
Az alábbi táblázat tehát megmutatja a tiszta, 66 Hz-es C hangból keletkező, első 12 darab felharmonikus hang frekvenciáját és a C hanghoz viszonyított hangközarányát. A sötétbarna érték a tökéletes frekvenciaegyezést, a világosbarna csak közelítő egyezést jelent.

Most pedig oktávokban szétbontva:




Ugyanezt az elvet foglalta összes Kertész Sándor villamosmérnök is...

...egy másfajta táblázatban:

Sándor nem konkrét frekvenciákban, hanem az aránypárokból következő szorzószámokkal operált egészen az alaphang 16. felharmonikusáig, így azokkal bármilyen felharmonikus egyezés leellenőrizhető. Valójában a hangköznevek sem tükrözik pontosan az eredeti elgondolást, ennél sokkal fontosabb a skálán belüli pozíció, ezért én utólag a hangköznevek alatt 1-től 12-ig számoztam a skálapozíciót (mivel a rendszeren belül 12 félhangunk van).
Vegyünk erre egy példát!
Legyen a kiindulópont a normál zenei A hang, azaz 440hz, ezt a prím oszlop 1. sorába illesztettük, így ezt kapjuk: 440 Hz. Ha ennek vesszük a kvintjét (E), akkor még mindig az 1. sorban, de már a kvint oszlop szorzószámával kell számolnunk, ez 1,5000, tehát 440 x 1,5 = 660 Hz. Ez tehát az E hang frekvenciája. Most a kvint oszlopban vegyük az E hang 2. felharmonikusát: 660 x 2 = 1320 Hz. Ez az érték megegyezik az 1. oszlopban jelölt 3. felharmonikus értékkel, mert 440 x 3 = 1320. A 440 Hz 3. felharmonikusa tehát megegyezik kvintjének 2. felharmonikusával.
Észrevehetjük, hogy a táblázat alapelve mennyire közel áll a fent ismertetett Helmholtz-féle hangzásrokonság-elmélethez; tulajdonképpen ezen táblázat az elmélet matematikai bizonyítása, ám belőle más következtetéseket is levonhatunk.
A színek minél közelebb vannak az 1. sorhoz, annál konszonánsabb a hangköz. Ez viszont a Pithagorasz-féle proporció-elméletet is bizonyítja...
S most itt az idő, hogy játsszunk egy kicsit!
Ez az elmés játék nem jöhetett volna létre, ha nincs Derzsi Zoltán tanítványom...

...aki sok egyéb elfoglaltsága mellett lelkes rádióamatőr, így fel tudta hívni figyelmemet egy igen sokoldalú (shareware) rádióamatőr programra, amelyben található egy spektrográf opció is. A program neve MixW és ingyenes próbaverziója letölthető a www.mixw.net címről.
A spektrográf képes egy hangtartomány teljes frekvencia-analízisére, ebben a minőségében tehát megmutatja a keletkező zenei hangok felharmonikusait is. (Derzsi Zoli meghatározása szerint: a spektrográf és a spektrumanalizátor között elvi felépítésében nincs különbség, azonban igen fontos megjegyezni, hogy míg az analizátor az amplitúdót mutatja a frekvencia függvényében, addig a spektrográf a spektrumot mutatja az idő függvényében, a spektrum egyes részein az amplitúdót pedig színváltozással jelzi. Ez egy szükségmegoldás, hiszen háromdimenziós megjelenítőink nincsenek, így valahogy meg kellett oldani a problémát. Az általa készített képeket pedig spektrogramnak nevezzük.)
Ismerkedjünk meg ezzel a programopcióval!

A képen egy vizualizált frekvenciatartományt láthatunk 0 Hz-től nagyjából 9500 Hz-ig. Ezt mutatja a felső fekete sáv, amely tehát frekvenciákat mutató sáv. A kép színei annál sötétebbek, minél kisebb hangerejű hangról beszélhetünk, a nagyon erős hangok pirossal rajzolódnak ki, az átlagosak zölddel, míg a kék színnel jelöltek már csak azonosíthatatlan zörejek. A kép közepén egy UFO-szerű zöld fej: ezt röviden én füttyentettem. A kép jobb oldalán láthatjuk, hogy 9000 Hz felett a kép kezd átmenni koromfeketébe: nos, ez egyértelműen a szuperolcsó, 500 forintos HAMA mikrofonom frekvenciaátviteli határa. A spektrum természetesen nem statikus, hanem folyamatosan mozog fentről lefelé, az időtengely tehát a függőleges, míg a frekvenciatengely a vízszintes, a hangerő (amplitúdó) pedig a színek.
Ezzel a módszerrel azt fogjuk megvizsgálni, hogy a különböző, sokszor zeneileg is értelmezhető hangok hangszínei miként rajzolódnak ki 0 Hz-től 9500 Hz frekvenciatartományban. De álljunk csak meg egy pillanatra! Mit is szeretnénk tenni: veszteséges tömörítési eljárással kódolt zenéket (mert az mp3 ilyen) kívánunk megszólaltatni egy nem túl jó minőségű, szélessávú erősítőn keresztül úgy, hogy közben mindezt a szuperolcsó HAMA mikrofon közvetíti a számítógép felé?
Mindez abszolút amatőr megvalósításnak tűnik és valóban az. Ugyanakkor Derzsi Zoli is jelezte, hogy számára gyanús a HAMA mikrofon 10kHz-es frekvenciaátviteli határa, szerinte ez messze alatta van. Ebben az esetben viszont programozási hibáról van szó. Mindenesetre a programot ismert frekvenciákkal tesztelve nekem korrekt eredmények jöttek ki. Kérem a Tisztelt Olvasót, hogy mindezt számolja bele az alábbiakba (azaz ne vegye túl komolyan az egészet)...
Először nézzük meg az ominózus, sokat vitatott asztalra csapást:

A spektrumban kiértékelhető nincs; a hangerőtől gyakorlatilag minden kiakadt. Annál érdekesebb a következő spektrum, amelyen lassan azt mondom ki, hogy "Pénzes-féle Gitáriskola":

Az alapfrekvencia néhány száz Hz környékén van, ám folyamatosan felharmonikus koszok is felfedezhetők. Az emberi beszéd felharmonikusban eléggé szegényes a zenei hangokhoz képest. Ám dúdoljunk csak egy rövid ideig azonos hangmagasságon!

Hoppá! A dúdolás zöldes alapfrekvenciája után jól behatárolható és szabályos felharmonikusok jelennek meg!
A következő képen a "Tavaszi szél" című népdal első sorát éneklem:

A dallam 500 Hz alatt mozog, a felharmonikusok kissé elmosódottak, de karakteresen jelentkeznek a spektrum bizonyos részeiben.
Itt az idő hangszerek tesztelésére!
Először az Ibanez akusztikus gitáromról bejátszott egyetlen A5 húrpendítés (110 Hz)...

...majd ugyanez az E1 húr A hangján (5. fekvés - 440 Hz):

Ennél sokkal karakteresebben jelentkeznek a felharmonikusok Casio szintetizátoromból bejátszva; folyamatos orgonahang 440 Hz-en. Láthatjuk, hogy a legalsó vonal (itt balról az első) a frekvenciasáv szerint tényleg 440 Hz körüli:

Még egyszer ellenőrizzük le a pontosságot 880 Hz-en is:

Ezután egy A-dúr skála Ibanez akusztikus gitárom alsó regiszterében, azaz E6 húr A hangjáról indítva (5. fekvés):

Hoppá, igazi felharmonikus kavalkád! Kezd érdekessé válni a dolog! Most ugyanez az A-dúr skála a felső regiszterben (12. fekvés felett):

Alohe Oe! Ez aztán a tökéletes spektrumrajzolat! Láthatjuk, hogy a felső 3 húr (G3-H2-E1) mennyivel gazdagabb felharmonikusban.
Ezt az A-dúr kísérletet a fenti skálapozíciókban végezzük el elektromos gitáron is (Fender Squier Affinity Fender-pickup, nyaki állásban):


Az akusztikus és elektromos gitár spektrumát összehasonlítva felfedezhetjük a nyilvánvaló különbséget: a pickup nem képes annyira élethűen felvenni a felharmonikus hangokat. Ezzel egyúttal talán meg is határozhatjuk a minőségi pickup egyik legfontosabb ismérvét: nem vágja le a a felharmonikus hangokat, azaz élethű hangkaraktert ad vissza. Ez persze nemcsak kizárólag ezen a momentumon múlik, hanem minden olyan alkatrészen, amely az elektromos gitáron a hangképzésben vagy a hangátvitelben részt vesz (azaz gyakorlatilag mindegyiken). Az állítással persze nem mondtunk nagyot, bár azon érdemes elgondolkodnunk, hogy érdemes-e méregdrága pickupokkal tuningolni gitárunkat, ha csak egy is silány minőségű a hangképzési vagy a hangátviteli alkatrészek között...
A következő lépésben arra keressük a választ, hogy más lesz-e nyaki és a húrláb-pickup nyújtotta felharmonikus átvitel? Először a nyaki pickup spektruma, majd a húrláb-pickupé:


Sejtésem beigazolódott: kis mértékben, de a húrláb-pickup élesebb hangzása valóban azt jelenti, hogy felharmonikusokban valamennyivel gazdagabb. Azonban ez az akusztikai különbség szerintem nem a pickup minőségén, hanem húrhoz viszonyított pozícióján múlik.
Most Casio szintetizátorom Grand Piano hangját vizsgáljuk meg a már bejáratott A-dúr skálával, először az alsó, majd a felső regiszterben:


Az igazi érdekesség, hogy a szintetizátor esetében nem természetes, hanem mesterséges úton előállított hangokat teszteltünk.
Most pedig jöjjön a többi hangszer!
Kezdjük a zongorával! Részlet Frederic Chopin Cisz-moll keringőjéből ultramodern megjelenítésben (azaz már hallgatni sem kell, csak nézni, ám így is mennyei élvezet! ☺):

Orgona - Bach: D-moll toccata és fúga - a híres bevezető téma:

Cselló - Camille Saint Saens: A hattyú - zongorakísérettel:

Hegedű - Massenet: Meditáció a "Thais" című operából - nagyzenekari kísérettel:

Mandolin - Vivaldi: C-dúr mandolinkoncert - kamaraegyüttessel:

Trombita - Haydn - Esz-dúr trombitaverseny - nagyzenekari kísérettel:

Vonósok és fúvósok - Wagner: Trisztán és Izolda - előjáték (a híres Trisztán-akkord):

Zenekari és vegyes kórus tutti - Mozart: Requiem - Introitus

Zenekari és női kórus tutti (Halleluja...) - Handel: A Messiás

Férfi kar - gregorián:

Férfi hang zenekarral (Pavarotti hangja) - Schubert: Ave Maria
Látjuk a fodrozódásokat? A művész ott remegteti hangszálait (tremolózik)...

Most nézzünk meg néhány könnyűzenei stílust!
Nu Metal-backing track:

Laid Back - Sunshine Reggae:

Malmsteen arpeggio-szóló:

Valójában ezek már inkább tűnnek félresikerült tapétáknak, semmint zenei spektrumoknak. Ennek azonban speciális, hangmérnöki oka van. A mai könnyűzenei számokat a stúdióban úgy próbálják keverni, hogy a dal spektruma egyenletes legyen, azaz a dal minden egyes frekvenciakomponense (nagyjából) azonos hangerővel rendelkezzen. Ebben az ideális esetben a dal spektruma tökéletes téglalapot mutatna, nem úgy, mint az alábbi képen, ahol láthatóan alig van basszus-hangerő és a középtartomány is horpadt kissé:

A tökéletes téglalap-spektrumot klasszikus hangmérnöki eszközökkel valójában elég nehéz elérni, bár lehetséges, hogy azóta erre is megírták a megfelelő algoritmust. (Ez igencsak elképzelhető, elvégre ha a felvett zenei anyagot digitalizáljuk -amilyen módon ma már a legtöbb stúdió dolgozik-, akkor innentől ez a feladat pusztán algoritmus kérdése. Igazam van vagy tévedek, kedves hangmérnök bácsik? Legyenek szívesek írják meg nekem!) Amit tehát a fenti könnyűzenei tapétákon láthatunk, az a dalok mesterségesen, azaz keverési utómunkálatok során kiegyenlített frekvenciaspektruma, illetve még pontosabban: annak csak "árnyékvetületei", hiszen a hangmérnökök valós zenei frekvenciákkal, nem pedig azok felharmonikusaival dolgoznak. Ráadásként a masszív ritmusszekció sokféle, magas frekvenciájú ütőhangszere (például a cinek) a tapétát még jobban és még egyenletesebben "meg is vonalazzák".
Derzsi Zoli az alábbi levéllel reagált a fenti "hangmérnöki" állításaimra:
"Ez így nem teljesen állja meg a helyét. Az emberi fül frekvenciaérzékelése
nem lineáris, a kétszeres frekvenciaviszonyt nem kétszeres hangmagasságnak
(azaz oktávnak) hallja. Ezt Te magad is láthatod, ha egy skálán lépkedsz felfelé:
növekedni fognak az egyes hangok közötti távolságok (frekvenciában),
pedig úgy hallod, hogy az az éppen aktuális skálának megfelelő hangköz.
Az ember (és nagy valószínűséggel minden élőlény) hangmagasság-érzékelése a frekvencia
függvényében nem lineáris. Sőt, az egész spektrum (az infrahangtól a
kozmikus sugárzásig) sem lineáris. A MixW programja viszont lineárisan
mutatja a spektrumot, aminek főként rádióamatőr okai vannak: SSB (USB)
üzemmódban a rádió hangja van bevezetve a számítógép hangbemenetébe, tehát a
berendezés mindenkori vivőfrekvenciájához képest mutatja a spektrumot: 110
MHz +50 Hz, +1 kHz, stb. Be lehet úgy is állítani, hogy a program logaritmikusan
mutassa a spektrumot, de a jelen pillanatban az alacsony
frekvenciáknál lévő kis felbontás miatt ez csak rontana a helyzeten. Erről
tehet a hangkártya, hiszen már a digitalizálásnál is veszteségesen
dolgozik és a CPU is véges számítástechnikai kapacitása miatt.
Az emberi fül felépítéséből következik, hogy a hangok magasságát sem
egyenletes hangerőként érzékeljük: ezért kell egy 50W-os hangrendszerhez
150 W-nyi mélysugárzó és csupán 5-6W-nyi magas. (Az arányok kissé
túlzottak, de itt most az elvet hangsúlyozom.)
A hangmérnök munkája tehát annyi, hogy a felvételi rendszer frekvenciamenetét igazítsa az emberi fülhöz, hogy aztán jelalakhűen (Hi-Fi, High-End,
Audiofil, professzionális) visszaadó rendszeren hallgathassuk meg az adott
zenedarabot. Nem is olyan egyszerű dolog ez...
Tovább bonyolítva a dolgot: az ember hallásának frekvenciamenete
függ a hangerőtől is. Emlékezetem szerint, ha halkan szól a zene,
kevesebb mélyhangot hallunk, ha azonban hangosítjuk, kevesebb középhangot
(és közben több mélyhangot) érzékelünk, amely érzékelés ronthatja a hangképet, ezért
kellemes például a komolyzenei darabokat nagyobb hangerőn hallgatni. A
jobb minőségű hangrendszerek (például a régi Videoton RA63xxS hifik is)
rendelkeznek fiziológiai hangerőszabályzással, amivel ezt kompenzálják.
Lásd ezeket a linkeket:
http://en.wikipedia.org/wiki/Audiogram
http://hu.wikipedia.org/wiki/Audiogram
Tehát a hallásküszöb és a fájdalomküszöb frekvenciánként változik,
ráadásul nem egyenlő mértékben. Valójában ezért szólnak rosszabbul a
koncert- mint a stúdiófelvételek, holott ugyanazt a technikát használják.
Ezért más élmény 10W-on, és 1000W-on gitározni, hiszen teljesen máshogy
halljuk.
Ez utóbbit saját felvételek készítésénél én is tapasztalom és csendesszoba
híján eléggé
megnehezíti a feladatomat. És még szót sem ejtettem az
irányérzékelésről..."
A válaszom:
"Igen, ez mind igaz, ám én egy szót sem ejtettem az emberi hallástartomány frekvencia-anomáliáiról. Én csupán azt állítom, hogy a zenének hangmérnöki szempontból igenis létezik-létezhet egy olyan idealizált spektruma, amely nevezetesen téglalap alakú. Mindenképpen idealizált ez, mert értekezésedből egyértelműen kiderült: az emberi hallás tökéletlenségei miatt ideális megoldás nem lehetséges."
A fenti vizsgálódás utolsó gondolataként jegyzem meg, hogy egy hang felharmonikus dúsultsága függ az alaphang hangerejétől is. Egy nagyobb hangerejű hangnak több és jobban mérhető felharmonikusa van.
Ha az alaphangból következő, járulékos frekvenciákat tovább elemezzük, akkor további, még érdekesebb felfedezésekre juthatunk.
Először is, egy zenei hang megszólalásakor a fül belső szerkezete az alaphanghoz egy oktávot ad hozzá (Kerényi Miklós György - Az éneklés művészete és pedagógiája - 31. oldal). Ez több mint döbbenetes, elvégre itt már nem külső fizikai-akusztikai, hanem belső, anatómiai jelenségről van szó. Ennél azonban létezik még egy elképesztőbb jelenség: ez olyan hangközök felcsendülésekor szokott létrejönni, ahol a két hang hangmagasságban nincs nagyon távol egymástól. Ekkor lép fel az úgynevezett hanglebegés, amely során nemcsak maga a hangköz, hanem az alaphangok frekvenciájának összege, sőt különbsége is megszólal.
Például egy 200 és 300 Hz-es jel egyidejű felhangzásakor nagyon halkan, de összeghangként meg fog jelenni egy 500 Hz frekvenciájú jel (200 + 300 = 500) és különbségi hangként egy 100 Hz-es jel is (mert 300 - 200 = 100). Az igazi probléma mindig az összeghanggal van, mert az általában disszonáns, míg a különbségi hang legtöbbször konszonáns.
Nagyon sokáig tagadták a különbségi és összeghangok puszta létezését, mert sok zenész és zenetudós úgy vélte, hogy azok csupán a zene során fellépő pszichikai délibábok. Később rezonátorok segítségével -olyan eszközökkel, amelyek egy adott frekvenciára hangolva felerősítik a kívánt hangot-, sikerült bebizonyítani észleléstől független, fizikai létezésüket. A különbségi hangokra először Sorge német orgonista hívta fel a figyelmet 1745-ben, de tőle függetlenül a híres hegedűs Tartini is észlelte a jelenséget. Az összeghangokat Helmholtz fedezte fel 1863-ban.
Vajon lehetséges-e valamilyen módon hasznosítani ezt a páratlan akusztikai jelenséget?
Igen, lehetséges, például az orgonasípok építésénél. Ezek a sípok a legalsó hangtartományban már olyan hosszúak, hogy egyszerűen nem éri meg az elkészítésük. Helyette két rövidebb, az alaphang 2. vagy 3. felharmonikusát generáló sípot használnak fel és a kettő egyidejű megszólaltatásával, különbségi hangként hozzák létre a kívánt alaphangot.
A magam részéről sikertelenül próbáltam ezeket a járulékos hangokat megjeleníteni a MixW spektrográfján keresztül. Véleményem szerint ehhez túl gyöngék voltak, az észlelő eszközök pedig érzéketlenek; kimutatásuk minimum rezonátorok közbeiktatásával lett volna lehetséges.
Kesztler Lőrinc kitűnő zenepedagógus egyik könyvében azt írta (1957-ben), hogy a többi hangtulajdonsággal ellentétben a hangszín nem mérhető tényező. Ez az állítás manapság már nem nagyon állja meg a helyét, mert élt egyszer Franciaországban egy Joseph Fourier nevű polihisztor (1768-1830), aki megfogalmazta: minden periodikus mozgás előállítható szinuszos jelek összegeként (Fourier-sor). Eme mértani sorozat alapján következtethetünk a felharmonikusokból az alaphangra és fordítva is. Ez a matematikai lehetőség a mérhetőség mellett érvel. Abban sem vagyok biztos, hogy 2009-ben nem létezik olyan algoritmus vagy tudományos műszer, amely ne volna képes egy adott hangforrás teljes hangszín-spektrumának feltérképezésére...
Az alábbi, a Fourier-sort tudományos szinten magyarázó értekezés PDF-formátumban dr. Pápay Zsolt munkája, a publikáció a szerző írásos engedélyével történt.
Zenei rendszerünk hangjainak teljes összehasonlítása
A Pénzes-féle megalománia következő lépcsője, hogy rendszerünkben összehasonlítjuk az összes temperált és hangközarányokkal számított hangértéket. A kiindulópont a már több helyen ismertetett összehasonlító táblázat:

A számítások nem a 27,5 Hz rezgésszámú A hangtól indulnak, mert zenei rendszerünk legmélyebb, szubkontra C hangját az orgona adja 16,35 Hz rezgésszámmal. A legmagasabb zenei hang a pikkoló ötvonalas D hangja 4699 Hz rezgésszámmal. Mivel az abszolút viszonyítási pontról, a fő referenciahangról az ógörögök nem nyilatkoztak egyértelműen a Sparta Music Gazette című zenei közlönyükben (a postás egyébként is elakadt a szalamiszi szorosnál ☺), kénytelen vagyok az általam ismert egyetlen referenciahangot, a modern, normál zenei hangot venni (440 Hz) és innen fogunk terjeszkedni az összes oktáv felé a temperált hangrendszer című fejezetben megállapított A hang oktávértékek szerint:
:2 ← 440 → x2
27,5 ← 55 ← 110 ← 220 ← 440 → 880 → 1760 → 3520 → 7040









Ha a tiszta és temperált C hangok közti eltérést összehasonlítjuk, akkor arra a következtetésre juthatunk, hogy az eltérés a frekvencia kétszeres növekedésével szintén kétszeres mértékben nő:

Most megyek és elgondolkodom rajta...
(Én) folytatjuk...☺




