Skąd się bierze barwa dźwięku?

    Są ludzie, którzy mają przyjemny dla ucha głos - najczęściej lektorzy - i tacy, którzy raczej skrzeczą niż mówią. Podobnie instrumenty muzyczne brzmią inaczej nawet, gdy grają tę samą melodię. To co odróżnia wymienione dźwięki to barwa. W tym poście chciałbym pokazać skąd się bierze barwa dźwięku i za co odpowiada. Będzie to podparte analizą nagrań różnych dźwięków.
Obrazek z Wikimedia commons

Dźwięk

Słowem wstępu chciałbym powiedzieć co to jest dźwięk i jakie jego cechy możemy zmierzyć i opisać.

Fale akustyczne

    Dźwięk to fale - fale dźwiękowe, akustyczne, rodzaj fal mechanicznych. Nazw jest wiele ale istotne jest zrozumienie. Fale akustyczne mogą rozchodzić się tylko w jakimś materialnym ośrodku, np.: powietrzu, wodzie, szynie kolejowej. Dlatego nie usłyszymy nic w próżni, nie nagramy tam żadnego dźwięku. Jest tak dlatego, że fale akustyczne wyglądają na poziomie cząsteczek jak naprzemienne obszary o większej i mniejszej liczbie cząsteczek. Przekłada się to obszary o wyższym i niższym ciśnieniu. Takie właśnie falowe zaburzenie ciśnienia ośrodka nazywamy falą akustyczną. Obrazowo przedstawia to poniższy rysunek.
Ilustracja zachowania cząsteczek prowadzących falę akustyczną o punktowym źródle

Wysokość dźwięku

    Podstawową cechą dźwięku jest jego wysokość. Wysokość dźwięku jest terminem muzycznym i nie ma nic wspólnego z wysokością przedmiotów. Odpowiednią wielkością fizyczną do wysokości dźwięku jest częstotliwość fali akustycznej. Częstotliwość mówi nam o tym ile obszarów o wyższym ciśnieniu (dalej zwanych szczytami) tworzy źródło dźwięku w ciągu jednej sekundy. Częstotliwość mierzy się w hercach Hz. 1 Hz oznacza jeden szczyt na sekundę. Ludzkie ucho słyszy dźwięki od 20 Hz do 20`000 Hz. Wraz ze starzeniem się ten zakres się zmniejsza. Wyższa częstotliwość oznacza wyższy dźwięk. Warto jeszcze wspomnieć, że ultradźwięki to dźwięki powyżej 20`000 Hz a infradźwięki poniżej 20 Hz.

Natężenie dźwięku

    Natężenie dźwięku jest tym co bezpośrednio przekłada się na głośność. Jak ustaliliśmy fala akustyczna to zaburzenie ciśnienia. To jak bardzo jest zaburzone opisuje amplituda fali. Przykładowo gdybyśmy w pokoju mieli ciśnienie 1013 hPa, a w szczycie fali ciśnienie wyniosłoby 1015 hPa to amplituda fali równa jest 2 hPa = 200 Pa. Dźwięk taki jest już bardzo bliski granicy bólu ludzkiego ucha. Słyszalne amplitudy fali akustycznej to od około 30 $\mu$Pa do około 300 Pa. Amplituda ciśnienia na granicy bólu odpowiada sytuacji jakby położyć na naszej błonie bębenkowej 80-gramowy ciężarek.

Barwa dźwięku

    Dotarliśmy do tytułowej barwy dźwięku. Zróżnicowania w barwie dźwięku nie zaobserwujemy w fali akustycznej o jednej częstotliwości. Każdy taki dźwięk brzmi jak piszczenie. Barwa dźwięku pojawia się gdy dźwięk jest mieszanką fal o różnych częstotliwościach. Zdecydowana większość źródeł dźwięku generuje jednocześnie wiele fal. Zobrazujmy to na przykładzie drgającej struny.
Animacja autorstwa Cdang z Wikimedia Commons
    To co widać na animacji to trzy pierwsze tzw. mody drgań struny. W pierwszym (podstawowym) modzie mamy dwa węzły (miejsca, gdzie struna nie zmienia swojego położenia) i jedną strzałkę (miejsca gdzie wychylenie jest największe). W każdym kolejnym modzie przybywa nam po jednym węźle i po jednej strzałce. Gdy po prostu uderzymy strunę najgłośniejszy będzie mod podstawowy i to on nam zdefiniuje wysokość, czyli częstotliwość dźwięku. Jednak struna będzie drgała w znacznie bardziej skomplikowany sposób. Jej drgania będą złożeniem wszystkich jej modów drgań. W rezultacie dźwięk, który wyda będzie mieszanką częstotliwości będących wielokrotnością modu podstawowego. Żeby nie być gołosłownym posłużę się przykładami, które sam nagrałem i zanalizowałem.

Analiza widma

    Ta część tłumaczy w obrazowy sposób jak otrzymałem z nagranego dźwięku wykresy pojawiające się w dalszej części wpisu. Poniższy wykres pokazuje pierwsze 25 milisekund dźwięku jaki nagrałem grając dźwięk C4 na gitarze klasycznej.
    Widzimy pewien powtarzający się schemat jednak jest on znacznie bardziej skomplikowany niż prosta falą jaką każdy z nas zna. Tak właśnie wygląda nałożenie się wielu fal o różnych częstotliwościach. Tę samą informację możemy też przedstawić w inny sposób. Żeby lepiej to zrozumieć spójrzmy na zdarzenia okresowe w codziennym życiu - różne wydarzenia w kalendarzu. Rozpoczynając od pierwszego stycznia napotykamy np. taką sekwencję: szkoła, weekend, szkoła, weekend, szkoła, Dzień Babci, Dzień Dziadka, weekend, koniec semestru, urodziny mamy, ... To samo możemy przedstawić też w inny sposób:
  • Codziennie - wstajemy, jemy śniadanie, idziemy spać, ...
  • Co tydzień - jest weekend, jest pięć dni roboczych, ...
  • Co miesiąc - wypłata, płacenie rachunków, ...
  • Co pół roku - koniec semestru, początek semestru
  • Co rok - urodziny, dni babci, dziadka, mamy, święta, ...
    Zauważmy, że to co jest przed myślnikami w powyższej liście określa właśnie częstotliwość zdarzeń. Dokładnie to samo możemy zrobić z dźwiękiem, który zarejestrowaliśmy jako sekwencje amplitud fali. Stosując odpowiednie przekształcenie matematyczne można z nagrania amplitudy dźwięku w czasie otrzymać jakie częstotliwości fal tworzą ten dźwięk. Dla powyższego dźwięku dostaniemy następujący wykres zwany widmem:

    Pierwszy szczyt na wykresie odpowiada modowi podstawowemu struny. Dla dźwięku C4 jest to 262 Hz. Każdy kolejny szczyt to kolejny mod drgań i kolejna wielokrotność 262 Hz. Wysokość szczytu jest z kolei proporcjonalna do amplitudy danego modu, czyli do tego jak jest głośny, jak duży ma wkład do całego dźwięku.
    Powyższe wykresy otrzymałem przy pomocy tej aplikacji. Tutaj przedstawię tylko najciekawsze wnioski ale zapraszam do pełnej eksploracji nagranych dźwięków. Na końcu wpisu jest krótki opis jak używać aplikacji. 

Gdzie jest barwa dźwięku? 

    Teraz możemy wreszcie powiedzieć gdzie w tym wszystkim jest barwa dźwięku. Barwa dźwięku zależy od amplitudy wyższych modów drgań. Gdy weźmiemy dwa dźwięki o tej samej częstotliwości modu podstawowego i tej samej głośności ale wydane przez inne instrumenty to będą się one różniły barwą dźwięku, czyli proporcjami między kolejnymi modami drgań. Przykładem mogą być dwa ludzkie głosy. Na wykresie poniżej widzimy widma samogłoski "O" zaśpiewanej na wysokości F4 (349 Hz) przez kobietę i mężczyznę.
Porównanie widm głosu damskiego (niebieski) i męskiego (pomarańczowy) śpiewających samogłoskę "O".
    Widzimy, że pierwsze mody mają bardzo zbliżone amplitudy, natomiast mody od szóstego wzwyż są zupełnie inne. To właśnie intensywność tych modów odpowiada za barwę dźwięku.

Samogłoski 

    Naturalnym wydaje się teraz pytanie czym się różnią od siebie samogłoski? W szkole zawsze uczyli nas tylko jak układa się aparat mowy podczas wymowy konkretnych głosek. Jednak nikt nam raczej nie powiedział, że to co odróżnia od siebie samogłoski to właśnie barwa! Spójrzmy na przykład jak się różni "O" od "E". Pierwsze trzy mody mają prawie identyczne amplitudy. Natomiast w amplitudach dalszych modów jest znacząca różnica, co wpływa na barwę dźwięku - w tym wypadku jaka to jest samogłoska.
Porównanie widm samogłosek "O" (niebieski) oraz "E" (pomarańczowy), głos męski, wysokość F4.
    Poniżej przedstawiam jeszcze kilka co ciekawszych wykresów. Do obejrzenia innych porównań zapraszam do aplikacji.
Porównanie widm samogłosek "A" (niebieski) oraz "Y" (pomarańczowy), głos damski, wysokość C4

Porównanie widm samogłoski "A" (niebieski) głos damski oraz gitary elektrycznej na czystym kanale (pomarańczowy), wysokość F4
    Gdyby zebrało się odpowiednio dużo nagrań samogłosek można by pokusić się o stworzenie charakterystyk samogłosek w sensie względnych wartości amplitud kolejnych modów. Ja dysponuje nagraniami tylko dwóch głosów, więc uśrednienie jest dość słabe. Niemniej zamieszczam wynik poniżej. Jeśli ktoś chciałby wspomóc projekt charakteryzacji samogłosek to można się ze mną skontaktować.
Charakterystyka samogłosek - uśrednione natężenia modów drgań dla odpowiedniej wysokości dźwięku.

Podsumowanie

    Powiedzieliśmy sobie, że dźwięk to fale ciśnienia ośrodka, w którym się rozchodzi. Podstawowe własności jakie go charakteryzują to częstotliwość (wysokość) i natężenie (głośność). Prawie wszystkie źródła dźwięków wydają dźwięki bardziej skomplikowane niż pojedyncza fala. Skomplikowanie to objawia się w występowaniu kolejnych modów drgań częstotliwości bazowej. Natężenia tych kolejnych modów składają się na barwę dźwięku, która rozróżnia źródła dźwięku.

Opis aplikacji

Link
  1. Widmo - na tej zakładce narysujemy widmo dźwięku wybranego z paska bocznego. Wykres jest interaktywny - po kliknięciu dodaje wyświetlany punkt do tabeli charakterystyki, która wyświetla się poniżej. Gdy jesteśmy zadowoleni z wybranych punktów można je "dodać do charakterystyki", aby porównać dźwięki w trzeciej zakładce. Można też "zresetować tabelkę" bieżącą i zacząć od nowa.
  2. Porównaj - zakładka analogiczna do pierwszej - rysuje widma dwóch dźwięków na jednym wykresie w celu łatwiejszego porównania
  3. Charakterystyka - tu obejrzymy na wykresach zaznaczone punkty z zakładki "Widmo". Dostępny jest wykres wszystkich dźwięków oraz uśrednienie po źródłach i rodzajach dźwięku. Na dole jest utworzona tabelka z opcją usunięcia.
  4. Automatyczna analiza - zakładka analogiczna do trzeciej przy czym tabela charakterystyki jest tworzona automatycznie wybierając częstotliwości kolejnych modów wybranej wysokości dźwięku.

Komentarze