Zasłuchany mózg. Co się dzieje w głowie, gdy słuchasz muzyki - Daniel J. Levitin - ebook

Zasłuchany mózg. Co się dzieje w głowie, gdy słuchasz muzyki ebook

Daniel J. Levitin

0,0
39,44 zł

lub
Opis

Otwierająca uszy i głowy analiza jednej z namiętności rządzących naturą człowieka!

Daniel J. Levitin, niegdyś muzyk rockowy, a dziś neurobiolog, analizuje związek między muzyką – jej wykonaniami, kompozycją, sposobami słuchania i tym, co sprawia, że się nam podoba – a mózgiem człowieka. Wykorzystując najnowsze badania i przykłady muzyczne, od Mozarta, Elli Fitzgerald i U2, po Schönberga i Metallicę, Levitin pokazuje, dlaczego odczuwamy więź emocjonalną z muzyką, której słuchaliśmy, będąc nastolatkami, i jak kompozytorzy wykorzystują to, w jaki sposób nasz mózg racjonalizuje świat. Dochodzi też do niezwykłych wniosków – to 10 000 godzin ćwiczeń – a nie tylko talent – decyduje o tym, że możemy zostać wirtuozami!

„Książka zabiera nas w ekscytującą podróż, tym ciekawszą, że towarzyszy nam autor będący jednocześnie spełnionym muzykiem, pragmatycznym naukowcem i człowiekiem, który wciąż potrafi zachwycać się światem.”
Sting


„Z zachwytem przeczytałem, że słuchanie muzyki powoduje współdziałanie wielu różnych części mózgu, a wykonywanie muzyki angażuje nawet więcej z nich!”
David Byrne, muzyk, założyciel grupy Talking Heads

„Tę książkę powinni przeczytać wszyscy muzycy, bez względu na poziom zaawansowania – czyli każdy z nas.”
Howie Klein, były dyrektor wytwórni Sire oraz Reprise/Warner Brothers Records

„Nawet ci, którym słoń nadepnął na ucho, będą pod wrażeniem.”
The Guardian (Londyn)

„Książka zabiera nas w ekscytującą podróż, tym ciekawszą, że towarzyszy nam autor będący jednocześnie spełnionym muzykiem, pragmatycznym naukowcem i człowiekiem, który wciąż potrafi zachwycać się światem.”
Sting

Ebooka przeczytasz w aplikacjach Legimi lub dowolnej aplikacji obsługującej format:

EPUB
MOBI

Liczba stron: 541

Popularność




Seria #nauka

Projekt serii i okładki Marta Jaszczuk

Tytuł oryginału This Is Your Brain on Music: The Science of a Human Obsession

Copyright © Daniel J. Levitin, 2006 All rights reserved All rights reserved including the right of reproduction in whole or in part in any form. This edition published by arrangement with the Plume, an imprint of Penguin Publishing Group, a division of Penguin Random House LLC.

© Copyright for Polish Translation and Edition by Wydawnictwo Uniwersytetu Jagiellońskiego Wydanie I, Kraków 2016 All rights reserved

Niniejszy utwór ani żaden jego fragment nie może być reprodukowany, przetwarzany i rozpowszechniany w jakikolwiek sposób za pomocą urządzeń elektronicznych, mechanicznych, kopiujących, nagrywających i innych oraz nie może być przechowywany w żadnym systemie informatycznym bez uprzedniej pisemnej zgody Wydawcy.

ISBN 978-83-233-4143-7

ISBN 978-83-8179-534-0 (e-book)

www.wuj.pl

Wydawnictwo Uniwersytetu Jagiellońskiego Redakcja: ul. Michałowskiego 9/2, 31-126 Kraków tel. 12-663-23-80, 12-663-23-82, tel./fax 12-663-23-83 Dystrybucja: tel. 12-631-01-97, tel./fax 12-631-01-98 tel. kom. 506-006-674, e-mail: sprzedaz@wuj.pl Konto: PEKAO SA, nr 80 1240 4722 1111 0000 4856 3325

Wstęp

Kocham naukę i kocham muzykę – po co je łączyć?

Kocham naukę i boli mnie świadomość, że tak wielu ludzi się jej obawia lub uważa, że pójście drogą nauki wyklucza współczucie, przedmioty humanistyczne czy respekt i szacunek dla natury. Nauka nie ma nas pozbawić misterium, ale je na nowo odkryć i ożywić.

Robert Sapolsky, Dlaczego zebry nie mają wrzodów?, przeł. Małgorzata Guzowska-Dąbrowska, s. 8

Latem 1969 roku, kiedy miałem jedenaście lat, w miejscowym sklepie audio--wideo kupiłem zestaw stereo. Kosztował mnie całe sto dolarów, które zarobiłem tamtej wiosny, pieląc sąsiadom ogródki za 75 centów za godzinę. Spędzałem długie popołudnia w swoim pokoju, słuchając płyt Cream, Rolling Stonesów, Chicago, Simona i Garfunkela, Bizeta, Czajkowskiego, George’a Shearinga oraz saksofonisty Bootsa Randolpha. Słuchałem nieszczególnie głośno, przynajmniej w porównaniu z czasami studenckimi, kiedy to dosłownie rozpaliłem głośniki, za bardzo podkręcając głośność, ale dla moich rodziców hałas i tak był nie do zniesienia. Mama jest powieściopisarką; pisała codziennie w gabinecie na końcu korytarza, a wieczorami przed kolacją przez godzinę grała na fortepianie. Ojciec był biznesmenem; pracował osiemdziesiąt godzin tygodniowo, w tym czterdzieści w domowym biurze, gdzie spędzał wieczory i weekendy. Złożył mi – jak na biznesmena przystało – pewną propozycję, a mianowicie że kupi mi słuchawki, jeśli obiecam, że będę ich używał, kiedy on jest w domu. Te słuchawki na zawsze zmieniły mój sposób słuchania muzyki.

Ci współcześni spośród słuchanych przeze mnie artystów bez wyjątku zaczynali eksperymentować z miksowaniem nagrań zarejestrowanych techniką stereofoniczną. Ponieważ głośniki mojego wielofunkcyjnego zestawu stereo za sto dolarów nie były doskonałe, nie słyszałem przez nie głębi, której mogłem doświadczać w słuchawkach – instrumentów rozbrzmiewających w prawym i lewym kanale, a także z przodu i z tyłu (czyli z pogłosem). Płyty przestały być dla mnie zwykłymi zbiorami piosenek; stały się nośnikami dźwięku. Słuchawki odsłoniły przede mną świat dźwiękowych kolorów, które tworzą paletę niuansów i detali znaczących dużo więcej niż akordy i melodia, tekst utworu lub głos danego wykonawcy. Klimat bagnistego Głębokiego Południa w Green River Creedence’ów albo sielankowe, przestrzenne piękno Mother Nature’s Son Beatlesów; oboje w VI symfonii Beethovena (pod batutą von Karajana), delikatnej i przesiąkniętej atmosferą wielkiego drewniano-kamiennego kościoła; dźwięk mnie spowijał. Słuchawki sprawiły też, że muzyka nabrała bardziej osobistego wymiaru; nagle okazało się, że dochodzi z wnętrza mojej głowy, a nie z otaczającego mnie świata. Właśnie to przywiązanie zdecydowało, że zostałem inżynierem dźwięku i producentem muzycznym.

Wiele lat później Paul Simon powiedział mi, że on też od zawsze interesował się przede wszystkim dźwiękiem. „Swoich płyt słucham pod kątem tego, jak brzmią, a nie dla akordów czy tekstów – pierwsze wrażenie dotyczy ogólnego brzmienia”.

Z powodu incydentu z głośnikami w akademiku wyleciałem z uczelni, a później dołączyłem do zespołu rockowego. Byliśmy na tyle dobrzy, że nagrywaliśmy w kalifornijskim studiu na dwudziestoczterościeżkowym sprzęcie pod okiem utalentowanego inżyniera dźwięku Marka Need­hama, który później pracował nad przebojowymi płytami Chrisa Isaaka oraz grup Cake i Fleetwood Mac. Mark mnie polubił – pewnie dlatego, że jako jedyny z naszego zespołu przychodziłem do reżyserki, żeby posłuchać, jak brzmieliśmy; pozostałych muzyków bardziej interesowało odurzanie się w przerwach między kolejnymi nagraniami. Traktował mnie jak producenta, choć wtedy nie miałem pojęcia kto to producent; pytał mnie, jak chcielibyśmy brzmieć. Pokazał mi, jak bardzo na brzmienie może wpłynąć nie tylko dobór mikrofonu, ale i sposób, w jaki się go ustawi. Na początku nie słyszałem wskazywanych przez niego różnic, ale nauczył mnie, na co zwracać uwagę. „Zauważ, że kiedy przystawiam ten mikrofon do wzmacniacza gitary, brzmienie staje się pełniejsze, bardziej okrągłe, a także równiejsze, a gdy go odsuwam, zaczyna wyłapywać niektóre dźwięki z pomieszczenia, sprawiając, że brzmienie staje się bardziej przestrzenne, choć jednocześnie trochę tracą na tym średnie tony”.

Nasz zespół zyskał jako taką popularność w San Francisco, a nasze nagrania emitowano w lokalnych rozgłośniach o profilu rockowym. Gdy grupa się rozpadła, ponieważ gitarzysta co rusz próbował popełnić samobójstwo, a wokalista miał paskudny nawyk aplikowania sobie podtlenku azotu i cięcia się żyletkami, znalazłem zatrudnienie jako producent nagrań innych zespołów. Nauczyłem się słyszeć rzeczy, których wcześniej nie słyszałem: rozróżniać mikrofony, a nawet taśmy różnych producentów (taśma Ampex 456 charakterystycznie „łupała” przy dźwiękach o małej częstotliwości, Scotch 250 osobliwie szeleściła przy dużych częstotliwościach, a Agfa 467 brzmiała dźwięcznie w środkowej części pasma). Gdy już wiedziałem, na co zwracać uwagę, taśmę marki Ampex odróżniałem od Scotcha i Agfy równie łatwo jak jabłko od gruszki czy pomarańczy. Rozwijałem się, współpracując z innymi wspaniałymi inżynierami dźwięku, takimi jak Leslie Ann Jones (z którą wcześniej nagrywali Frank Sinatra i Bobby McFerrin), Fredem Catero (Chicago, Janis Joplin) i Jeffreyem Normanem (John Fogerty, Grateful Dead). Choć to ja byłem producentem, czyli odpowiadałem za sesje nagraniowe, każda z tych osób mnie onieśmielała. Niektórzy inżynierowie dźwięku pozwalali mi uczestniczyć w ich sesjach nagraniowych z innymi artystami – grupami Heart i Journey, Santaną, Whitney Houston i Arethą Franklin. Nigdy w życiu nie nauczyłem się tak wiele jak wtedy, obserwując, jak inżynierowie komunikują się z wykonawcami, jak omawiają subtelności partii gitarowej lub wokalnej. Dyskutowali o sylabach tekstu piosenki, wybierając jedno spośród dziesięciu różnych wykonań. Tak dobrze potrafili słuchać; jak zdołali tak wyćwiczyć słuch, aby słyszeć rzeczy niesłyszalne dla zwykłych śmiertelników?

Kiedy pracowałem z mało znaczącymi i nieznanymi zespołami, poznawałem szefów studiów nagrań i inżynierów dźwięku, dzięki którym dostawałem coraz lepsze zlecenia. Pewnego razu inżynier dźwięku nie przyszedł do pracy, więc to ja zmontowałem nagrania Santany. Przy innej okazji wspaniały producent Sandy Pearlman wyszedł na lunch podczas sesji zespołu Blue Öyster Cult, zostawiając mi dokończenie nagrywania partii wokalnych. Z jednego spotkania wynikały kolejne i w ten sposób ponad dziesięć lat spędziłem, produkując płyty w Kalifornii. Miałem to szczęście, że mogłem pracować z wieloma znanymi muzykami, ale nie tylko; współpracowałem również z dziesiątkami osób, których nazwiska nie znaczą nic w branży muzycznej – bardzo utalentowanych, ale nieodnoszących sukcesu. Zacząłem się zastanawiać, dlaczego niektórzy muzycy zyskują powszechną sławę, a inni popadają w zapomnienie. Zastanawiało mnie też, skąd u niektórych taka oczywista łatwość muzykowania. Gdzie szukać źródeł inwencji twórczej? Dlaczego niektóre piosenki tak bardzo nas poruszają, a wobec innych jesteśmy obojętni? I jaką rolę w tym wszystkim odgrywa zdolność percepcji – ta niesamowita umiejętność, dzięki której wielcy muzycy i inżynierowie dźwięku słyszą niuanse, o których większość z nas nie ma pojęcia?

Aby znaleźć odpowiedzi na te pytania, postanowiłem wrócić do szkoły. Pracując nadal jako producent płyt, dwa razy w tygodniu jeździłem z Sandym Pearlmanem na Uniwersytet Stanforda, aby tam uczestniczyć w wykładach z neuropsychologii prowadzonych przez Karla Pribrama. Odkryłem, że odpowiedzi na niektóre spośród nurtujących mnie pytań należy szukać w psychologii – pytań dotyczących pamięci, percepcji, kreatywności, a także narzędzia wspólnego dla każdego z tych zagadnień, czyli ludzkiego umysłu. W rezultacie jednak zamiast uzyskać pożądane odpowiedzi, wydłużyłem listę pytań – to typowe dla rozważań naukowych. Każde nowe pytanie sprawiało, że z coraz większym uznaniem myślałem o złożoności muzyki, świata oraz ludzkich doznań. Jak zauważa filozof Paul Churchland, ludzie usiłują zrozumieć świat niemal od zarania historii pisanej; w samym tylko ostatnim dwóchsetleciu nasza ciekawość doprowadziła do ujawnienia większości informacji ukrywanych przed nami przez naturę: struktury czasoprzestrzeni, budowy materii, wielorakich form energii, początków wszechświata, a nawet samej istoty życia, poznanej dzięki odkryciu DNA, a także stworzeniu mapy ludzkiego genomu, czego dokonano nie dalej jak pięć lat temu. Jest jednak tajemnica, której nie udało się poznać – tajemnica ludzkiego umysłu oraz tego, jak rodzą się w nim myśli i uczucia, nadzieje i żądze, jak rodzi się miłość, a także jak to się dzieje, że doświadczamy piękna, o tańcu, sztukach wizualnych, literaturze i muzyce nie wspominając.

Czym jest muzyka? Skąd się bierze? Dlaczego niektóre połączenia dźwięków tak bardzo nas poruszają, podczas gdy inne, na przykład szczekanie psa lub pisk opon samochodu, dla wielu osób są trudne do zniesienia? Niektórzy z nas na szukaniu odpowiedzi na te pytania spędzają większość swojego życia zawodowego. Inni uważają, że takie rozbieranie muzyki na czynniki pierwsze jest jak analizowanie składu chemicznego płótna Goi z pominięciem walorów artystycznych dzieła, nad którym artysta pracował. Martin Kemp, historyk sztuki Uniwersytetu Oksfordzkiego, zauważa, że artyści i naukowcy są do siebie w pewien sposób podobni. Artyści w większości nazywają swoją pracę eksperymentowaniem – elementem ciągu wysiłków w dążeniu do zbadania jakiegoś powszechnego problemu lub określenia punktu widzenia. Mój bliski kolega – również po fachu – William Forde Thompson (muzykolog kognitywista i kompozytor pracujący na Uniwersytecie w Toronto) dodaje, że w pracy naukowców i artystów wyróżnia się podobne etapy rozwoju: kreatywno-rozpoznawczy etap „burzy mózgów”, po którym następują etapy testowania i dopracowywania, zwykle wiążące się z postępowaniem według ustalonych procedur, lecz nierzadko dopełniane kreatywnym rozwiązywaniem problemów. Pracownie i studia artystów oraz laboratoria naukowców również są do siebie podobne jako miejsca, w których jednocześnie realizuje się wiele mniej lub bardziej niedokończonych projektów. Każde z nich musi być wyposażone w specjalistyczne narzędzia, a wyniki pracy – w odróżnieniu od ostatecznego projektu mostu wiszącego lub operacji deponowania pieniędzy na rachunku bankowym na koniec dnia roboczego – podlegają interpretacji. Rzeczą wspólną dla artystów i naukowców jest umiejętność funkcjonowania w sytuacji, w której rezultaty ich pracy stale podlegają interpretacjom i reinterpretacjom. Praca artystów i naukowców to koniec końców poszukiwanie prawdy, lecz przedstawiciele obu obozów zdają sobie sprawę, że prawda jest z natury uwarunkowana kontekstem i zmienna, zależna od punktu widzenia, a to, co dziś jest prawdą, jutro może się okazać obaloną hipotezą lub zapomnianym dziełem sztuki. Przykładów nie trzeba szukać daleko: Piaget, Freud czy Skinner byli autorami teorii, które początkowo zyskiwały powszechne uznanie, a po pewnym czasie upadały (lub co najmniej ulegały drastycznej korekcie). W muzyce wiele zespołów przedwcześnie obwołano epokowymi. Grupę Cheap Trick nazwano nowymi Beatlesami, a Rolling Stone Encyclopedia of Rock poświęciła kiedyś tyle samo miejsca zespołom Adam and the Ants i U2. Były czasy, kiedy ludziom nie mieściło się w głowach, że kiedyś mało kto na świecie będzie znał takie nazwiska, jak Paul Stookey, Christopher Cross czy Mary Ford. Dla artysty celem obrazu lub kompozycji nie jest oddanie prawdy ostatecznej, lecz pewnego aspektu prawdy uniwersalnej; o tym, że mu się udało, świadczy fakt, że jego dzieło przemawia do ludzi i porusza ich bez względu na kontekst czy uwarunkowania społeczne i kulturowe. Dla naukowca celem teorii jest oddanie prawdy „na teraz” – zastąpienie starej prawdy przy jednoczesnym dopuszczeniu do świadomości, że pewnego dnia i ta teoria zostanie zastąpiona nową „prawdą”, ponieważ na tym polega rozwój nauki.

Muzyka wyróżnia się spośród wszystkich rodzajów działalności człowieka tym, że jest wszechobecnai odwieczna. W żadnej ze znanych nam kultur człowieka istniejących obecnie lub w dowolnym momencie w przeszłości nie brakowało muzyki. Pośród najstarszych artefaktów znajdowanych podczas wykopalisk prowadzonych w miejscach bytowania ludzi i praludzi są instrumenty muzyczne: flety z kości i kawałki skór zwierzęcych naciągniętych na pieńki drzew jako bębny. Zawsze gdy ludzie gromadzą się z jakiegoś powodu, towarzyszy im muzyka: podczas wesel i pogrzebów; z okazji ukończenia studiów; gdy mężczyźni wyruszają na wojnę; w czasie imprez sportowych na stadionach, wieczornego wyjścia na miasto, modłów, romantycznej kolacji; matki kołyszą dzieci do snu, a studenci uczą się do egzaminów z muzyką w tle. Muzyka jest i była częścią codziennego życia, istotniejszą wręcz dla kultur nieuprzemysłowionych niż współczesnych zachodnich społeczeństw. W naszej kulturze dopiero względnie niedawno, czyli jakieś pięćset lat temu, ukształtował się podział społeczeństwa na odrębne klasy wykonawców muzyki i słuchaczy muzyki. W większości świata i przez większą część dziejów ludzkości tworzenie muzyki było czynnością równie naturalną jak oddychanie i chodzenie, i każdy w nim uczestniczył. Sale koncertowe, przeznaczone do wykonywania muzyki, powstały dopiero w kilku ostatnich stuleciach.

Jim Ferguson, którego znam, odkąd chodziliśmy do tej samej szkoły średniej, jest obecnie profesorem antropologii. Jim to jeden z najzabawniejszych i piekielnie inteligentnych ludzi, jakich znam, ale jest nieśmiały – nie wiem, jak udaje mu się prowadzić zajęcia na uczelni. Kiedy doktoryzował się na Harvardzie, prowadził badania terenowe w Lesotho, państewku graniczącym z każdej strony z RPA. Pracując i rozwijając kontakty ze społecznością jednej z tamtejszych wiosek, Jim cierpliwie zdobywał zaufanie mieszkańców, aż pewnego dnia zaproszono go do wspólnego wykonania jednej z ich pieśni. Poproszony o zaśpiewanie wraz z owymi przedstawicielami ludu Sotho, odpowiedział: „Ja nie umiem śpiewać”, co było zgodne z prawdą. Występowaliśmy razem w orkiestrze szkolnej i Jim wprawdzie świetnie grał na oboju, ale nie był w stanie zanucić nawet najprostszej melodii. Wieśniacy nie potrafili pojąć ani wytłumaczyć sobie jego odpowiedzi. Dla ludu Sotho śpiewanie to zwyczajna, codzienna czynność, którą wykonują wszyscy, młodzi i starzy, mężczyźni i kobiety, a nie zajęcie dla garstki wybrańców.

Nasza kultura, a także nasz język rozróżniają klasę zawodowych wykonawców – Arthurów Rubinsteinów, Ell Fitzgerald i Paulów McCartneyów – i rzeszę pozostałych ludzi. My, czyli ta rzesza, płacimy za to, by ci zawodowcy bawili nas, pozwalając się słuchać. Jim zdawał sobie sprawę, że żaden z niego śpiewak ani tancerz, a śpiew i taniec w miejscu publicznym oznaczały dla niego mniej więcej tyle, co uznanie się za zawodowca. Za to mieszkańcy wioski wbili w niego wzrok, pytając: „Jak to nie umiesz śpiewać?! Przecież umiesz mówić!”. Kiedy później Jim opowiadał mi o tamtym zdarzeniu, stwierdził: „Dla nich było to tak niepojęte, jak gdybym powiedział, że nie potrafię chodzić ani tańczyć, choć mam obie nogi”. Śpiew i taniec były naturalną częścią życia każdego człowieka, nierozerwalnie z nim powiązaną i dotyczącą każdego bez wyjątku. W języku sesotho, oraz w wielu innych językach świata, czasownik „śpiewać” (ho bina) oznacza też taniec. Brak rozróżnienia wynika z założenia, że śpiewanie wiąże się z ruchami ciała.

Kilka pokoleń wstecz, przed nastaniem telewizji, wiele rodzin siadywało w kręgu i muzykowało dla zabawy. Dziś ogromny nacisk kładzie się na technikę i umiejętności oraz na to, czy dany muzyk jest „dość dobry”, by grać dla innych. W naszej kulturze wykonywanie muzyki stało się czynnością niejako zastrzeżoną – a rzesze pozostałych ludzi słuchają. Przemysł muzyczny to jedna z największych branż działających w Stanach Zjednoczonych, zatrudniająca setki tysięcy ludzi. Zyski z samej sprzedaży płyt sięgają trzydziestu miliardów dolarów rocznie, nie mówiąc o sprzedaży biletów na koncerty, tysiącach kapel występujących w piątkowe wieczory w knajpach jak Ameryka Północna długa i szeroka, czy trzydziestu miliardach piosenek pobranych za darmo za pomocą programów wymiany plików w 2005 roku. Amerykanie wydają więcej pieniędzy na muzykę niż na seks czy leki na receptę. Zważywszy jak żarłoczna to konsumpcja, jestem skłonny stwierdzić, że większość Amerykanów to biegli słuchacze muzyki. Mamy zdolności poznawcze pozwalające nam wyłapywać fałszywe nuty, wyszukiwać muzykę, która nam się podoba, zapamiętywać setki melodii, a także przytupywać w rytm muzyki, co wiąże się z analizowaniem metrum – procesem, z którego złożonością nie radzi sobie większość komputerów. Dlaczego słuchamy muzyki i dlaczego jesteśmy skłonni wydawać tak dużo na słuchanie muzyki? Dwa bilety na koncert mogą spokojnie kosztować tyle, ile wynoszą tygodniowe wydatki na żywność w czteroosobowej rodzinie, a cena jednej płyty kompaktowej równa się cenie koszuli, ośmiu bochenków chleba lub podstawowego miesięcznego abonamentu telefonicznego. Rozumiejąc, dlaczego lubimy muzykę i co nas do niej przyciąga, mamy szansę poznać istotę natury człowieka.

Pytania o podstawową – i powszechną – zdolność człowieka są siłą rzeczy pytaniami o ewolucję. Zwierzęta wykształciły pewne fizyczne uwarunkowania w reakcji na otoczenie, a cechy liczące się w porze godowej były przekazywane w genach kolejnym pokoleniom.

Darwinizm subtelnie zakłada, że organizmy żywe – czy to rośliny, wirusy, insekty, czy zwierzęta – ewoluowały wraz ze światem materialnym. Innymi słowy, wszystkie istoty żyjące zmieniają się w reakcji na zmiany zachodzące w świecie, a świat zmienia się pod wpływem tego, jak zmieniają się one same. Jeśli dany gatunek rozwinie mechanizm odstraszania określonego drapieżnika, gatunek owego drapieżnika jest zmuszany przez ewolucję do tego, by wypracować metodę pokonania zabezpieczeń lub znaleźć inne źródło pożywienia. Selekcja naturalna to wyścig zbrojeń, w którym gatunki zmieniają się, próbując dorównać sobie pod względem morfologicznym.

Stosunkowo nowa dziedzina naukowa, psychologia ewolucyjna, rozszerza pojęcie ewolucji ze świata materialnego na intelektualny. Mój mentor z czasów studiów na Uniwersytecie Stanforda, psycholog kognitywista Roger Shepard zauważa, że nie tylko nasze ciało, ale i umysł są dziełem milionów lat ewolucji. Nasze schematy myślowe, skłonności do rozwiązywania problemów w określony sposób, zdolności odbierania bodźców zewnętrznych – na przykład zdolność widzenia barwnego (oraz rozróżniania określonych barw, które widzimy) – to skutki ewolucji. Shepard idzie dalej w swoich rozważaniach: nasze umysły ewoluowały równocześnie ze światem materialnym, przeobrażając się w reakcji na stale zmieniające się warunki zewnętrzne. Trójka studentów Sheparda, Leda Cosmides i John Tooby z Uniwersytetu Kalifornijskiego w Santa Barbara oraz Geoffrey Miller z Uniwersytetu Nowego Meksyku, należy do czołowych badaczy zajmujących się tą nową dziedziną. Badacze ci uważają, że mogą dowiedzieć się wiele na temat ludzkich zachowań na podstawie ewolucji umysłu. Jaką funkcję dla ludzkości pełniła muzyka w toku naszego ewoluowania i rozwoju? Nie ma wątpliwości, że muzyka sprzed pięćdziesięciu czy stu tysięcy lat różniła się bardzo od muzyki Beethovena, grupy Van Halen i Eminema. Nasze mózgi ewoluują, a wraz z nimi ewoluuje muzyka, którą tworzymy z ich pomocą, oraz muzyka, której chcemy słuchać. Czy w naszych mózgach rozwinęły się obszary i ścieżki przeznaczone wyłącznie do tworzenia i słuchania muzyki?

W przeciwieństwie do przestarzałego i uproszczonego poglądu jakoby za przetwarzanie sztuki i muzyki odpowiadała prawa półkula naszego mózgu, a języka i matematyki – lewa, odkrycia, jakich dokonaliśmy niedawno w moim laboratorium i laboratoriach moich kolegów, pokazują, że muzyka jest rozprowadzana po całym mózgu. Badając osoby z uszkodzonymi mózgami, mieliśmy do czynienia z chorymi, którzy utracili zdolność czytania gazety, ale nadal potrafią czytać nuty albo umieją grać na fortepianie, choć nie są w stanie tak skoordynować własnych ruchów, by zapiąć sobie guziki od swetra. Słuchanie, wykonywanie i komponowanie muzyki angażuje niemal wszystkie z poznanych dotychczas obszarów mózgu oraz niemal każdą część układu nerwowego. Czy można tym samym potwierdzić opinie, że słuchanie muzyki rozwija inne części naszych umysłów – że słuchanie Mozarta przez dwadzieścia minut dziennie sprawia, że jesteśmy mądrzejsi?

Siła, z jaką muzyka wywołuje emocje, jest wykorzystywana przez dyrektorów do spraw reklamy, filmowców, dowódców wojskowych oraz matki. Twórcy reklam za pomocą muzyki sprawiają, że napój, piwo, buty do biegania lub samochód wydają się nam fajniejsze od produktów konkurencyjnych firm. Reżyserzy muzyką podpowiadają nam, jak odbierać sceny, które bez muzyki byłyby dwuznaczne, albo potęgują nasze odczucia w wyjątkowo dramatycznych fragmentach filmów. Wyobraźmy sobie scenę typowego pościgu w filmie akcji albo muzykę mogącą towarzyszyć kobiecie wchodzącej samotnie po schodach we wnętrzu ponurego starego domiszcza. Muzyka jest wykorzystywana do tego, by manipulować naszymi uczuciami, a my zwykle akceptujemy albo wręcz uwielbiamy siłę, z jaką muzyka wywołuje w nas tak różne doznania. Matki wszędzie na świecie i od czasów tak zamierzchłych, jak tylko potrafimy sobie wyobrazić, delikatnym śpiewem usypiają małe dzieci albo odwracają ich uwagę od tego, co doprowadziło je do płaczu.

Wielu miłośników muzyki utrzymuje, że w ogóle się na niej nie zna. Zauważyłem, że liczni z grona moich kolegów zajmujących się trudnymi, zawiłymi dziedzinami, na przykład neurochemią albo psychofarmakologią, nie czują się kompetentni, by zająć się badaniami nad neurobiologią muzyki. Trudno się temu dziwić. Teoretycy muzyki posługują się enigmatycznym, oderwanym od rzeczywistości zbiorem terminów i reguł, które są nie mniej niejasne niż niektóre najbardziej osobliwe dziedziny matematyki. Dla kogoś, kto nie jest muzykiem, plamki tuszu na kartce nazywane zapisem nutowym mogą nie różnić się niczym od opisu matematycznej teorii mnogości. Rozmowa o tonacji, intonacji, modulacji i transpozycji może stanowić nie lada wyzwanie.

Mimo to każdy kolega onieśmielony tym żargonem potrafi mi powiedzieć, jaką muzykę lubi, a jakiej nie. Mój znajomy Norman White to światowy autorytet w dziedzinie badań nad szczurzym hipokampem i tym, jak szczury zapamiętują różne miejsca, w których były. Norm jest wielkim fanem jazzu i umie ze znawstwem opowiadać o ulubionych artystach. Bez namysłu odróżnia Duka Ellingtona od Counta Basiego, a nawet wczesnego Louisa Armstronga od tego późnego na podstawie muzyki, którą usłyszy. Nie wie nic o technicznych aspektach muzyki – potrafi powiedzieć, która piosenka mu się podoba, ale nie potrafi nazwać zawartych w niej akordów. W tym, co mu się podoba, jest jednak ekspertem. Oczywiście nie jest to nic nadzwyczajnego. Nierzadko wykazujemy się praktyczną znajomością tego, co lubimy, i potrafimy podzielić się naszymi preferencjami bez dysponowania wiedzą techniczną właściwą prawdziwym ekspertom. Wiem, że ciasto czekoladowe w restauracji, do której często zachodzę, smakuje mi bardziej niż to sprzedawane w cukierni nieopodal mojego domu. Ale tylko mistrz kucharski jest w stanie przeanalizować to ciasto – rozpisać doznania smakowe na jego poszczególne składniki – wskazując różnice w rodzajach użytej mąki, tłuszczu lub czekolady.

Szkoda, że wiele osób obawia się żargonowych terminów, którymi rzucają muzycy, teoretycy muzyki i kognitywiści. W każdej dziedzinie badawczej używa się specjalistycznego słownictwa (wystarczy spróbować zrozumieć opis ogólnego badania krwi, który dostajemy od lekarza). Niemniej specjaliści i naukowcy zajmujący się muzyką mogliby bardziej się postarać, aby wyniki ich pracy były przystępniejsze w odbiorze. Taki cel postawiłem sobie, pisząc tę książkę. Równolegle do nienaturalnej przepaści, jaka powstała między wykonywaniem muzyki a jej słuchaniem, powstała przepaść między tymi, którzy kochają muzykę (i kochają o niej rozmawiać), a tymi, którzy odkrywają coraz to nowe rzeczy na temat jej oddziaływania.

Moi studenci często zwierzają mi się, że kochają życie i jego tajemnice oraz obawiają się, że jeśli za bardzo poświęcą się nauce, stracą wiele zwyczajnych przyjemności. Studenci Roberta Sapolsky’ego pewnie dzielą się z nim podobnymi przemyśleniami, zresztą ja również miałem takie obawy w 1979 roku, kiedy przeniosłem się do Bostonu jako świeżo upieczony student uczelni muzycznej Berklee College of Music. Co będzie, jeśli zbyt naukowo podejdę do studiowania muzyki i swoimi analizami obedrę ją z jej tajemnic? Co będzie, jeśli zacznę tak dobrze znać się na muzyce, że przestanę czerpać z niej przyjemność?

Dziś muzyka nadal sprawia mi równie dużo przyjemności, jak w czasach owego taniego zestawu stereo i słuchawek. Im więcej dowiadywałem się o muzyce i nauce, tym bardziej każda z nich mnie fascynowała i tym bardziej potrafiłem docenić ludzi, którzy są w tych dziedzinach naprawdę dobrzy. Podobnie jak nauka muzyka z biegiem lat udowadniała, że jest przygodą, której nigdy nie przeżywa się tak samo. Muzyka jest dla mnie źródłem ciągłych zaskoczeń i nieustającej satysfakcji. Okazuje się, że nauka i muzyka tworzą całkiem niezłe połączenie.

To jest książka o naukowej stronie muzyki widzianej z perspektywy neurobiologii kognitywnej – dziedziny będącej połączeniem psychologii i neurologii. Omawiam w niej niektóre najnowsze badania nad muzyką, znaczeniem muzyki i przyjemnością, jaką daje muzyka, przeprowadzone przeze mnie i innych naukowców zajmujących się tym zakresem wiedzy. Wyniki tych badań przynoszą nowe odpowiedzi na pewne podstawowe pytania. Przykładowo, jeśli każdy z nas słyszy muzykę inaczej, jak wyjaśnić, że są utwory, które poruszają tak wiele osób, choćby MesjaszHändla czyVincent(Starry Starry Night)Dona McLeana? Jednak jeśli wszyscy słyszymy muzykę w ten sam sposób, jak wytłumaczyć duże zróżnicowanie upodobań muzycznych – jak to się dzieje, że dla jednych Mozart jest tym samym, czym dla innych Madonna?

W ostatnich latach, wraz z olbrzymim postępem w dziedzinie neurobiologii oraz opracowaniem nowych metod badawczych w psychologii, opartych na technologii obrazowania mózgu, leków umożliwiających manipulowanie takimi neuroprzekaźnikami, jak dopamina i serotonina, a także w tradycyjnych badaniach naukowych, rozwinęły się możliwości przeprowadzania operacji na otwartym umyśle. Mniej słyszy się o nadzwyczajnych postępach, jakie możemy uzyskiwać w dziedzinie modelowania budowy sieci neuronów dzięki stale postępującej rewolucji informatycznej. Poznajemy procesy obliczeniowe zachodzące w naszych głowach w zakresie, w jakim nie było to możliwe nigdy wcześniej. Okazuje się, że język jest zasadniczo zakodowany w mózgu. Nawet świadomość przestała być owiana beznadziejnie nieprzeniknioną mgłą tajemnicy i jawi się jako coś, co wynika z dających się obserwować układów fizycznych. Lecz jak dotąd nikt nie zebrał wszystkich rezultatów tych niedawnych badań, aby wyjaśnić, czym jest to zjawisko, które nazywam najpiękniejszą namiętnością człowieka. To, jak nasz mózg funkcjonuje pod wpływem muzyki, jest kluczem do poznania największych tajemnic natury ludzkiej. Oto dlaczego napisałem tę książkę. Nie jest ona przeznaczona dla moich kolegów, ale dla szerokiego kręgu czytelników, w związku z czym starałem się upraszczać pewne zagadnienia, unikając przy tym zbytnich uproszczeń. Wszystkie opisane tu badania zostały poddane weryfikacji w ramach recenzji naukowych i zamieszczone w recenzowanych czasopismach. Po szczegóły odsyłam do przypisów umieszczonych na końcu książki.

Jeśli lepiej zrozumiemy, czym jest muzyka i skąd się bierze, być może będziemy lepiej rozumieć nasze pobudki, obawy, żądze, wspomnienia, a nawet to, jak się komunikujemy w najszerszym tego słowa znaczeniu. Czy słuchanie muzyki można przyrównać do jedzenia, kiedy jesteśmy głodni, a więc zaspokajania pewnego pragnienia? A może raczej do oglądania pięknego zachodu słońca lub poddawania się masażowi pleców, które to czynności stymulują ośrodki odczuwania przyjemności w mózgu? Dlaczego ludzie z wiekiem zwykle przywiązują się do swoich gustów muzycznych i przestają eksperymentować z nową muzyką? Oto opowieść o równoległej ewolucji mózgu i muzyki – o tym, co muzyka może nam powiedzieć o mózgu i co mózg może nam powiedzieć o muzyce, a także o tym, co każde z nich może nam powiedzieć o nas samych.

1. Czym jest muzyka?

Od wysokości dźwięku do jego barwy

Czym jest muzyka? Dla wielu „muzyka” to wyłącznie wielcy mistrzowie – Beethoven, Debussy i Mozart. Dla innych „muzyka” to Busta Rhymes,Dr. Dre i Moby. Dla jednego z moich nauczycieli gry na saksofonie w Berklee College of Music – a także dla rzesz miłośników „jazzu tradycyjnego” – wszystko, co powstało przed rokiem 1940 albo po roku 1960, tak naprawdę w ogóle nie jest muzyką. Kiedy byłem dzieciakiem, w latach sześćdziesiątych, miałem kolegów, którzy przychodzili do mnie, żeby posłuchać The Monkees, bo jednym rodzice zakazywali słuchania czegokolwiek innego niż muzyka klasyczna, a innym pozwalali wyłącznie na słuchanie i śpiewanie pieśni religijnych, w obu przypadkach ze strachu przed „niebezpiecznymi rytmami” rock’n’rolla. Gdy Bob Dylan ośmielił się zagrać na gitarze elektrycznej na festiwalu muzyki folkowej w Newport w 1965 roku, część widzów wyszła z koncertu, a wśród tych, którzy zostali, rozległo się buczenie. Kościół katolicki zakazał muzyki polifonicznej (czyli takiej, w której co najmniej dwa głosy wybrzmiewają jednocześnie) z obawy, że przez nią ludzie zaczną wątpić w jedność Boga. Kościół zakazał też stosowania interwału muzycznego nazywanego kwartą zwiększoną, oznaczającego odległość między dźwiękami C i Fis, którego inna nazwa to tryton (taki interwał można usłyszeć w musicalu West Side Story Leonarda Bernsteina, kiedy Tony wyśpiewuje imię „Maria”). Uznano, że ów interwał jest tak dużym dysonansem, że najpewniej został stworzony przez Lucyfera, w związku z czym Kościół nazwał go diabolus in musica. Oburzenie w średniowiecznym Kościele wywołała wysokość dźwięku. Dylan został wybuczany z powodu barwy dźwięku. Białych rodziców z domków na przedmieściu przestraszyły afrykańskie rytmy ukryte w rocku, zapewne wzbudzając niepokój o to, że beat wprowadzi ich niewinne pociechy w stan permanentnego transu powodującego zmiany w mózgu. Czym są rytm, wysokość dźwięku i jego barwa – czy tylko pojęciami służącymi do opisania poszczególnych mechanicznych aspektów utworu, a może mają głębsze, neurologiczne podłoże? Czy każde z tych pojęć jest nam potrzebne?

Muzyka komponowana przez takich awangardzistów, jak Francis Dhomont, Robert Normandeau czy Pierre Schaeffer, nie mieści się w ramach tego, co większość z nas uważa za muzykę. Nie ograniczając się do melodii i harmonii, a nawet instrumentów, owi kompozytorzy wykorzystują nagrania dzwięków obiektów występujących w otoczeniu, takich jak młoty pneumatyczne, pociągi czy wodospady. Montują te nagrania, manipulują wysokością zawartych w nich dźwięków, a na koniec łączą je w uporządkowany kolaż dźwiękowy o takiej samej sinusoidzie emocjonalnej – takim samym schemacie budowania i rozładowywania napięcia – jak muzyka rozumiana w tradycyjny sposób. Kompozytorzy posługujący się taką konwencją są niczym malarze, którzy wyszli poza schemat sztuki figuratywnej i realistycznej – kubiści, dadaiści, wielu współczesnych twórców, od Picassa po Kadinskiego i Mondriana.

Co zasadniczo łączy muzykę Bacha, Depeche Mode i Johna Cage’a? Co w najbardziej podstawowy sposób odróżnia What’s It Gonna Be?! Busta Rhymes albo sonatę Patetyczną Beethovena od, dajmy na to, nagromadzenia dźwięków, które słyszymy, stojąc na środku Times Square lub znajdując się w głębi lasu deszczowego? Jak doskonale ujął to kompozytor Edgar Varèse, „muzyka to zorganizowany dźwięk”.

Niniejsza książka pokazuje w ujęciu neuropsychologicznym, jak muzyka wpływa na nasze mózgi, umysły, myśli i nastroje. Najpierw jednak pomaga przeanalizować, z czego składa się muzyka. Jakie są podstawowe elementy tworzące muzykę? Jak uporządkowanie tych elementów prowadzi do powstania muzyki? Podstawowe elementy każdego dźwięku to głośność, wysokość, kontur, takt (czyli rytm), tempo, barwa, umiejscowienie w przestrzeni i pogłos. Nasze mózgi przyporządkowują te podstawowe właściwości słyszanego dźwięku bardziej zaawansowanym pojęciom w podobny sposób do tego, jak malarz za pomocą linii tworzy kształty; te zaawansowane pojęcia to metrum, harmonia i melodia. Słuchając muzyki, w rzeczywistości percypujemy różne właściwości tudzież „wymiary”.

Zanim przejdę do tego, co zasadniczo dzieje się w mózgu, w tym rozdziale chciałbym przedstawić definicje terminów muzycznych i zarysować podstawowe koncepcje teorii muzyki, ilustrując je przykładami muzycznymi. (Muzycy, jeśli chcą, mogą pominąć ten rozdział albo go tylko przejrzeć). Zacznijmy od zestawienia najważniejszych terminów.

Wysokość dźwięku to pojęcie czysto psychologiczne związane zarówno z rzeczywistą częstotliwością danego tonu, jak i jego położeniem względem innych nut w skali. Wysokość dźwięku daje odpowiedź na pytanie: „Która to nuta?” („Cis”). Definicje skali i częstotliwości podaję poniżej. (Gdy trębacz dmie w instrument i wydobywa z niego pojedynczy dźwięk, wytwarza coś, co większość z nas nazywa nutą, a naukowcy tonem. Obydwa terminy, ton oraznuta, odnoszą się do tego samego abstrakcyjnego pojęcia, przy czym użycie wyrazu ton ograniczamy do określenia tego, co słyszymy, a wyrazu nutado tego, co widzimy w zapisie nutowym). W rymowankach dla dzieci Mary Had a Little Lamb [tyt. pol. Mary małą owcę ma w przekładzie Marii Tomaszewskiej] oraz Are You Sleeping? [tyt. pol. Panie Janie] wysokość dźwięku to jedynazmienna w sekwencji siedmiu początkowych nut – rytm nie ulega zmianie. Pokazuje to, jak silnie – i zasadniczo – wysokość dźwięku wpływa na właściwości melodii czy piosenki.Rytmdotyczy czasu trwania sekwencji nut oraz tego, w jaki sposób te sekwencje tworzą wspólną całość. Przykładowo, w piosence Alphabet Song (a także w innej, Twinkle, Twinkle Little Star [tyt. pol. Gwiazdko, gwiazdko, jasno świeć]) każda z sześciu początkowych nut trwa tyle samo czasu, kiedy wyśpiewujemy litery A B C D E F, po czym dwukrotnie wydłużamy czas trwania na literze G. Następnie wracamy do poprzedniej długości dźwięków przy literach H I J K, a kolejne cztery litery wyśpiewujemy w czasie o połowę krótszym, czyli dwa razy szybciej: L M N O, kończąc na przytrzymanej literze P (i sprawiając, że całe pokolenia dzieci w wieku szkolnym przez pierwsze kilka miesięcy nauki trwają w przekonaniu o istnieniu w alfabecie angielskim litery nazywanej ellemmenno). W piosence grupy The Beach Boys zatytułowanej Barbara Ann siedem początkowych nut ma tę samą wysokość, a zmienia się jedynie rytm. Siedem kolejnych nut również ma tę samą wysokość (w warstwie melodycznej), gdy do Deana Torrence’a (z duetu Jan & Dean) dołączają inne głosy, które śpiewają inne nuty (w warstwie harmonicznej). Beatlesi mają w swoim repertuarze kilka piosenek, w których w sekwencji kilku nut wysokość dźwięku jest stała, a zmienia się tylko rytm: cztery początkowe nuty utworu Come Together; sześć nut utworu Hard Day’s Night następujących po słowach „It’s been a”; sześć początkowych nut utworu Something.Tempooznacza ogólną szybkość danego utworu. Kiedy przytupujemy, tańczymy lub maszerujemy do dźwięków danego utworu, szybkość, z jaką się poruszamy, wskazuje, jak szybkie lub wolne jest tempo tego utworu.Konturokreśla ogólny kształt melodii z uwzględnieniem wyłącznie schematu „góra–dół” (czyli tego, czy nuta wznosi się lub opada, ale nie wielkości, o jaką wznosi się lub opada).Barwarozróżnia poszczególne instrumenty – na przykład trąbkę od fortepianu – na których grana jest ta sama nuta z partytury. Jest jakby kolorem dźwięku tworzonym po części przez alikwoty generowane poprzez drgania instrumentu (bliżej piszę o tym w dalszej części książki). Barwa określa też sposób, w jaki jeden instrument może zmieniać brzmienie w obrębie skali – na przykładzie trąbki będzie to ciepłe brzmienie tego instrumentu w dole skali skontrastowane z przenikliwością najwyższego dźwięku, jaki można z niego wydobyć.Głośność to pojęcie wyłącznie psychologiczne związane (niebezpośrednio i w sposób, o którym wiadomo niewiele) z tym, ile energii wytwarza – ile powietrza wypiera – dany instrument, oraz tym, co akustyk nazwałby amplitudą dźwięku.Pogłos wiąże się z tym, jak postrzegamy odległość źródła dźwięku, w zestawieniu z kubaturą pokoju lub sali, w której rozbrzmiewa muzyka; laicy często nazywają go „echem”. Pogłos to właściwość odróżniająca przestrzenność śpiewu wykonywanego w pokaźnej sali koncertowej od brzmienia śpiewu pod prysznicem. Odgrywa niedocenianą rolę w oddawaniu emocji i tworzeniu brzmienia, które ogólnie uznaje się za przyjemne.

Psychofizycy, czyli naukowcy badający, w jaki sposób mózg i świat materialny oddziałują na siebie, wykazali, że wszystkie te właściwości są rozdzielne. Poszczególne właściwości można modyfikować bez zmieniania pozostałych, co umożliwia prowadzenie odrębnych badań naukowych nad każdą z nich z osobna. Mogę zmieniać wysokość dźwięków w piosence bez zmieniania rytmu albo zagrać tę piosenkę na innym instrumencie (zmieniając barwę) bez zmieniania czasu trwania lub wysokości nut. Różnica między muzyką a przypadkowym lub nieuporządkowanym skupiskiem dźwięków wynika z tego, w jaki sposób te podstawowe właściwości łączą się z sobą i jakie zależności powstają między nimi. Gdy owe zasadnicze elementy łączą się i tworzą zależności w sposób, któremu można przypisać znaczenie, realizowane są bardziej złożone pojęcia, takie jak metrum, tonacja, melodia i harmonia.

Metrumpowstaje w naszych mózgach na podstawie informacji czerpanych ze wskazówek na temat rytmu i głośności, a wiąże się z tym, w jaki sposób dźwięki są pogrupowane względem siebie w czasie. Metrum walca porządkuje dźwięki w grupy po trzy, a metrum marsza – w grupy po dwa lub cztery.Tonacjadotyczy hierarchii dźwięków w utworze muzycznym; owa hierarchia nie istnieje w świecie, lecz wyłącznie w naszych umysłach, jako funkcja naszych doświadczeń z danym stylem muzycznym oraz schematy poznawcze, które każdy z nas tworzy, by zrozumieć muzykę.Melodiato główny temat utworu muzycznego, partia, którą podśpiewujemy, słuchając, sekwencja dźwięków, które najwyraźniej utrwalają się w naszych umysłach. Pojęcie melodii ma różne znaczenia w poszczególnych gatunkach muzycznych. W muzyce rockowej najczęściej zwrotki i refren mają różne melodie, a zwrotki wyróżniamy na podstawie zmian w tekście oraz, w niektórych przypadkach, zmian instrumentów. W muzyce klasycznej melodia to dla kompozytora punkt wyjścia do tworzenia wariacji na jej temat, które mogą być wykorzystane w całym utworze w różnych formach.Harmoniawiąże się z relacjami pomiędzy wysokością poszczególnych dźwięków oraz z kontekstami tworzonymi przez wysokość tych dźwięków, na których ostatecznie oparte są przewidywania co do tego, jaki będzie dalszy ciąg utworu – przewidywania, które wprawny kompozytor może potwierdzać lub zakłócać dla celów artystycznych i na potrzeby ekspresji. Harmonia może oznaczać po prostu melodię biegnącą równolegle do melodii podstawowej (jak ma to miejsce wtedy, gdy dwaj śpiewacy współbrzmią z sobą) albo dotyczyć progresji akordów – połączeń nut stanowiących kontekst i tło melodii.

Każde z tych zagadnień omówię szerzej w dalszej części książki.

Idea łączenia prostych elementów w celu stworzenia dzieła sztuki oraz ważnej roli związków między elementami funkcjonuje również w sztukach wizualnych i tańcu. Do podstawowych elementów percepcji wzrokowej zalicza się kolor (w którym można wyróżnić trzy odrębne wymiary, czyli odcień, nasycenie i jasność), jaskrawość, umiejscowienie, fakturę i kształt. Niemniej obraz to nie tylko te elementy – nie tylko kilka kresek tu i ówdzie tudzież czerwona kropka w jednym miejscu i niebieska plama w innym. Skupisko kresek i kolorów jest sztuką, jeśli istnieje związek między jedną a drugą kreską; jeśli dany kolor lub dana forma odzwierciedlają kolory lub formy ujęte w innej części płótna. Maźnięcia farbą i kreski stają się sztuką, gdy z podstawowych elementów percepcji stworzone zostają forma i ciągłość (czyli sytuacja, w której wzrok samoczynnie przesuwa się po obrazie). Połączone w harmonijny sposób, tworzą perspektywę, pierwszy plan i tło, a ostatecznie emocje i inne przymioty związane z estetyką. Podobnie rzecz ma się z tańcem, który nie jest li tylko gmatwaniną nieskoordynowanych ruchów ciała; powiązania między tymi ruchami sprawiają, że powstaje forma kompletna i pozbawiona zbędnych komponentów, a także spoista i spójna – taka, którą nasz mózg przetwarza na poziomie zaawansowanym. Tak samo jak w przypadku sztuk wizualnych w muzyce liczą się nie tylko te nuty, które wybrzmiewają, ale również te, których nie słychać. Miles Davis opisał swoją technikę improwizacji w podobny sposób, jak Picasso mówił o wykorzystywaniu płótna. Obaj artyści twierdzili, że najważniejszym aspektem ich pracy są nie tyle same obiekty, co przestrzenie między nimi. Dla Milesa najważniejszymi częściami solówek były puste przestrzenie między nutami, „powietrze”, którym wypełniał odstęp między jedną nutą a następną. Wiedzieć dokładnie, kiedy zagrać kolejną nutę, i dać słuchaczowi czas na to, żeby zdążył się jej spodziewać – oto wyróżniki geniuszu Davisa. Szczególnie wyraźnie słychać to na płycie Kind of Blue.

Osobom, które nie są muzykami, diatonika, kadencja, a nawet tonacja, wysokość dźwięku i tym podobne terminy mogą niepotrzebnie kojarzyć się z nieprzystępnością. Muzycy i krytycy czasami zachowują się tak, jakby żyli otoczeni mgłą terminologii technicznej, której stosowanie często sprawia, że brzmią pretensjonalnie. Ileż to razy podczas lektury recenzji z koncertu w gazecie łapaliśmy się na tym, że nie mamy pojęcia, co autor miał na myśli? „Utrzymała appogiaturę, alezabrakło umiejętności domknięcia rulady”. Albo: „Nie mogę uwierzyć, że zmienili tonację na cis-moll! Co za bzdura!”. Nas interesuje to, czy dane wykonanie muzyki poruszyło publiczność. Czy śpiewaczka wczuła się w postać, o której śpiewała. Może dobrze byłoby przeczytać porównanie dzisiejszego przedstawienia z tym wystawionym poprzedniego wieczoru albo przez inny zespół. Najczęściej interesuje nas muzyka, a nie zastosowane rozwiązania techniczne. Nie do przyjęcia byłoby dla nas, gdyby krytyk kulinarny zaczął snuć przypuszczenia o dokładnej temperaturze, przy której kucharz dodał sok z cytryny do sosu holenderskiego, lub gdyby krytyk filmowy skupił się na przysłonie obiektywu użytego przez operatora; nie zgadzajmy się na to również w opisach muzyki.

Co więcej, ludzie zajmujący się badaniem muzyki – nawet teoretycy muzyki i naukowcy – różnią się w ocenie tego, co oznaczają niektóre terminy. Przykładowo, terminem barwaokreślamy ogólne brzmienie lub ogólny kolor dźwięku wydawanego przez dany instrument – ta trudna do opisania cecha, która odróżnia trąbkę od klarnetu, kiedy grana jest na nich ta sama nuta z partytury, albo nasz głos od głosu Brada Pitta, kiedy wypowiadamy te same słowa. Ale brak porozumienia co do definicji sprawił, że środowisko naukowe postąpiło nietypowo, poddając się i określając, czym nie jest barwa. (Zgodnie z oficjalną definicją Acoustical Society of America barwa jest wszystkim, co dotyczy dźwięku i nie jest jego głośnością ani wysokością. Niech żyje naukowa precyzja!).

Czym jest i skąd się bierze wysokość dźwięku? Napisano setki prac naukowych i przeprowadzono tysiące eksperymentów, próbując odpowiedzieć na to proste pytanie. Niemal każdy z nas, nawet nie mając wykształcenia muzycznego, potrafi ocenić, czy śpiewaczka fałszuje; być może nie jesteśmy w stanie stwierdzić, czy śpiewa za wysoko, czy za nisko, ale większość ludzi w wieku powyżej pięciu lat potrafi wskazać fałszywe dźwięki z taką samą wprawą, z jaką odróżnia pytanie od zarzutu (w języku angielskim ton wznoszący oznacza pytanie, a ton opadający wskazuje na zarzut). Ta umiejętność bierze się z połączenia naszego kontaktu z muzyką i fizyki dźwięku. To, co nazywamy wysokością dźwięku, wiąże się z częstotliwością lub prędkością drgań struny, kolumny powietrza albo innego materialnego źródła. Gdy struna wibruje, poruszając się w przód i w tył sześćdziesiąt razy w ciągu sekundy, mówimy o niej, że ma częstotliwość sześćdziesięciu cykli na sekundę. Ta jednostka, cykl na sekundę, często nazywana jest hercem (w skrócie Hz) od nazwiska Heinricha Hertza, niemieckiego fizyka teoretycznego, który jako pierwszy dokonał przesłania fal radiowych (a jako nieprzejednany teoretyk na pytanie, do czego będzie można stosować fale radiowe, podobno odpowiedział, wzruszając ramionami: „Do niczego”). Gdybyśmy mieli naśladować dźwięk syreny wozu strażackiego, nasz głos osiągałby różne wysokości lub częstotliwości (zmieniające się wraz ze zmianą napięcia strun głosowych) – niektóre „niskie”, a inne „wysokie”.

Klawisze znajdujące się w lewej części klawiatury fortepianu uderzają w dłuższe i grubsze struny, których drgania są stosunkowo wolne. Klawisze w prawej części klawiatury uderzają w krótsze i cieńsze struny, które drgają szybciej. Drgania strun powodują przemieszczanie cząsteczek powietrza, które drgają z taką samą prędkością – z taką samą częstotliwością jak struna. To właśnie te drgające cząsteczki powietrza docierają do naszej błony bębenkowej, sprawiając, że ta porusza się z taką samą częstotliwością. Jedyna informacja, jaką nasz mózg otrzymuje na temat wysokości dźwięku, bierze się z takiego ruchu błony bębenkowej; nasze ucho środkowe i nasz mózg muszą analizować ruch błony bębenkowej, aby rozpoznać, jakie drgania w świecie zewnętrznym sprawiły, że porusza się ona w ten sposób. Napisałem, że drgają cząsteczki powietrza, ale inne cząsteczki również są wprawiane w drgania – usłyszymy muzykę pod wodą lub w innej cieczy, jeśli cząsteczki wody (lub tej innej cieczy) zostaną wprawione w drgania. Za to w próżni, w której nie ma cząsteczek, które mogłyby drgać, nie ma dźwięku. (Zwróćcie na to uwagę, kiedy będziecie oglądać film lub serial Star Trek i usłyszycie huk silników w przestrzeni kosmicznej – będziecie mieli ciekawy temat do dyskusji z fanami tej serii).

Dźwięki powstałe przez naciśnięcie klawiszy położonych bliżej lewego końca klawiatury przyjęło się nazywać „niskimi”, a te powstałe przez naciśnięcie klawiszy położonych bliżej prawego końca klawiatury – „wysokimi”. Dźwięki, które nazywamy „niskimi”, są wywoływane powolnymi drganiami, przypominając (pod względem częstotliwości drgań) szczekanie psa. Z kolei dźwięki nazywane „wysokimi” powstają z szybkich drgań i są zbliżone do psiego skomlenia. Określenia wysokii niskirównież są uwarunkowane kulturowo – Grecy nazywali dźwięki w odwrotny sposób, ponieważ budowane przez nich instrumenty strunowe najczęściej miały konstrukcję pionową. Górne krańce krótszych strun i piszczałek organów znajdowały się bliżej podłoża, więc te struny i piszczałki nazywano „niskimi” nutami (bo były „nisko przy podłożu”), a długie struny i piszczałki, które sięgały wyżej, w kierunku Zeusa i Apolla, nazywano „wysokimi” nutami. Niskii wysoki – tak jakprawyi lewy –to w rezultacie terminy stosowane dość dowolnie, których znaczenia trzeba nauczyć się na pamięć. Niektórzy autorzy dowodzą, że określenia „wysoki” i „niski” są określeniami intuicyjnymi, zauważając, że dźwięki, które nazywamy wysokimi, pochodzą od ptaków (które żyją wysoko na drzewach lub fruwają po niebie), a te, które nazywamy niskimi, często pochodzą od dużych, żyjących blisko ziemi ssaków albo niskich odgłosów trzęsienia ziemi. Te argumenty nie są jednak przekonujące, ponieważ niskie dźwięki powstają też wysoko w górze (choćby grzmoty podczas burzy), a wysokie mogą mieć swoje źródła nisko (świerszcze i wiewiórki, rozdeptywane liście).

Wysokość dźwięku zdefiniujmy na początek jako właściwość, która przede wszystkim odróżnia dźwięk powiązany z naciśnięciem danego klawisza fortepianu od dźwięku powiązanego z naciśnięciem innego klawisza.

Po naciśnięciu klawisza młoteczek uderza w jedną lub kilka strun wewnątrz fortepianu. Uderzenie w strunę powoduje jej przemieszczenie, nieco ją naciągając, a sprężystość struny sprawia, że po przemieszczeniu wraca ona do pierwotnego położenia – ale mija je, przemieszczając się zbyt daleko w przeciwnym kierunku, po czym próbuje powrócić do pierwotnego położenia i znowu je mija, wykonując w ten sposób ruch wahadłowy. Każde kolejne wychylenie jest krótsze, aż po pewnym czasie struna przestaje się poruszać. W rezultacie dźwięk, który słyszymy, naciskając klawisz fortepianu, cichnie, aż zanika zupełnie. Nasze mózgi przekładają odległość pokonywaną przez strunę przy każdym wychyleniu na głośność; prędkość, z jaką następują te wychylenia, przekładana jest na wysokość dźwięku. Im dalej przemieszcza się struna, tym głośniejszy wydaje nam się wydawany dźwięk; gdy porusza się tyle co nic, słyszymy cichy dźwięk. Choć to wbrew intuicji, odległość pokonywana przez strunę i prędkość wykonywania ruchów wahadłowych nie są od siebie zależne. Struna może drgać bardzo szybko, pokonując przy tym dużą albo bardzo małą odległość. Odległość ta jest uzależniona od tego, z jaką siłą uderzymy w strunę – w tym przypadku nie myli nas intuicja, która podpowiada, że im mocniej w coś uderzymy, tym głośniejszy dobędzie się dźwięk. Prędkość drgań struny zależy przede wszystkim od jej wielkości i naprężenia, a nie od siły uderzenia.

Można odnieść wrażenie, że wystarczy, jeśli stwierdzimy, że wysokość dźwięku jest tym samym, co częstotliwość, czyli częstotliwością drgania cząsteczek powietrza. To w zasadzie prawda. Odzwierciedlanie świata materialnego w sferze umysłowej rzadko bywa tak bezpośrednie, o czym jeszcze się przekonamy. Niemniej w przypadku większości dźwięków muzyki ich wysokość i częstotliwość są blisko powiązane.

Określenie „wysokość dźwięku” odnosi się do wyobrażenia, jakie dany organizm ma na temat podstawowej częstotliwości tego dźwięku. Innymi słowy, wysokość dźwięku to zjawisko czysto psychologiczne związane z częstotliwością drgań cząsteczek powietrza. Pisząc „psychologiczne”, mam na myśli, że owo zjawisko zachodzi całkowicie w naszych głowach, a nie w otaczającym nas świecie; jest wynikiem sekwencji zdarzeń umysłowych, która prowadzi do powstania całkowicie subiektywnego, wewnętrznego wyobrażenia lub wrażenia. Fale dźwiękowe – cząsteczki powietrza drgające z różną częstotliwością – same w sobie nie mają wysokości. Można zmierzyć ich ruch i wychylenie, ale do tego, by przełożyć je na owo wewnętrzne wrażenie, które nazywamy wysokością dźwięku, potrzebny jest mózg człowieka (lub zwierzęcia).

Kolor postrzegamy podobnie, co pierwszy zauważył Isaac Newton. (Newton jest oczywiście znany z tego, że odkrył, na czym polega grawitacja, a także opracował, równocześnie z Leibnizem, rachunek różniczkowy i całkowy. Podobnie jak Einstein Newton był bardzo kiepskim uczniem, a nauczyciele często skarżyli się, że jest rozkojarzony).

Newton pierwszy zwrócił uwagę na to, że światło jest bezbarwne, w związku z czym kolor musi powstawać w mózgu. Pisał: „Fale nie mają koloru”. Od tego czasu przekonaliśmy się, że fale światła charakteryzują się tym, że drgają z różną częstotliwością, a kiedy docierają do siatkówki patrzącego, zapoczątkowują łańcuch zdarzeń neurochemicznych, których rezultatem jest obraz powstający w naszym umyśle, nazywany przez nas kolorem. Najważniejszy wniosek jest taki, że to, co postrzegamy jako kolor, nie składa się z koloru. Jabłko może wyglądać, jakby było czerwone, ale jego atomy nie są czerwone. Podobnie rzecz ma się na przykład z ciepłem, które, jak zauważa filozof Daniel Dennett, nie składa się z ciepłych drobinek.

Budyń ma smak tylko wtedy, gdy wkładam go do ust – gdy styka się z moim językiem. W misce wstawionej do lodówki budyń nie ma smaku, tylko potencjalny smak. Ściany w kuchni nie są „białe”, gdy mnie tam nie ma. Oczywiście nadal jest na nich farba, ale kolor występuje tylko wtedy, gdy mam z nimi kontakt wzrokowy.

Fale dźwiękowe docierają do błon bębenkowych i małżowin usznych, zapoczątkowując łańcuch zdarzeń mechanicznych i neurochemicznych, których skutkiem jest obraz powstający w naszym umyśle, nazywany przez nas wysokością dźwięku. Czy przewracające się drzewo w lesie wydaje dźwięki, jeśli nie ma w pobliżu nikogo, kto mógłby je usłyszeć? (To pytanie pierwszy zadał irlandzki filozof George Berkeley). Odpowiedź jest prosta: nie. Dźwięk to obraz powstający w naszym umyśle, tworzony przez mózg w reakcji na drganie cząsteczek. Tam, gdzie nie ma żadnego człowieka ani zwierzęcia, nie ma więc dźwięku o danej wysokości. Odpowiednie urządzenie pomiarowe może zarejestrować częstotliwość generowaną przez przewracające się drzewo, ale nie jest ona dźwiękiem o określonej wysokości, dopóki ktoś tego dźwięku nie usłyszy.

Żadne zwierzę nie słyszy dźwięków o każdej istniejącej częstotliwości – a kolory, które widzimy, stanowią tylko ułamek całego spektrum fal elektromagnetycznych. W teorii możliwe jest słyszenie dźwięków o drganiach wynoszących od niewiele ponad 0 do 100 000 i więcej cykli na sekundę, lecz każde zwierzę słyszy tylko część dźwięków z tego zakresu. Ludzie bez żadnego ubytku słuchu zwykle słyszą dźwięki z przedziału od 20 Hz do 20 000 Hz. Dźwięki z dolnej granicy tego zakresu przypominają niewyraźne dudnienie lub szuranie – jak wtedy, gdy słyszymy przejeżdżającą za oknem ciężarówkę (której silnik wydaje dźwięk o częstotliwości około 20 Hz) lub gdy w wymuskanym samochodzie z wyszukanym zestawem audio pełną parą pracują głośniki superniskotonowe (tzw. subwoofery). Niektóre częstotliwości – mniejsze od 20 Hz – są niesłyszalne dla ludzi, ponieważ ludzkie ucho nie jest na nie wrażliwe ze względu na swoje właściwości fizjologiczne. Bity, które słyszymy w utworze In da Club 50 Centa lub Express Yourself grupy N.W.A, są zbliżone do dolnej granicy zakresu naszego słuchu; końcówka piosenki A Day in Life na płycie kompaktowej z albumem Sgt. Pepper’s Lonely Hearts Club Band Beatlesów zawiera kilkusekundowy fragment o częstotliwości 15 kHz, niesłyszalny dla większości osób powyżej czterdziestego roku życia! (Gdyby Beatlesi uważali, że nie należy ufać nikomu po czterdziestce, ten utwór mógłby im służyć do weryfikacji znajomych; podobno Lennonowi chodziło tylko o to, żeby w jakiś sposób zainteresować tym albumem psy słuchaczy).

Zakres ludzkiego słuchu wynosi zasadniczo od 20 Hz do 20 000 Hz, co nie oznacza, że w takim samym zakresie odbieramy wysokość dźwięków. Choć słyszymy dźwięki w całym tym zakresie, nie wszystkie z nich brzmią jak muzyka. Innymi słowy, nie możemy jednoznacznie określić wysokości wszystkich dźwięków z całego zakresu słyszalności. Dla porównania, kolory w paśmie ultrafioletowym i podczerwonym nie są określone tak jak kolory w paśmie widzialnym. Na rysunku na stronie 33 pokazane są skale niektórych instrumentów muzycznych i powiązane z nimi częstotliwości. Dźwięk głosu mówiącego mężczyzny ma zwykle częstotliwość około 110 Hz, a mówiącej kobiety – około 220 Hz. Częstotliwość brzęczenia lamp fluorescencyjnych lub takiego, którego przyczyną jest niesprawna instalacja elektryczna, wynosi 60 Hz (w Ameryce Północnej; w Europie i państwach, w których obowiązują inne normy napięcia/prądu elektrycznego, może wynosić 50 Hz). Dźwięk wydawany przez śpiewaczkę, od którego pęka szklanka, może mieć częstotliwość 1000 Hz. Szklanka pęka, ponieważ charakteryzuje się określoną częstotliwością drgań własnych, podobnie jak wszystkie przedmioty. Aby to usłyszeć, wystarczy prztyknąć palcem w szklankę albo, jeśli jest zrobiona ze szkła kryształowego, przejechać mokrym palcem po jej okrągłej krawędzi. Gdy śpiewaczka osiąga właściwą częstotliwość – częstotliwość drgań szklanki – cząsteczki, z których zbudowana jest ta szklanka, drgają z naturalną dla nich prędkością, przez co rozdzielają się od siebie.

Typowy fortepian ma osiemdziesiąt osiem klawiszy. Bardzo rzadko instrumenty te wyposażone są w kilka dodatkowych klawiszy, a pianina elektroniczne, organy i syntezatory mogą mieć tylko dwanaście klawiszy lub dwadzieścia cztery klawisze, ale to są wyjątki. Najniższy dźwięk klawisza typowego fortepianu ma częstotliwość 27,5 Hz. Co ciekawe, podobna prędkość drgań stanowi istotną wartość progową widzenia. Sekwencja fotografii filmowych – slajdów – wyświetlanych z taką lub podobną szybkością wywołuje wrażenie ruchu. „Ruchomy obraz” to sekwencja kadrów pokazywanych z szybkością (dwudziestu dwóch klatek na sekundę), która przekracza możliwości rozróżniania ich przez układ wzrokowy człowieka. Podczas wyświetlania zdjęć nagranych na taśmie filmowej o szerokości 35 mm obrazy są pokazywane przez mniej więcej jedną czterdziestą ósmą sekundy naprzemiennie z czarnymi klatkami o zbliżonej długości, co wiąże się z przesuwaniem kolejnych kadrów filmu w obiektywie projektora. Widzimy płynny, ciągły ruch, choć w rzeczywistości nic takiego nie jest nam pokazywane. (Stare filmy zdają się migotać, ponieważ zostały zapisane ze zbyt małą szybkością – wynoszącą od szesnastu do osiemnastu klatek na sekundę – aby nasz układ wzrokowy nie wychwytywał przerw między kadrami). Gdy cząsteczki drgają ze zbliżoną szybkością, słyszymy coś, co przypomina ciągły dźwięk. Kiedy w dzieciństwie montowaliśmy karty do gry przy kołach naszych rowerów, mieliśmy do czynienia z podobną zasadą. Jadąc powoli, słyszeliśmy klekot karty uderzającej w kolejne szprychy, ale gdy przyspieszaliśmy, przekraczając określoną prędkość, poszczególne stuknięcia zlewały się w szum, czyli dźwięk, który można zanucić; dźwięk o określonej wysokości.

Gdy wybrzmiewa najniższa nuta fortepianu, powodując drgania o częstotliwości 27,5 Hz, większość ludzi nie słyszy dźwięku o tak wyraźnej wysokości jak te wygrywane na klawiszach znajdujących się bliżej środka klawiatury. Najniższe i najwyższe dźwięki na klawiaturze dla wielu ludzi brzmią niewyraźnie, jeśli rozpatrywać je pod względem wysokości. Kompozytorzy o tym wiedzą, w związku z czym korzystają z tych nut lub ich unikają, w zależności od tego, jaki rezultat chcą uzyskać w swoim utworze i jakie emocje nim wywołać. Dźwięki o częstotliwościach przewyższających częstotliwość najwyższego dźwięku na klawiaturze fortepianu, a więc od 6000 Hz w górę, dla większości ludzi brzmią jak piskliwy gwizd. Powyżej 20 000 Hz ludzie najczęściej nie słyszą nic, a przed sześćdziesiątką wielu dorosłych przestaje słyszeć większość dźwięków o częstotliwości wyższej niż około 15 000 Hz, co jest spowodowane twardnieniem komórek rzęsatych w uchu środkowym. Dlatego kiedy mówimy o gamie dźwięków, czyli ograniczonym fragmencie klawiatury, za pomocą którego uzyskuje się dźwięki o najbardziej wyrazistej wysokości, mamy na myśli mniej więcej trzy czwarte wszystkich dźwięków na klawiaturze, o częstotliwościach od około 55 Hz do 2000 Hz.

Wysokość dźwięku to jeden z podstawowych środków służących do wyrażania emocji w muzyce. Nastrój, podekscytowanie, spokój, romantyczność i niebezpieczeństwo można zasygnalizować za pomocą wielu czynników, spośród których najważniejsza jest między innymi właśnie wysokość dźwięku. Jeden wysoki dźwięk może wyrazić podniecenie, a jeden niski – smutek. Dźwięki powiązane z sobą tworzą bardziej poruszające i mniej oczywiste przekazy. Melodie opierają się na schematach zbudowanych z następujących po sobie dźwięków lub wzajemnych relacjach zachodzących między nimi w czasie; większość ludzi bez trudu rozpoznaje znaną melodię zagraną w niższej lub wyższej niż zwykle tonacji. Właściwie wiele melodii nie ma „prawidłowej” wysokości początkowej i dryfuje w przestrzeni, rozpoczynając się od dowolnie wysokiego dźwięku, jak na przykład piosenka Happy Birthday. Melodię można zatem postrzegać między innymi jako pewien abstrakcyjny wzorzec oparty na specyficznym połączeniu tonacji, tempa, instrumentacji i tak dalej. Psycholog kognitywista powiedziałby, że melodia to obiekt słuchowy, który zachowuje odrębność wbrew przekształceniom, podobnie jak krzesło zachowuje swoją odrębność, nawet gdy przestawimy je na drugi koniec pokoju, odwrócimy do góry nogami lub pomalujemy na czerwono. Przykładowo więc kiedy piosenka, którą znamy, odtwarzana jest głośniej, niż jesteśmy do tego przyzwyczajeni, mimo to rozpoznajemy, co to za utwór. To samo dotyczy zmieniania bezwzględnych wysokości dźwięków danej piosenki, które można modyfikować, pod warunkiem że zachowane zostaną odległości między tymi dźwiękami.

Pojęcie względnej wysokości dźwięków łatwo zobrazować, zwracając uwagę na to, jak mówimy. Kiedy zadajemy pytanie, ton naszego głosu wznosi się w naturalny sposób pod koniec wypowiedzi, sygnalizując, że pytamy. Nie staramy się jednak, aby nasz głos osiągnął określoną wysokość. Wystarczy, że zakończymy zdanie nieco wyżej, niż je zaczęliśmy. Tak jest przyjęte w języku angielskim (ale nie w każdym innym – musimy się tego nauczyć), a w językoznawstwie zjawisko to określa się mianem prozodii. Podobną konwencję stosuje się w muzyce komponowanej według tradycji zachodniej. Określone sekwencje dźwięków o danych wysokościach uspokajają, a inne wywołują podekscytowanie. Powolne i głównie stopniowe opadanie melodii w utworze Poranek z I suity Peer Gynt Griega niesie ukojenie, za to w chromatycznych, wznoszących sekwencjach dźwięków (poprzeplatanych sporadycznymi swawolnymi interwałami opadającymi) zawartych w Tańcu Anitrypochodzącym z tej samej suity wyczuwamy ożywienie i poruszenie. Na poziomie naszego mózgu jest to możliwe przede wszystkim dzięki nauce – tak samo dzięki temu, że się tego nauczyliśmy, wiemy, że ton wznoszący oznacza pytanie. Każdy z nas ma wrodzoną zdolność uczenia się różnic językowych i muzycznych charakterystycznych dla kultury, z której wyrastamy, a obcowanie z muzyką występującą w tej kulturze kształtuje nasze szlaki nerwowe, sprawiając, że ostatecznie przyswajamy zbiór zasad, na których opiera się dana tradycja muzyczna.

Poszczególne instrumenty wykorzystują różne części osiągalnego zakresu wysokości dźwięków. W przypadku fortepianu ta część jest największa, co widać na wcześniejszej ilustracji. Pozostałe instrumenty wykorzystują pewne podzbiory wysokości osiągalnych dźwięków, co z kolei wpływa na wykorzystanie ich do przekazywania emocji. Flet piccolo, który wydaje wysokie, przenikliwe dźwięki podobne do ptasich zaśpiewów, najczęściej tworzy nastrój lekkości i radości, bez względu na to, jakie nuty są na nim wygrywane. Z tego powodu kompozytorzy zwykle wykorzystują flet piccolo do tworzenia muzyki, która jest radosna, a także takiej, która pobudza, jak w marszach Sousy. Z kolei Prokofiew w Piotrusiu i wilku za pomocą fletu oddał naturę ptaka, a za pomocą waltorni – wilka. Odrębność poszczególnych bohaterów Piotrusia i wilka wyrażona jest barwą poszczególnych instrumentów, a każdy z tych bohaterów ma swój motyw przewodni – frazę lub figurę melodyczną towarzyszącą każdorazowemu wystąpieniu danej idei, osoby lub sytuacji. (Takie rozwiązanie jest szczególnie charakterystyczne dla Wagnerowskiego dramatu muzycznego). Kompozytor tworzący tzw. smutne sekwencje dźwięków zdecydowałby się na przypisanie ich fletowi piccolo tylko wówczas, gdyby chciał wypowiedzieć się w sposób ironiczny. Ciężkie, głębokie brzmienie tuby lub kontrabasu często jest wykorzystywane do stworzenia atmosfery podniosłości, doniosłości lub powagi.

Ile jest wysokości dźwięków? Jako że wysokość dźwięku jest elementem pewnego kontinuum – kontinuum częstotliwości drgań cząsteczek – technicznie rzez biorąc liczba wysokości dźwięków jest nieskończona. Bez względu na to, jakie dwie częstotliwości weźmiemy pod uwagę, między nimi zawsze znajdzie się miejsce na jeszcze jedną, która teoretycznie oznaczałaby dźwięk o innej wysokości. Jednak nie każda zmiana częstotliwości powoduje zauważalną zmianę wysokości dźwięku, tak jak umieszczenie ziarenka piasku w plecaku nie sprawia, że waga tego plecaka zmienia się w odczuwalny sposób. W związku z tym nie wszystkie zmiany częstotliwości są przydatne pod względem muzycznym. Ludzie w różnym stopniu potrafią wskazać niewielkie zmiany częstotliwości; taką zdolność można wyćwiczyć, ale zasadniczo w muzyce większości kultur nie wykorzystuje się odstępów mniejszych niż półton, a większość ludzi nie potrafi bezbłędnie wskazać różnic wynoszących mniej niż jedna dziesiąta półtonu.

Zdolność wskazywania różnic w wysokości dźwięków wynika z fizjologii i jest inna u poszczególnych zwierząt. Jak to się dzieje, że my, ludzie, potrafimy odróżniać dźwięki o różnej wysokości? Na błonie podstawowej w uchu środkowym znajdują się komórki rzęsate, które reagują na częstotliwości w sposób selektywny, wytwarzając impulsy wyłącznie w określonym zakresie częstotliwości. Komórki rzęsate rozmieszczone są na całej błonie podstawowej zgodnie z tym zakresem; dźwięki o niskich częstotliwościach pobudzają komórki rzęsate na jednym krańcu błony podstawowej, dźwięki ze średniego zakresu częstotliwości pobudzają komórki rzęsate znajdujące się na środku tej błony, a dźwięki o wysokich częstotliwościach – komórki na jej drugim krańcu. Możemy sobie wyobrazić, że na błonie podstawowej rozłożona jest mapa dźwięków o różnych wysokościach przypominająca klawiaturę fortepianu. Ponieważ w topografii błony podstawowej rozmieszczone są poszczególne tony, mówimy o mapie tonotopicznej.

Kiedy dźwięki dobiegają ucha, mijają błonę podstawową, na której reagują na nie niektóre komórki rzęsate, w zależności od częstotliwości tych dźwięków. Błona działa niczym lampa z czujnikiem ruchu w ogrodzie; aktywność w określonej części błony sprawia, że przesyła ona impuls elektryczny do kory słuchowej. W korze słuchowej również znajduje się mapa tonotopiczna z tonami od niskich do wysokich rozmieszczonymi na warstwie korowej. W tym sensie mózg również zawiera „mapę” dźwięków o poszczególnych wysokościach, a poszczególne obszary w mózgu reagują na odrębne dźwięki. Wysokość dźwięku jest na tyle istotna, że bezpośrednio ją odzwierciedla; w odróżnieniu od większości pozostałych cech muzyki moglibyśmy umieścić elektrody na mózgu i wskazać na podstawie jego aktywności dźwięki, o jakiej wysokości słyszy dana osoba. To paradoks, że choć istotą muzyki są związki pomiędzy dźwiękami o poszczególnych wysokościach, a nie bezwzględne wartości wysokości dźwięku, to właśnie na te bezwzględne wartości zwraca uwagę mózg na poszczególnych etapach przetwarzania.

Owo bezpośrednie odzwierciedlenie wysokości dźwięków jest na tyle istotne, że warto to powtórzyć. Gdybym umieścił elektrody na waszej korze wzrokowej (czyli części mózgu położonej z tyłu głowy, która odpowiada za widzenie), a następnie pokazał wam pomidora, żadna grupa neuronów nie sprawiłaby, że elektrody zrobiłyby się czerwone. Lecz gdybym umieścił elektrody na waszej korze słuchowej i zagrał wam czysty dźwięk o częstotliwości 440 Hz, określone neurony w waszej korze słuchowej wysłałyby impuls o identycznej częstotliwości, a elektrody wykazałyby aktywność elektryczną o częstotliwości 440 Hz – w przypadku wysokości dźwięku to samo, co wchodzi uchem, wychodzi przez mózg!

Skalato po prostu podzbiór dźwięków o teoretycznie nieskończonej liczbie wysokości, który wyznaczany jest w każdej kulturze albo na podstawie tradycji nawiązującej do jej przeszłości, albo dość dowolnie. Dźwięki o wybranych wysokościach zostają następnie wyróżnione jako elementy danego systemu muzycznego, a ich wyróżnikami są litery, które można też zobaczyć na powyższej ilustracji. Nazwy „A”, „H”, „C” i tak dalej to przypadkowe oznaczenia kojarzone z poszczególnymi częstotliwościami. W muzyce Zachodu – wywodzącej się z tradycji europejskiej – dźwięki o tych częstotliwościach to jedyne „usankcjonowane” dźwięki; większość instrumentów jest tak zbudowana, aby za ich pomocą wydobywać właśnie te, a nie inne dźwięki. (Wyjątkami są instrumenty w rodzaju puzonu i wiolonczeli, ponieważ grając na nich, można płynnie przechodzić z jednej nuty w inną; puzoniści, wiolonczeliści, skrzypkowie i inni muzycy z tej grupy poświęcają wiele czasu, ucząc się, jak słyszeć i wytwarzać dźwięki o dokładnie takich częstotliwościach, jakie są potrzebne do zagrania poszczególnych usankcjonowanych nut). Dźwięki pomiędzy nimi uważa się za błędne („fałszywe”), chyba że służą intonacji ekspresyjnej (która polega na celowym i krótkotrwałym zafałszowaniu dla podkreślenia napięcia emocjonalnego) lub przejściu od jednej usankcjonowanej nuty do kolejnej.

Strojenie dotyczy ścisłej relacji między częstotliwością granego tonu a częstotliwością wzorcową lub między co najmniej dwoma granymi jednocześnie tonami. Muzycy orkiestrowi, którzy „stroją się” przed występem, synchronizują swoje instrumenty (które z natury stroją różnie, ponieważ drewno, metal, struny i inne materiały rozszerzają się lub kurczą pod wpływem temperatury i wilgoci) z częstotliwością wzorcową, a i zdarza się, że nie ze wzorcem, ale między sobą. Doświadczeni muzycy często zmieniają częstotliwość tonów podczas wykonywania muzyki, aby zwiększyć siłę wyrazu swojej gry (co oczywiście nie dotyczy instrumentów o niezmiennych wysokościach dźwięków, takich jak keyboardy i wibrafony); umiejętne zagranie jakiejś nuty nieznacznie wyżej lub niżej od jej wartości nominalnej może stanowić formę wyrażenia uczuć. Doświadczeni muzycy występujący wspólnie w zespole zmieniają też wysokość granych tonów, aby dostosować je do tonów granych przez pozostałych muzyków, jeśli jednemu lub kilkorgu z nich w trakcie wykonania zdarzy się odejść od stroju wzorcowego.

Nazwy nut w muzyce na Zachodzie zapisuje się literami od A do G lub systemem alternatywnym, czyli do – re – mi – fa – sol – la – si – do (na tym systemie opiera się tekst piosenki Do Re Mi z musicalu Dźwięki muzykiRodgersa i Hammersteina: „Do jak dom, rodzinny dom, re jak rejs w daleki świat…”). Kolejne litery oznaczają dźwięki o coraz wyższej częstotliwości: H ma wyższą częstotliwość od A (a więc również większą wysokość), a C ma wyższą częstotliwość niż A i H. Po G wszystkie nazwy się powtarzają, poczynając od A. Nuty o tej samej nazwie oznaczają kolejne dźwięki o częstotliwości dwukrotnie wyższej (lub o połowę niższej). Jedna z nut opisanych literą A oznacza dźwięk o częstotliwości 110 Hz. Nuta oznaczająca dźwięk o częstotliwości o połowę niższej, a więc 55 Hz, również jest opisana jako A, podobnie jak nuta oznaczająca dźwięk o dwukrotnie wyższej częstotliwości, czyli 220 Hz. Podwajając częstotliwość, uzyskamy kolejne dźwięki A o częstotliwości 440 Hz, 880 Hz, 1760 Hz i tak dalej.

Na tym polega jedna z podstawowych właściwości muzyki. Nazwy nut się powtarzają, ponieważ percepcja dźwięków jest w pewnej mierze powiązana z podwajaniem częstotliwości i obniżaniem ich o połowę. Gdy dwukrotnie zwiększymy częstotliwość lub obniżymy ją o połowę, uzyskamy dźwięk zaskakująco zbliżony do dźwięku wyjściowego. Taka relacja dwóch dźwięków o stosunku częstotliwości 2 : 1 lub 1 : 2 nazywana jest oktawą. Jej znaczenie jest tak istotne, że pomimo dużych różnic między poszczególnymi kulturami muzycznymi – hinduską, balijską, europejską, bliskowschodnią, chińską i innymi – w każdej kulturze podstawowym pojęciem muzycznym jest oktawa, nawet jeśli muzyka tej kultury ma niewiele wspólnego z innymi tradycjami muzycznymi. Z tego zjawiska wzięło się pojęcie cyrkularności dźwięków, które jest zbliżone do cyrkularności barw. Choć kolory czerwony i fioletowy znajdują się na przeciwległych końcach kontinuum częstotliwości w zakresie tej części promieniowania elektromagnetycznego, które nazywamy światłem widzialnym, postrzegamy je jako podobne do siebie. Tak samo rzecz ma się w muzyce, o której często się mówi, że ma dwa wymiary: jeden, w którym tony mają coraz większą częstotliwość (i brzmią coraz wyżej), oraz drugi, w którym za każdym razem, gdy podwaja się częstotliwość tonu, mamy wrażenie, że niejako znowu jesteśmy w domu.

Gdy kobiety i mężczyźni mówią jednocześnie, ich głosy zwykle dzieli oktawa, nawet jeśli starają się mówić identycznie pod względem wysokości. Dzieci zwykle mówią o oktawę lub dwie wyżej od dorosłych. Dwie pierwsze nuty melodii Over the Rainbow (z filmu Czarnoksiężnik z krainy Oz) autorstwa Harolda Arlena tworzą oktawę. W piosence Hot Fun in the Summertime grupy Sly and the Family Stone wokalista Sly i chórek śpiewają oktawami w pierwszej linijce tekstu: „End of the spring and here she comes back”. Gdy zwiększamy częstotliwość, wygrywając kolejne nuty na instrumencie, mamy bardzo silne poczucie, że wraz z osiągnięciem częstotliwości dwukrotnie wyższej od częstotliwości początkowej „wracamy do domu”. Oktawa jest na tyle podstawowym pojęciem, że nawet niektóre gatunki zwierząt – na przykład małpy i koty – zwracają uwagę na równoważność oktaw, czyli słyszą podobieństwo dźwięków oddalonych od siebie o taką wartość, podobnie jak ludzie.

Interwał to odległość między dwoma tonami. Oktawa w muzyce Zachodu dzieli się na dwanaście tonów w (logarytmicznie) równych odstępach. Odstęp interwałowy między nutami A i H (czyli „do” i „re”) nazywany jest całym tonem lub tonem. (Ten ostatni termin jest mylący, ponieważ tonem nazywamy każdy dźwięk w muzyce; dla uniknięcia dwuznaczności będę stosował termin cały ton). Najmniejszy podział występujący w układzie gamy obowiązującym na Zachodzie niejako przecina cały ton na połowę, tworząc półton, który stanowi jedną dwunastą oktawy. (…)

Interwały stanowią podstawę melodii, wpływając na jej kształt w dużo większym stopniu niż wysokość poszczególnych nut; melodię przetwarzamy w sposób relacyjny, a nie bezwzględny, co oznacza, że rozpoznajemy ją na podstawie interwałów, a nie nut tworzących interwały. Cztery półtony zawsze tworzą interwał zwany tercją wielką, bez względu na to, czy pierwszą nutą jest A, G♯ lub inna nuta. W tabeli podane są interwały stosowane w naszym (zachodnim) systemie muzycznym.

Ta tabela mogłaby być dłuższa: odległość trzynastu półtonów to nona mała, czternastu półtonów – nona wielka i tak dalej, lecz te nazwy stosuje się zwykle w specjalistycznych opracowaniach. Kwarta czysta i kwinta czysta nazywane są w ten sposób, ponieważ dla wielu ludzi brzmią szczególnie przyjemnie, a od czasów starożytnej Grecji właśnie te dwa rodzaje odstępów w gamie stanowią najważniejszy element muzyki w ogóle. (Nie ma „kwinty nieczystej” – kwinta czysta to po prostu nazwa nadana przez nas temu interwałowi). Bez względu na to, czy zupełnie pominiemy czyste kwinty i kwarty, czy będziemy stosować je w każdej frazie, to właśnie one stanowią trzon muzyki od co najmniej pięciu tysięcy lat.

Choć powstała mapa