Teoria gier. Krótkie Wprowadzenie 8 - Ken Binmore - ebook

Teoria gier. Krótkie Wprowadzenie 8 ebook

Ken Binmore

5,0
19,90 zł

lub
Opis

> KRÓTKIE WPROWADZENIE

- książki, które zmieniają sposób myślenia!

Interdyscyplinarna seria KRÓTKIE WPROWADZENIE piórem uznanych ekspertów skupionych wokół Uniwersytetu Oksfordzkiego przybliża aktualną wiedzę na temat współczesnego świata i pomaga go zrozumieć. W atrakcyjny sposób prezentuje najważniejsze zagadnienia XXI w. - od kultury, religii, historii przez nauki przyrodnicze po technikę. To publikacje popularnonaukowe, które w formule przystępnej, dalekiej od akademickiego wykładu, prezentują wybrane kwestie.

Książki idealne zarówno jako wprowadzenie do nowych tematów, jak i uzupełnienie wiedzy o tym, co nas pasjonuje. Najnowsze fakty, analizy ekspertów, błyskotliwe interpretacje.

Opiekę merytoryczną nad polską edycją serii sprawują naukowcy z Uniwersytetu Łódzkiego: prof. Krystyna Kujawińska Courtney, prof. Ewa Gajewska, prof. Aneta Pawłowska, prof. Jerzy Gajdka, prof. Piotr Stalmaszczyk.

*

 

Teoria gier znajduje zastosowanie nie tylko w dziedzinie biologii ewolucyjnej i ekonomii, lecz także rewolucjonizuje psychologię, psychiatrię i nauki polityczne. Sprawdza się w badaniach naukowych i w codziennym życiu. Czy przed podjęciem decyzji warto rzucić monetą? Kiedy opłaca się blefować? Czy pokerzyści lepiej się targują? Dlaczego John Nash, którego historia zainspirowała twórców filmu Piękny umysł, dostał Nobla?

Ebooka przeczytasz w aplikacjach Legimi lub dowolnej aplikacji obsługującej format:

EPUB
MOBI
PDF

Liczba stron: 240

Popularność




Tytuł ‌oryginału:Game ‌Theory: A Very ‌Short Introduction

Rada Naukowa serii ‌Krótkie Wprowadzenie

Jerzy Gajdka, ‌Ewa Gajewska, Krystyna ‌Kujawińska Courtney ‌Aneta Pawłowska,Piotr Stalmaszczyk

Redaktorzy ‌inicjujący serii Krótkie ‌Wprowadzenie

Urszula ‌Dzieciątkowska, ‌Agnieszka Kałowska

Tłumaczenie

Iwona ‌Konarzewska

Redakcja

Aurelia ‌Hołubowska

Skład i łamanie

Munda – ‌Maciej Torz

Projekt typograficzny serii

Tomasz ‌Przybył

Game Theory: ‌A Very Short ‌Introductionwas ‌originally published ‌in ‌English ‌in 2007.This translation ‌is published by arrangement ‌with Oxford University ‌Press. ‌Wydawnictwo ‌Uniwersytetu Łódzkiegois ‌solely responsible for ‌this ‌translation ‌from ‌the original work and ‌Oxford University Press ‌shall ‌have ‌no liability ‌for any errors, omissions ‌or inaccuracies ‌or ambiguities ‌in such translation or ‌for any losses caused ‌by ‌reliance thereon

© Copyright ‌by Ken ‌Binmore 2007

© Copyright for ‌this ‌edition by Uniwersytet Łódzki, ‌Łódź ‌2017

© ‌Copyright for Polish translation ‌by Iwona Konarzewska, ‌Łódź 2017

Publikacja sfinansowana ‌ze środków Wydawnictwa ‌Uniwersytetu Łódzkiego

Wydane przez ‌Wydawnictwo Uniwersytetu ‌Łódzkiego

Wydanie I. ‌W.07585.16.0.M

Ark. wyd. 8,0; ark. ‌druk. 13,0

Paperback ISBN ‌Oxford University Press: ‌978-0-19-921846-2

ISBN 978-83-8088-594-3

e-ISBN 978-83-8088-595-0

Wydawnictwo ‌Uniwersytetu Łódzkiego

90-131 Łódź, ul. ‌Lindleya 8

www.wydawnictwo.uni.lodz.pl

e-mail: ksiegarnia@uni.lodz.pl

tel. (42) ‌665 58 63

Dla ‌Petera i Niny

Spis ilustracji

Orzeł-czy-reszkaTablice ‌wypłatWypłaty liczboweGry z mieszanymi motywacjamiJames ‌Dean

© 2004 ‌TopFoto

John ‌Nash

© Robert ‌P. ‌Matthews / Princeton ‌University ‌/ Getty Images

Dwie ‌wersje ‌dylematu więźniaToczące się ‌kości

© iStockphoto

Nauka gry ‌w ‌równowagęDwie gry planszowePorwanieMiłe ‌porwanieMinigra ultimatumEwolucyjne dostosowanie w minigrze ultimatumUproszczony paradoks sieci handlowejDavid Hume

© Hulton Archive / Getty Images

Gra Schellinga solitaireGra polowanie na jelenia (ang. stag hunt)Wzajemne iskanie się przez szympansy

© Peter Arnold Inc. / Alamy

Twierdzenie ludowe (ang. folk theorem)Zbiory informacyjne w grze orzeł-czy-reszkaFull

© iStockphoto

Strategie maksiminowe w modelu pokera von NeumannaModel von NeumannaTablica wypłat dla modelu pokera von NeumannaNiekompletna informacja w grze w tchórzaSąd SalomonaPo raz pierwszy, po raz drugi, sprzedano!

© Hiu Yin Leung / Fotolia

Dynamika replikatorów w grze jastrząb-gołąb (ang. hawk-dove)Dylemat więźnia w przypadku graczy spokrewnionychNietoperz wampirGra jastrząb-gołąb-mścicielRozwiązanie arbitrażowe NashaMit jawnej skłonnościDwie próby spełnienia postulatów NewcombaTrzy damy ze Środkowego Zachodu

© Library of Congress, Prints and Photographs Division, FSA-OW1 Collection (reproduction no. LC-USF33-012381-M5 DLC)

Paradoks Monty’ego Halla

Wydawca i autor przepraszają za ewentualne błędy lub pominięcia w powyższym spisie. W przypadku ich zgłoszenia, wprowadzą zmiany przy najbliższej okazji.

Rozdział 1

Nazwa gry

Czym zajmuje się teoria gier?

W czasie gdy moja żona była poza domem na sympatycznej jednodniowej konferencji w Toskanii, trzy młode kobiety zaprosiły mnie, abym dzielił z nimi stół w czasie lunchu. Gdy usiadłem, jedna z nich odezwała się zmysłowym głosem: „Naucz nas, jak grać w miłość”. Okazało się jednak, że wszystko, czego oczekiwały, to porada, jak postępować z włoskimi chłopakami. Wciąż myślę, że popełniły błąd, odrzucając moje sugestie dotyczące strategii, jednak miały rację, przyjmując za rzecz oczywistą, że zaloty są jedną z wielu różnych rodzajów gier, w które gramy w realnym życiu.

Kierowcy manewrujący w czasie dużego ruchu grają w grę kierowców. Licytujący na eBayu, polując na okazje cenowe, grają w grę aukcyjną. Firma i związek zawodowy negocjujący wysokość płac na następny rok grają w grę przetargową. Oponenci decydujący o kształcie programu politycznego podczas wyborów grają w grę polityczną. Właściciel sklepu spożywczego podejmujący decyzję o cenie płatków kukurydzianych w danym dniu gra w gę ekonomiczną. Mówiąc krótko: gra pojawia się zawsze, gdy tylko ludzie wchodzą w interakcję.

Antoniusz i Kleopatra rozgrywali grę miłosną na wielką skalę. Bill Gates zdobył ogromny majątek, grając w grę software’u komputerowego. Adolf Hitler i Józef Stalin grali w grę, która spowodowała śmierć znaczącej części populacji świata. Chruszczow i Kennedy w czasie kryzysu kubańskiego rozgrywali grę, która w efekcie mogła zmieść z powierzchni Ziemi nas wszystkich.

Mając tak wiele zastosowań, teoria gier mogłaby być panaceum, jeżeli tylko można byłoby zawsze przewidzieć, w jaki sposób ludzie grają w grach, które składają się na życie społeczne. Jednakże teoria gier nie może rozwiązać wszystkich problemów świata, ponieważ jej zasady działają tylko wówczas, gdy ludzie grają w sposób racjonalny. Nie może więc przewidzieć zachowania chorych z miłości nastolatków, jak Romeo i Julia, lub szaleńców, jak Hitler i Stalin. Ludzie jednak nie zawsze zachowują się irracjonalnie i nie traci się czasu, badając, co się dzieje, gdy postępują w sposób przemyślany. Większość z nas przynajmniej stara się wydawać pieniądze w sposób rozsądny i zwykle nie postępuje na tyle niemądrze, aby teoria ekonomii przestała mieć rację bytu.

Nawet gdy ludzie nie przemyśleli wszystkiego z wyprzedzeniem, nie oznacza to, że na pewno postąpią nieracjonalnie. Teoria gier odniosła kilka znaczących sukcesów w wyjaśnianiu zachowania pająków i ryb, których nawet nie podejrzewa się o myślenie. Takie nierozumne zwierzęta zachowują się, jak gdyby były istotami racjonalnymi, ponieważ konkurenci, zaprogramowani genetycznie, aby zachowywać się nieracjonalnie, wyginęli. Podobnie firmy nie zawsze są zarządzane przez osoby o wielkim intelekcie. Rynek jest jednak zwykle równie bezwzględny jak natura i eliminuje niedostosowanych.

Czy teoria gier działa?

Pomimo teoretycznych sukcesów w praktyce ludzie biznesu zwykle odrzucali teorię gier jako jeden z bardziej nieprzydatnych działów nauk społecznych. Zmienili zdanie niemal z dnia na dzień, kiedy rząd amerykański podjął decyzję o zorganizowaniu aukcji częstotliwości radiowych w telefonii komórkowej.

Ze względu na brak uznanych ekspertów-praktyków porady teoretyków z zakresu teorii gier okazały się kluczowe dla stworzenia projektu reguł gier aukcyjnych, które zostały zastosowane w tym przypadku. W wyniku tego podatnik amerykański zyskał 20 miliardów dolarów – ponad dwukrotnie więcej niż oczekiwano. Jeszcze więcej udało się zyskać w późniejszej licytacji w Wielkiej Brytanii, za którą byłem odpowiedzialny. Na jednej tylko aukcji zarobiliśmy w sumie 35 miliardów dolarów. W konsekwencji magazyn „Newsweek” napisał o mnie, że jestem bezwzględnym ekonomistą-pokerzystą, który zniszczył przemysł telekomunikacyjny!

Jak się okazało, przemysł telekomunikacyjny przetrwał. Poza tym czerpanie zysków z licencji, za które przemysł telekomunikacyjny płaci tyle, ile są warte, wcale nie jest bezlitosne. Zwłaszcza gdy pieniądze przeznaczane są na szpitale dla tych, którzy nie mogą sobie pozwolić na prywatną opiekę medyczną. A jeśli chodzi o pokera, to minęło co najmniej 20 lat od czasu, gdy grałem o więcej niż pięcio- i dziesięciocentówki. Jedyną rzeczą, co do której „Newsweek” miał rację, jest to, że teoria gier naprawdę działa, gdy jest stosowana przez ludzi, którzy są świadomi tego, co robią. Działa nie tylko w ekonomii, ale również w biologii ewolucyjnej i w naukach politycznych. W mojej książce Natural Justice, gdy mówię o etyce, stosując teorię gier, obrażam nawet ortodoksyjnych filozofów moralności.

Proste gry

Każda nowa wielomiliardowa aukcja telekomunikacyjna musi być „przykrojona” na miarę okoliczności, w których ma być przeprowadzona. Nie można po prostu użyć gotowego projektu, jak zdążył się zorientować rząd amerykański, zatrudniając dom aukcyjny Sotheby’s w celu przeprowadzenia aukcji zestawu transponderów satelitarnych. Nikt nie może jednak ująć wszystkich skomplikowanych szczegółów nowego rynku telekomunikacyjnego w modelu matematycznym. Projektowanie aukcji telekomunikacyjnej jest w związku z tym zarówno sztuką, jak i nauką. Dokonuje się ekstrapolacji na podstawie prostego modelu wybranego dla przybliżenia najistotniejszych właściwości problemu.

Chciałbym zrobić to samo w niniejszej książce, która nie zawiera formuł algebraicznych i w której ograniczyłem żargon techniczny do minimum. Zajmuję się w niej tylko grami, odsuwając na bok wszystkie dodatkowe elementy, które je komplikują w realnym życiu.

1. Orzeł-czy-reszka. Problem decyzyjny Alice i Boba

Konflikt i kooperacja

Większość gier w niniejszej książce jest rozgrywana przez zaledwie dwójkę graczy, których nazwiemy Alice i Bob. Pierwsza gra, jaką rozegrają, to orzeł-czy-reszka.

Sherlock Holmes i zły profesor Moriarty, zmierzając do ostatecznej konfrontacji nad wodospadem Reichenbach, grali w orła-czy-reszkę. Holmes musiał zadecydować, na której stacji wysiąść z pociągu. Moriarty musiał podjąć decyzję, na której stacji czekać. Odpowiednikiem tej gry w prawdziwym życiu jest gra pomiędzy nieuczciwymi księgowymi a audytorami. Jeden decyduje, kiedy oszukać, drugi podejmuje decyzję, kiedy sprawdzić księgi rachunkowe.

W naszej, szkolnej wersji gry Alice i Bob pokazują monety. Alice wygrywa, jeżeli obie z nich są odwrócone tą samą stroną do góry. Bob wygrywa, gdy każda z monet jest odwrócona inną stroną do góry. Zarówno Alice, jak i Bob mają dwie strategie: orzeł i reszka. Na ilustracji 1 przedstawiono, kto wygrywa lub ponosi porażkę w przypadku wszystkich możliwych kombinacji strategii. Te wyniki to tak zwane wypłaty w grze. Ikony: kciuk w górę i kciuk w dół zostały użyte dla podkreślenia, że wypłaty nie muszą być mierzone w jednostkach pieniężnych.

Ilustracja 2 przedstawia, w jaki sposób całość informacji zawartej na ilustracji 1 można przenieść do tablicy wypłat, w której wypłata dla Alice znajduje się w lewym dolnym (południowo-zachodnim) rogu każdej komórki, a dla Boba w prawym górnym (północno-wschodnim) rogu. Pokazuje ona także dwuosobową wersję gry samochodowej, w którą gramy każdego ranka, wsiadając do naszych samochodów, aby dotrzeć do pracy. Alice i Bob mają ponownie dwie strategie, w prawo i w lewo, ale tym razem wypłaty graczy są jednakowe, inaczej niż w poprzedniej grze, w której były diametralnie różne. Gdy dziennikarze mówią o sytuacji, w której wygrywają wszystkie strony, mają na myśli coś w rodzaju gry samochodowej.

2. Tablice wypłat. Alice wybiera wiersz, a Bob wybiera kolumnę

Von Neumann

Pierwszą zdobyczą teorii gier było twierdzenie minimaksowe Johna von Neumanna mające zastosowanie tylko do gier typu orzeł-czy-reszka, w których gracze są nieprzejednanymi wrogami. Można jeszcze przeczytać lekceważące komentarze na temat teorii gier, w których von Neumann jest przedstawiany karykaturalnie jako archetypowy zimny wojownik – taki jak doktor Strangelove ze znanego filmu1. Mówi się w nich, że tylko szalony strateg wojskowy mógłby pomyśleć o zastosowaniu teorii gier w prawdziwym życiu, ponieważ jedynie szaleniec lub cyborg mógłby popełnić błąd przy założeniu, że życie jest grą czysto konfliktową.

Von Neumann był wszechstronnym geniuszem. Tworzenie teorii gier było dla niego jedynie dodatkowym zajęciem. Prawdą jest, że w czasie zimnej wojny był jastrzębiem (nie gołębiem), ale daleko było mu do szalonego cyborga – stanowił uosobienie geniusza, który lubił przyjęcia i zabawę. Tak jak ty i ja wolał kooperację od konfliktu, ale rozumiał, że droga do osiągnięcia porozumienia nie polega na udawaniu, że ludzie nie mogą czasem zyskać poprzez stwarzanie kłopotów.

Kooperacja i konflikt są dwiema stronami tego samego medalu i żadne z nich nie może być właściwie zrozumiane bez uwzględnienia drugiego. Rozważanie gry czysto konfliktowej, jak orzeł-czy-reszka, nie polega na utrzymywaniu, że wszystkie ludzkie interakcje są konkurencyjne. Z drugiej strony nikt nie twierdzi, przyglądając się czysto koordynacyjnej grze samochodowej, że wszystkie ludzkie interakcje są kooperacyjne. Wyodrębnia się po prostu dwa przeciwstawne aspekty zachowań ludzkich, aby móc badać je osobno.

Ujawnione preferencje

Stawiając jednocześnie czoła kooperacji i konfliktowi, musimy lepiej opisać motywacje graczy, niż mówiąc po prostu, że lubią wygrywać albo nie lubią przegrywać. W tym celu ekonomiści stworzyli ideę użyteczności. Pozwala ona każdemu graczowi przydzielić wartość liczbową dla każdego możliwego wyniku gry.

W biznesie końcowym wynikiem jest zwykle zysk, ale ekonomiści wiedzą, że ludzie mają często bardziej złożone cele od prostego zarabiania tylu pieniędzy, ile potrafią. Nie możemy zatem identyfikować użyteczności z pieniędzmi. Naiwnym substytutem jest zadowolenie z pieniędzy. Ale co to jest zadowolenie? Jak je mierzyć?

Tak się niefortunnie składa, że słowo „użyteczność”(ang. utility) historycznie wiąże się z wiktoriańskimi utylitarystami, jak Jeremy Bentham i John Stuart Mill. Współcześni ekonomiści nie naśladują ich w identyfikacji użyteczności jako odczuwania wielkości przyjemności czy też bólu. Nowoczesna teoria porzuca próby wyjaśnienia zachowań ludzi za pomocą opisu tego, co dzieje się w ich głowach. Przeciwnie, poczytuje sobie za cnotę nieczynienie żadnych założeń o charakterze psychologicznym2.

Nie zamierzamy tłumaczyć, dlaczego Alice lub Bob zachowują się tak, a nie inaczej. Zamiast teorii objaśniającej, musi nam wystarczyć teoria opisowa, która nie może powiedzieć więcej niż to, że Alice lub Bob będą działać niekonsekwentnie, jeżeli to-czy-tamto zrobili w przeszłości, ale planują postąpić tak-lub-inaczej w przyszłości. W teorii gier obserwuje się decyzje, które Alice i Bob podejmują (lub zamierzają podjąć), jeżeli nie komunikują się ze sobą lub z kimkolwiek innym, ale także rozważa się, jak zachowaliby się, gdyby mogli się porozumieć w trakcie rozgrywania gry.

Nie chcemy dowodzić, że pewne preferencje są bardziej racjonalne od innych. Przyjmujemy pogląd wielkiego filozofa Davida Hume’a, który uznał rozum za „niewolnika nałogów”. Jak ekstrawagancko zauważył, nie ma nic irracjonalnego w chęci zniszczenia całego świata, aby się podrapać w palec. Jednakże idziemy dalej tą drogą, uznając rozum za narzędzie pozwalające uniknąć nielogicznego zachowania. Każde logiczne zachowanie będzie traktowane jako racjonalne.

Przy pewnych założeniach działanie konsekwentne może być uznane za tożsame z działaniem mającym na celu maksymalizację jakiejś wartości. Czymkolwiek jest ta abstrakcyjna wartość w konkretnym przypadku, ekonomiści zwą ją użytecznością. Nie musi być związana z pieniędzmi, ale – choć przykro to mówić – zwykle jest.

Podejmowanie ryzyka

Działając konsekwentnie, Alice może nie być świadoma, że postępuje, jakby maksymalizowała coś, co zdecydowaliśmy się nazwać jej użytecznością. Jeżeli jednak chcemy przewidzieć jej zachowanie, musimy mieć możliwość pomiaru jej użyteczności na skali użyteczności, w podobny sposób jak pomiaru temperatury dokonuje się za pomocą termometru. Tak jak jednostki na termometrze nazywa się stopniami, możemy powiedzieć, że util jest jednostką na skali użyteczności Alice.

Ortodoksyjna ekonomia przyjmuje, że skale użyteczności kardynalnej są z natury rzeczy bezsensowne. Na szczęście von Neumann nie wiedział o tym, gdy Oskar Morgenstern zjawił się u niego w domu, narzekając, że w książce na temat teorii gier, którą pisali wspólnie, brak im właściwej podstawy dla obliczania wypłat liczbowych. Wobec tego von Neumann natychmiast sformułował koncepcję pomiaru tego, jak bardzo Alice czegoś pragnie, za pomocą rozmiaru ryzyka, jakie jest gotowa podjąć, aby to uzyskać. Następnie możemy wyliczyć, jakiego wyboru dokonałaby Alice w ryzykownych sytuacjach, biorąc pod uwagę opcję, która zapewni jej przeciętnie najwyższą użyteczność.

Teoria von Neumanna przyda się, jeżeli chcemy przypisać wielkość użyteczności wszystkiemu, co Alice chciałaby wycenić. Na przykład, ile utili Alice powinna przydzielić randce z Bobem?

Po pierwsze, musimy zdecydować, jaką skalę użyteczności zastosować. W tym celu należy wybrać dwa wyniki, które są odpowiednio lepsze lub gorsze od każdego innego wyniku, na jaki Alice może się natknąć. Te wyniki odpowiadają poziomom temperatur wrzenia i zamarzania wody, które zostały wybrane do skalibrowania termometru Celsjusza, z tym, że w skali użyteczności 0 utili zostaje przydzielone wynikowi najgorszemu, a 100 utili – najlepszemu. Następnie rozważa się pakiet biletów na loterię, w której jedynymi wypłatami są: wynik najlepszy albo najgorszy.

Kiedy oferujemy Alice bilety na loterię jako alternatywę dla randki z Bobem, ciągle zwiększając prawdopodobieństwo uzyskania najlepszego wyniku, sprawimy, że Alice w pewnym momencie zmieni zdanie z nie na tak. Jeżeli prawdopodobieństwo najlepszego wyniku w loterii, przy którym nastąpiła zmiana zdania, jest równe 75%, teoria von Neumanna mówi, że randka z Bobem jest dla Alice warta 75 utili. Każdy kolejny punkt procentowy dodany do prawdopodobieństwa indyferencji (prawdopodobieństwa równych preferencji dla obu oferowanych wariantów) odpowiada jednemu dodatkowemu utilowi.

Gdy niektórzy ludzie wykorzystują tę metodę, szacując sumę pieniędzy, zawsze przydzielają taką samą liczbę utili każdemu dodatkowemu dolarowi. Mówimy, że ludzie ci są neutralni względem ryzyka (ang. risk neutral). O tych, którzy przydzielają mniej utili każdemu kolejnemu dolarowi, mówimy, że mają awersję wobec ryzyka (ang. risk averse).

Ubezpieczenie

Alice rozważa zaakceptowanie oferty Boba w sprawie ubezpieczenia od ognia jej rezydencji w Beverly Hills. Jeżeli odmówi, to tak jakby zagrała w loterii, w wyniku której może posiadać dom i składkę ubezpieczeniową w przypadku, gdy dom nie uleg­nie spaleniu, oraz tylko ubezpieczenie w przypadku pożaru. Należy to porównać z wynikiem końcowym, pewnym, jeżeli zaakceptuje ofertę Boba – wartość domu minus składka.

Jeżeli złożenie przez Boba oferty oraz akceptacja jej przez Alice są racjonalne, oznacza to, że on musi myśleć, że loteria jest lepsza niż zerwanie, nawet pewne, a ona musi mieć przeciwne preferencje. Istnienie branży ubezpieczeniowej potwierdza nie tylko fakt, że gra może być racjonalna – zakładając, że ryzyko, które podejmujemy, jest obliczone – ale także, że racjonalni ludzie mogą mieć różny stosunek do ryzyka. W branży ubezpieczeniowej ubezpieczyciele są bliscy neutralności wobec ryzyka, a ubezpieczający się mają awersję wobec ryzyka różnej wielkości.

Zauważmy, że ekonomiści uważają stopień awersji wobec ryzyka, jaki prezentuje dana osoba, za kwestię indywidualnych preferencji. Alice może tak samo przedkładać (lub nie) lody czekoladowe nad waniliowe, jak i chcieć (lub nie) przeznaczyć 1000 dolarów na ubezpieczenie swojego domu. Niektórzy filozofowie – w tym sławny John Rawls – utrzymują, że posiadanie awersji wobec ryzyka jest postawą racjonalną, niezależnie od maksymalizacji przeciętnej użyteczności, jaką preferują. Jednakże takie twierdzenie pomija fakt, że nastawienie graczy do podejmowania ryzyka zostało już uwzględnione przy użyciu metody von Neumanna do przydzielania wielkości użyteczności każdemu wynikowi.

Ekonomiści popełniają inny błąd, przypisując awersję wobec ryzyka niechęci do podejmowania aktu gry. Teoria von Neumanna ma sens jedynie wówczas, gdy gracze są całkowicie neutralni wobec aktualnego aktu gry. Podobnie jak prezbiteriański pastor ubezpieczający swój dom, nie grają, ponieważ lubią hazard – grają tylko wówczas, gdy sądzą, że los będzie im sprzyjał.

3. Wypłaty liczbowe

Życie nie jest grą o sumie wypłat zero

Tak jak przy pomiarze temperatury, punkt zero oraz jednostkę na skali użyteczności Alice możemy wybrać w dowolny sposób. Możemy, na przykład, przydzielić 32 utile najgorszemu wynikowi, a 212 utili – najlepszemu. Liczbę utili odpowiadającą randce z Bobem można znaleźć w tej nowej skali podobnie jak podczas przeliczania stopni Celsjusza na stopnie Fahrenheita. Tak więc randka z Bobem warta 75 utili według starej skali odpowiada 167 utilom w nowej skali.

W grach szkolnych, które do tej pory rozważaliśmy, jedynymi wynikami Alice i Boba, które można wycenić, są WYGRANA i PRZEGRANA. Możemy przydzielać tym dwóm wynikom dowolną liczbę utili tak długo, jak długo wygranej przydzielimy więcej niż przegranej. Jeżeli przydzielimy +1 utila wygranej, a -1 utila przegranej, otrzymamy wyniki takie jak w tabelach na ilustracji 3.

Wypłaty w każdej komórce tabeli gry orzeł-czy-reszka na ilustracji 3 zawsze sumują się do zera. Zawsze możemy uzyskać taki wynik w grach czysto konfliktowych. Są one nazywane grami o sumie zerowej (o sumie wypłat równej zero). Kiedy różni guru mówią nam, że życie nie jest grą o sumie zerowej, nie mówią niczego o całkowitej sumie szczęścia na świecie. Przypominają tylko, że gry, które rozgrywamy w prawdziwym życiu, rzadko są grami czysto konfliktowymi.

4. Gry z mieszanymi motywacjami

Równowaga Nasha

Stary film Buntownik bez powodu (Rebel without a Cause) wciąż bywa wyświetlany ze względu na gwiazdorską rolę niezapomnianego Jamesa Deana grającego seksownego nastoletniego buntownika. Gra w tchórza (ang. game of chicken) powstała, by upamiętnić scenę, w której Dean oraz drugi chłopak jadą samochodami w stronę przepaści na końcu klifu, aby sprawdzić, który z nich stchórzy jako pierwszy. Bertrand Russell wykorzystał ten epizod jako znaną metaforę zimnej wojny.

5. James Dean

Wolę ilustrować grę w tchórza za pomocą bardziej banalnej opowieści, w której Alice i Bob są dwójką kierowców w średnim wieku spotykających się na ulicy zbyt wąskiej, by oboje mogli bezpiecznie przejechać, jeżeli jedno z nich nie zwolni. Strategie przedstawione na ilustracji 4 to zatem wolno i szybko.

Nowa opowieść marginalizuje element współzawodnictwa z oryginalnej historii. W takiej odsłonie gra w tchórza różni się od gier o sumie zerowej, takich jak orzeł-czy-reszka, ponieważ gracze mają wspólny interes: obaj chcą uniknąć nieszczęścia.

Stereotypy utrwalone w grze wojna płci pochodzą z okresu poprzedzającego narodziny ruchów emancypacyjnych kobiet. Alice i Bob są świeżo poślubioną parą spędzającą miesiąc miodowy w Nowym Jorku. Przy śniadaniu dyskutują, czy wybrać się wieczorem na mecz bokserski, czy też na balet. Nie mogą podjąć decyzji. Później rozdziela ich tłum i muszą zdecydować indywidualnie, dokąd wybiorą się wieczorem.

Opowieść towarzysząca grze wojna płci podkreśla kooperacyjne cechy problemu, ale także element konfliktu, który był nieobecny w grze samochodowej. Każdy gracz preferuje współpracę, ale z innym wynikiem. Alice woli balet, a Bob – mecz bokserski.

John Nash

Każdy usłyszał o Johnie Nashu, gdy jego życie zostało przedstawione w filmie Piękny umysł (A Beautiful Mind). Tak jak pokazuje to film, sukcesy i niepowodzenia Nasha są poza możliwościami doświadczenia większości ludzi. Był jeszcze studentem, gdy stworzył nowoczesną teorię racjonalnych negocjacji. W jego pracy dyplomowej sformułowana została koncepcja równowagi Nasha, która jest dziś uważana za kamień węgielny teorii gier. W kolejnych latach rozwiązywał poważne problemy czystej matematyki, stosując tak oryginalne metody, że zyskał reputację geniusza matematycznego najwyższej klasy. Padł jednak ofiarą schizofrenii, która zniszczyła jego karierę i sprawiła, że opuszczony spędził ponad 40 lat w kampusie Princeton, stając się obiektem kpin. Jego powrót do zdrowia w czasie, gdy przyznano mu Nagrodę Nobla w 1994 r., z perspektywy czasu wydaje się cudem. Jak komentuje Nash, bez swojego „szaleństwa” byłby prawdopodobnie jednym w wielu anonimowych ludzi, którzy żyli i umarli na tej planecie, nie pozostawiając żadnego śladu swojego istnienia.

6. John Nash

Jednak nie trzeba być nieobliczalnym geniuszem, aby zrozumieć ideę równowagi Nasha. Widzieliśmy, że wybieranie wypłat w grze jest tożsame z próbą maksymalizacji przeciętnych wartości wypłat przez racjonalnych graczy. Będzie to łatwe, jeżeli gracze będą wiedzieć, jakie strategie mają zamiar wybrać ich oponenci. Na przykład, gdyby Alice wiedziała, że Bob ma zamiar wybrać balet w wojnie płci, zmaksymalizowałaby swój zysk, również wybierając balet. Można powiedzieć, że balet jest najlepszą odpowiedzią Alice na wybór baletu przez Boba. Na ilustracji 4 fakt ten zaznaczono wzięciem w kółko wypłaty dla Alice w komórce tabeli odpowiadającej wyborowi przez obu graczy opcji balet.

Równowaga Nasha to właśnie taka para strategii, których jednoczesne zastosowanie daje wynik z tej komórki tabeli, w której oba wyniki są wzięte w kółko. Inaczej mówiąc, równowaga Nasha występuje, gdy wszyscy gracze równocześnie wybierają najlepszą odpowiedź na strategie wybierane przez innych.

Zatem zarówno para strategii (boks, boks), jak i (balet, balet) tworzy równowagę Nasha w grze wojna płci. Podobnie strategie (wolno, szybko) oraz (szybko, wolno) są równowagami Nasha w grze w tchórza.

Dlaczego warto dbać o równowagę Nasha? Są po temu dwa główne powody. Po pierwsze, zakłada się, że idealnie racjonalni gracze będą mieć szansę rozwiązania problemu. Po drugie, zakłada się, że ludzie znajdują rozwiązania w jakimś ewolucyjnym procesie prób i błędów. Niemała część mocy predykcyjnej  teorii gier rodzi się z możliwości korzystania z obu tych alternatywnych interpretacji. Rzadko znamy szczegóły procesów ewolucyjnych, ale możemy czasami przewidzieć, dokąd mogą prowadzić, zadając pytania, co zrobiliby racjonalni gracze w danej sytuacji.

Racjonalna interpretacja

Załóżmy, że ktoś, nawet mądrzejszy od Nasha lub von Neumanna, napisał książkę, w której podaje listę wszystkich możliwych gier, autorytatywnie instruując, jak każda z nich powinna być rozgrywana przez racjonalnych graczy. Tak świetna książka o teorii gier będzie oczywiście wskazywała równowagę Nasha jako rozwiązanie każdej gry. W innym przypadku racjonalne byłoby, aby przynajmniej jeden z graczy odstąpił od instrukcji, która w wyniku tego przestanie być autorytatywna.

Załóżmy, na przykład, że książka rekomenduje nastoletnim chłopakom grającym w tchórza wybranie strategii wolno, jak życzyłyby sobie ich matki. Jeżeli książka byłaby autorytatywna, każdy z graczy wiedziałby, że drugi ma zamiar grać strategią wolno. Ale racjonalny gracz w tchórza, który wie, że jego oponent ma zamiar wybrać wolno, wybierze oczywiście szybko, obalając tym samym roszczenia książki do bycia autorytatywną.

Zauważmy, że uzasadnianie w obronie równowagi Nasha ma charakter cyrkulacyjny. Dlaczego Alice gra w ten sposób? Ponieważ Bob gra w tamten sposób. Dlaczego Bob gra w tamten sposób? Ponieważ Alice gra w ten sposób.

Ci, których nie zadowalają takie cyrkulacyjne argumenty, mogą skorzystać z różnych łacińskich sentencji. Kiedy po raz pierwszy zarzucono mi błąd circulus in probando3, gdy mówiłem o równowadze, musiałem to rozważyć. Okazało się, że szczęśliwie nie zostałem oskarżony o bardziej dyskredytujące petitio principii4. Ale wszystkie argumenty muszą w sposób oczywisty być cyrkulacyjne lub zredukować się do nieskończonej regresji, jeżeli ktoś nigdy nie ustaje w zadawaniu pytania dlaczego. Definicje słownikowe są najbardziej znanym tego przykładem.

W grach możemy bez końca kontemplować nieskończoną regresję, która rozpoczyna się następująco:

Alice myśli, że Bob myśli, że Alice myśli, że Bob myśli…

albo ratować się cyrkularnością wbudowaną w ideę równowagi Nasha. Każdy inny profil strategiczny może zostać potencjalnie zdestabilizowany, gdy gracze zaczną myśleć, o czym myślą inni gracze. Inaczej mówiąc, jeżeli oczekiwania graczy co do planów innych graczy są zgodne, oznacza to, że gracze są w równowadze.

Interpretacja ewolucyjna

Racjonalna interpretacja równowagi Nasha miała tak silny wpływ na pierwszych zwolenników teorii gier, że interpretacja ewolucyjna była prawie całkowicie lekceważona. Wydawcy czasopisma, w którym Nash opublikował swój artykuł o równowadze, prawie odrzucili jego uwagi w tej kwestii jako nieinteresujące! Ale teoria gier nigdy nie mogłaby przewidywać zachowania zwykłych ludzi, gdyby interpretacja ewolucyjna nie była istotna. Na przykład znany matematyk Émile Borel myślał o teorii gier jeszcze przed von Neumannem, ale doszedł do wniosku, że twierdzenie minimaksowe jest prawdopodobnie błędne. Zatem jakie szanse może mieć reszta z nas, kiedy nawet ktoś tak mądry jak Borel nie mógł uzasadnić swojego rozwiązania dla najprostszej klasy gier!

Istnieje wiele możliwych ewolucyjnych interpretacji równowagi Nasha różniących się procesem dostosowawczym, za pomocą którego gracze mogą znaleźć swoją drogę do równowagi. W prostszych procesach dostosowawczych wypłaty w grze identyfikuje się z tym, jak bardzo odpowiadają one graczom. Procesy, które faworyzują lepiej dopasowane strategie kosztem ich mniej dopasowanych krewnych, mogą przestać działać, gdy zbliżamy się do osiągnięcia równowagi Nasha, ponieważ tylko wtedy wszystkie niewyeliminowane strategie będą tak dopasowane, jak to tylko możliwe w danych okolicznościach. Zatem gracze nie muszą być świetnymi matematykami, aby odnaleźć równowagę Nasha. Zwykle całkiem dobrze przewiduje ona zachowania zwierząt. Ewolucyjna istotność równowag Nasha nie ogranicza się do biologii. Odgrywa rolę predykcyjną zawsze wtedy, kiedy proces dostosowawczy eliminuje strategie, które generują niskie wypłaty.

Na przykład maklerzy, którzy są mniej sprawni od swoich konkurentów, ponoszą porażkę. Praktyczne reguły, które stosują, podlegają tego samego typu ewolucyjnej presji jak geny ryb czy owadów. Zatem sensowne jest, aby przyglądać się równowadze Nasha w grach rozgrywanych przez maklerów, nawet jeżeli wszyscy wiemy, że niektórzy z nich nie będą w stanie odnaleźć się w pobliżu akwarium ze złotą rybką, nie mówiąc już o książce na temat teorii gier.

Dylemat więźnia

Najbardziej znaną grą szkolną jest dylemat więźnia. W tradycyjnej opowieści wykorzystywanej jako tło gry Alice i Bob są gang­sterami w Chicago w latach 20. XX w. Prokurator okręgowy wie, że dopuścili się poważnego przestępstwa, ale nie może im tego udowodnić, jeżeli jedno z nich się nie przyzna. Zarządza ich aresztowanie i każdemu z nich oddzielnie proponuje następujący układ:

Jeżeli przyznasz się, a współsprawca się nie przyzna, to wyjdziesz na wolność. Jeżeli ty się nie przyznasz, ale przyzna się współsprawca, wówczas zostaniesz oskarżony i skazany na maksymalnie długie uwięzienie. Jeżeli oboje się przyznacie, wówczas oboje zostaniecie oskarżeni, ale nie zostanie nałożony maksymalny wymiar kary. Jeżeli żadne z was się nie przyzna, postawiony będzie wam zarzut uchylania się od płacenia podatków, za co na pewno zostaniecie ukarani.

Opowieść staje się bardziej wzruszająca, jeżeli Alice i Bob umówili się, że będą trzymać język za zębami, jeżeli znajdą się w takiej sytuacji. Dotrzymanie obietnicy odpowiada kooperacji, a przyznanie się zdradzie, jak w tablicy z lewej strony na ilustracji 7. Wypłaty w tablicy odpowiadają przypuszczalnej liczbie lat w więzieniu (przy założeniu, że jeden util zawsze odpowiada jednemu dodatkowemu rokowi na wolności).

7. Dwie wersje dylematu więźnia

Mniej barokowa opowieść zakłada, że zarówno Alice, jak i Bob mają dostęp do dużych pieniędzy. Oboje mogą niezależnie dać rywalowi 2 dolary z tej puli albo włożyć 1 dolara do własnej kieszeni. Tabela wypłat z prawej strony na ilustracji 7 została przygotowana przy założeniu, że Alice i Bob dbają tylko o pieniądze – utile są tożsame z dolarami. W tym przypadku altruistycznej strategii podarowania oponentowi 2 dolarów nadano etykietę gołąb, a samolubnej strategii wzięcia sobie 1 dolara – etykietę jastrząb.

Ujęcie w kółko najlepszych odpowiedzi ujawnia, że jedyna strategia prowadząca do równowagi Nasha w wersji daj-lub-bierz dylematu więźnia to, zarówno dla Alice, jak i Boba: bierz, pomimo iż każde z nich mogłoby dostać więcej, gdyby oboje wybrali daj. Wersja gangsterska jest strategicznie identyczna. Jeśli ma zaistnieć równowaga Nasha każde z nich zdradzi – skończy się na tym, że oboje spędzą długi czas w więzieniu, pomimo iż mogliby dostać lżejsze wyroki, gdyby współpracowali.

Paradoks racjonalności?

Cała generacja uczonych przyjęła pogląd, że dylemat więźnia symbolizuje istotę problemu kooperacji wśród ludzi. Postawili sobie zatem beznadziejny cel: uzasadnić, dlaczego rozwiązanie tego przypuszczalnego „paradoksu racjonalności” za pomocą teorii gier jest błędne (patrz: Błędne przekonania w dylemacie więźnia, rozdział 10). Ale teoretycy gier sądzą, że oczywistym błędem jest uważać, iż dylemat więźnia ujmuje to, co dotyczy współpracy między ludźmi. Przeciwnie, kreuje on sytuację, kiedy wszystko sprzysięga się, by uniemożliwić kooperację.

Jeżeli wspaniała gra życia rozgrywana przez istoty ludzkie byłaby adekwatnie modelowana przez dylemat więźnia, nigdy nie rozwinęlibyśmy się jako zwierzęta społeczne! Nie widzimy zatem potrzeby rozwiązywania wymyślonego paradoksu racjonalności, tak jak i wyjaśniania, dlaczego ludzie toną, kiedy zostaną wrzuceni do jeziora Michigan ze stopami zatopionymi w betonie. Nie istnieje żaden paradoks racjonalności. Racjonalni gracze nie kooperują w dylemacie więźnia, ponieważ nie są spełnione warunki konieczne dla racjonalnej kooperacji.

Szczęśliwie faza paradoksu racjonalności w historii teorii gier jest już za nami. O tyle, o ile się je pamięta, wiele błędnych teorii, które zostały wymyślone w ramach beznadziejnych prób pokazania, że w dylemacie więźnia kooperacja jest racjonalna, jest obecnie przedstawianych jako zabawne przykłady tego, co psychologowie nazywają magicznym rozumowaniem, w którym logika jest tak zniekształcona, aby można było dojść do oczekiwanego wniosku. Moim ulubionym przykładem takiej teorii jest twierdzenie Immanuela Kanta, że racjonalność wymaga przestrzegania jego imperatywu kategorycznego5. W dylemacie więźnia obaj racjonalni gracze wybraliby zatem daj, ponieważ jest to strategia, która będzie najlepsza, jeżeli wszyscy ją wybiorą.

Dominacja

Przekonanie, że oczywiście irracjonalnym jest robić rzeczy, które będą złe, jeżeli każdy będzie je robił, jest powszechne. Prawdopodobnie twoja mama lubiła ten argument tak bardzo jak moja. W związku z tym warto powtórzyć zaprzeczenie dotyczące dylematu więźnia.

Aby nie przesądzać sprawy, pytamy na początek, skąd biorą się wypłaty, które reprezentują preferencje graczy w dylemacie więźnia. Teoria odkrywania preferencji podpowiada, aby odpowiedzi szukać, obserwując wybory, jakich dokonują (lub będą dokonywać) Alice i Bob, gdy rozwiązują jednoosobowe problemy decyzyjne.

Zapisanie wyższej wypłaty dla Alice w lewej dolnej komórce tabeli wypłat dla dylematu więźnia niż w lewej górnej oznacza, że Alice, rozwiązując jednoosobowy problem decyzyjny, wybrałaby bierz, gdyby wiedziała wcześniej, że Bob wybrał daj. Podobnie zapisanie wyższej wypłaty w prawej dolnej komórce oznacza, że Alice wybrałaby bierz, mając jednoosobowy problem decyzyjny i wiedząc wcześniej, że Bob wybrał bierz.

Definicja gry wskazuje zatem, że bierz jest najlepszą odpowiedzią Alice, gdy wie, że wybór Boba to daj, a także gdy wie, że jego wybór to bierz. Nie musi więc wiedzieć niczego na temat aktualnego wyboru Boba, aby wiedzieć, jaka strategia jest jej najlepszą odpowiedzią. Dla niej racjonalnym wyborem jest granie bierz bez względu na strategię, którą zamierza zastosować on. W tych niezwyczajnych okolicznościach mówimy, że bierz dominuje alternatywne strategie Alice.

Obiekcje?

W stosunku do przeprowadzonej wcześniej analizy zwykle formułowane są dwa zarzuty. Po pierwsze, zaprzecza się, że Alice wybierze zdradę w gangsterskiej wersji dylematu więźnia, jeżeli wie, że Bob wybrał kooperację. Sugeruje się różne powody, które zależą od tego, czemu kto daje wiarę odnośnie do warunków życia w Chicago w czasach Ala Capone, ale takie zarzuty nie trafiają w sedno. Jeżeli Alice nie zdradzi, wiedząc, że Bob wybrał kooperację, to nie będzie grała w dylemacie więźnia. I w tym przypadku, i w innych nie należy zbyt poważnie podchodzić do opowieści wykorzystywanych jako tło gry. To tablice wypłat z ilustracji 7 definiują dylemat więźnia – nie zaś głupie opowiastki, które im towarzyszą.

Drugi zarzut zawsze wprawia mnie w zakłopotanie. Mówi się, że odwoływanie się do teorii ujawniania preferencji redukuje stwierdzenie, że w dylemacie więźnia racjonalnym jest zdradzić, do tautologii. Ponieważ tautologie nie mają faktycznej treści, stwierdzenie może być zignorowane! Ale kto powiedziałby to samo o tym, że dwa plus dwa równa się cztery?

Eksperymenty