niedziela, 28 lutego 2010

Kiedy warto być irracjonalnym... czyli paradoks Newcomba

Temat racjonalności wydaje się często oczywisty i nudny. Ludzie powinni dążyć do jak największych korzyści, wobec tego biorąc udział w jakiejś grze - a grają jedynie dla niej samej (a nie dla jakichś wyższych celów, na przykład samorozwoju) - to z tej perspektywy największą korzyścią jej jej wygranie. Jeśli wygrana stanowi suma pieniężna, to powinni dążyć do jej uzyskania - do maksymalizowania zysków. Wtedy są racjonalni.

Paradoks Newcomba roznosi w pył ten tok rozumowania.

Cytuję za wikipedią: http://pl.wikipedia.org/wiki/Paradoks_Newcomba

Wyobraź sobie dwóch graczy, Przewidującego i Wybierającego, którzy biorą udział w następującej grze:

1. W ma do wyboru dwa pudełka – otwarte pudełko I z 1000 zł oraz zamknięte pudełko II z 1 000 000 zł lub bez – W tego nie wie
2. W wybiera, czy chce dostać oba pudełka czy chce tylko pudełko II,
3. P dzień wcześniej przewidział, co wybierze W. Jeżeli W weźmie oba pudełka to pudełko II P pozostawi puste, jeżeli W wybierze tylko pudełko II to P włoży do niego 1 000 000 zł
4. W zdaje sobie sprawę, ze sposobu działania P opisanego powyżej, ale nie wie jaki jego ruch przewidział P w danej rozgrywce.

Pytanie:

Czy W ma wybrać oba pudełka, czy jedno?

Rozwiązanie pierwsze. Jeżeli P przewiduje bezbłędnie, to W powinien wybrać tylko pudełko II i wygra wtedy 1 000 000 zł. Jeżeli W weźmie oba pudełka, pudełko II będzie puste i W wygra tylko 1 000 zł. Nawet, jeżeli P jest tylko w przybliżeniu pewny swoich przewidywań, W nie chce ryzykować, że dostanie tylko tysiąc. Zgodne z takim rozumowaniem W powinien zawsze wybierać zamknięte pudełko II.

Rozwiązanie drugie. Jednakże w momencie, kiedy W przystępuje do wyboru, zawartość pudełek jest już ustalona. Zamknięte pudełko II może być albo puste albo pełne. Na oczach W zawartość pudełek nie może ulec zmianie. Niezależnie od tego czy pudełko II jest puste czy pełne wybierając oba W zwiększa swoją szansę wygranej, bo może zabrać dla siebie zawartość obu z nich. Kierując się taką logiką W powinien zawsze wybierać oba pudełka.

Istnienie dwóch rozwiązań wybieranych przez różne osoby w roku 1969 tak podsumował Nozick:
Dla prawie wszystkich jest całkowicie jasne i oczywiste jak należy wybrać. Problem tkwi w tym, że pytani o rozwiązanie dzielą się na dwie prawie równe grupy mające przeciwne zdanie na ten temat, a duża liczba pytanych osób sądzi, że ci wybierający drugie rozwiązanie są po prostu głupi.


Spróbujmy rozplątać ten paradoks.

1. Należy zadać pytanie czy W może w ogóle dokonać wyboru skoro P przewidział jego ruch. Innymi słowy, czy W ma wolną wolę? Niektórzy twierdzą, iż teza o wolnej woli usuwa paradoks Newcomba, gdyż jest sprzeczna z założeniem o istnieniu P, który przewiduje nasze decyzje. Tak twierdzi na przykład K. Binmore [Por. W. Z. Załuski, Problem wolnej woli, racjonalność decyzji a paradoks Newcomba, s. 3]. Rzeczywiście. A więc W nie ma wolnej woli. Jednakże on nie musi o tym wiedzieć. Dalej może się zastanawiać co zrobić. Paradoks nie został rozwiązany.

2. Aby rozwiązać paradoks, trzeba określić czy teraźniejszość ma wpływ na przeszłość (a nie odwrotnie). O przeszłości należy pomyśleć jak o przyszłości. Czy to co zrobi teraz W, będzie mieć znaczenie, dla tego, co zrobi (zrobił) P? Można zadać to pytanie inaczej. Czy P potrafi cofnąć się w przeszłość? Jeśli tak, w momencie, gdy W wybiera pudełko 2 lub oba, P natychmiast powraca do przeszłości i dokonuje odpowiedniego podstawienia bądź usunięcia kwoty w pudełku 2. Jeśli W wie o takich możliwościach P, oczywiście wybierze drugie pudełko. Nie ma tutaj żadnych wątpliwości co do wyboru.

Problem rodzi się dopiero w sytuacji rzeczywistej, czyli gdy...

3. P nie może się cofnąć w czasie. Czy może mimo to przewidywać ruch W, jeśli W nie ma wolnej woli? Tutaj musimy znów rozbić sytuację na dwie części. To jak się zachowa W, zależy od tego co P wie na temat W oraz czy W wie, co P o nim wie. Wiemy już natomiast, że P musi wiedzieć o W wszystko co jest potrzebne, do określenia, jaki ruch W wykona. P jest bowiem przewidującym graczem, a W nie ma wolnej woli. Chodzi tu mianowicie o to czy W jest racjonalny czy nie jest racjonalny.

a) Jeśli W jest racjonalny, to powracamy do drugiego rozwiązania. Zawartość pudełek nie może się już zmienić, więc W będzie maksymalizował zysk, jeśli wybierze oba pudełka. W wie o tym, że nie dostanie w takim razie miliona, ale to nie ma znaczenia, bo musi się zachować racjonalnie. Nie ma przecież wolnej woli. P o tym wszystkim wie i dlatego nie musi posiadać wehikułu czasu: może przewidzieć zachowanie W dzięki takiemu rozumowaniu.

b) Jeśli W nie jest racjonalny, to musimy znów rozbić problem na dwie części.

- W może zachowywać się przeciwnie do zachowania racjonalnego. Takie zachowanie nazwiemy irracjonalnym. Jeśli W jest irracjonalny, to wybierze drugie pudełko, w którym zobaczy milion. P bowiem wie, że W jest irracjonalny, a więc z łatwością potrafi przewidzieć ruch W.

- W może się zachowywać w sposób całkowicie losowy, tak że z prawdopodobieństwem 0,5 zachowa się racjonalnie lub irracjonalnie. Jednak losowość oznacza indeterminizm, a więc niemożliwość przewidywania. Losowe zachowanie jest równoznaczne z zachowaniem istnienia wolnej woli, a to wykluczyliśmy. Gdyby faktycznie ruchy W były losowe, P nie mógłby przewidywać.

Jeśli zakładamy istnienie P, to W może się zachowywać albo racjonalnie, albo irracjonalnie.
............................................................................
Zauważmy więc, że zachowanie irracjonalne przynosi suma sumarum większe korzyści materialne od racjonalnego. Mówiąc inaczej, racjonalnie działający W mógłby poprawić swoją sytuację, dokonując wyboru nieracjonalnego.

Jeżeli nie da się poprawić sytuacji żadnej ze stron bez pogorszenia sytuacji którejś strony, to taką sytuację nazywamy alokacją efektywną w rozumieniu Pareta. Zazwyczaj efektywność Pareta łączy się z racjonalnością stron, a jednak występują sytuacje, gdzie racjonalność i efektywność zachowań stoją ze sobą w sprzeczności. Zarówno P jak i racjonalny W osiągnęli najwyższą użyteczność - P przewidział ruch W, W dostał oba pudełka. Jednak sytuacja W mogłaby się poprawić bez pogorszenia sytuacji P, a więc alokacja nie jest efektywna.
............................................................................

No dobrze, ale ktoś powie, że to tylko abstrakcyjne ćwiczenie, bo nikt nie jest w stanie przewidywać zachowań innych ludzi ze 100% pewnością. Implikuje to, że ludzie mają wolną wolę. Okazuje się jednak, że nawet, jeśli P będzie przewidywał zachowanie W z ponad 50%-procentowym prawdopodobieństwem, paradoks istnieje nadal. Oznacza to, że paradoks istnieje w rzeczywistych sytuacjach decyzyjnych, z jakimi się często spotykamy.

Czy wolna wola coś zmienia w naszej sytuacji? Nie, W - jeśli jest racjonalny - powinien wybrać oba pudełka. Wybranie obydwu pudełek w takiej sytuacji wydaje się nawet "jeszcze bardziej" racjonalne niż w poprzedniej. Działania W i P są raczej niezależne. Ten problem przypomina oczywiście dylemat więźnia znany z teorii gier, kiedy to więźniowie nie mogą się porozumiewać ze sobą, ich działania nie są skoordynowane, co oznacza, że każdy z nich musi podjąć taką decyzję, aby niezależnie od ruchu drugiego więźnia, była ona najlepsza z możliwych. Dylemat więźnia jest przede wszystkim znany z tego, że również w nim występuje swego rodzaju paradoks: obaj więźniowie mogliby znaleźć się w lepszej sytuacji, gdyby zachowali się irracjonalnie. Jest to więc także sytuacja nieefektywna w rozumieniu Pareta.

W klasycznej formie dylemat więźnia, jest przedstawiany następująco (Źródło: wikipedia: http://pl.wikipedia.org/wiki/Dylemat_wi%C4%99%C5%BAnia):

Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się czy drugi milczy czy zeznaje aż do momentu wydania wyroku. Jak powinni postąpić?

Poniższa tabela przedstawia możliwe wyniki gry:



Strategia "zeznaje" okazuje się najlepsza niezależnie od tego co zrobi druga osoba. Rozwiązanie oparte na strategii dominującej polega na tym, że na przykład wybieramy opcję "zeznawać", której towarzyszy pewna "wypłata" i porównujemy tę "wypłatę" z wypłatą opcji "milczeć". Weźmy więźnia A. Zauważmy, że wolność (czyli gdy zeznaje) jest lepsza od 6 miesięcy odsiadki (gdy milczy). Pamiętajmy, że chodzi o porównanie. Jeśli B wybiera "milczeć", to A porównuje obie opcje: zeznawanie daje większą wypłatę (0 a nie -0,5 roku). Jeśli B wybiera zeznawać, A znowu porównuje: zeznawanie daje większą wypłatę (-5 a nie -10 lat). Nieważne co zrobi B, opcja zeznawać daje zawsze lepszą wypłatę niż opcja milczeć. Dla B wnioski są identyczne. Obaj będą zeznawać. Dostaną 5 lat więzienia. Gdyby jednak obaj poszli w zaparte i irracjonalnie milczeli, wyszliby na tym lepiej, gdyż dostaliby jedynie 6 miesięcy więzienia.

Można byłoby inaczej rozwiązać ten dylemat - po prostu w kategoriach wartości oczekiwanej. Ponieważ nie wiemy, z jakim prawdopodobieństwem drugi więzień dokonuje któregoś ruchu, uznajemy, że szansa jest 50:50.

Milczy:

(0,5+10)/2 = 5,25.

Zeznaje:

(0+5)/2 = 2,5.

Znowu lepiej zeznawać. Oczywiście można mieć wątpliwości co do takiej metody - po pierwsze określanie prawdopodobieństw jest kłopotliwe, po drugie dla gracza ważniejsze od prawdopodobieństwa zdarzenia będzie raczej możliwa strata i zysk. Dlatego kryterium strategii dominującej wydaje się lepsze od kryterium wartości oczekiwanej. To znaczy to drugie kryterium może być również poprawne, ale z pewnymi modyfikacjami - użycie zamiast samych wartości zdarzeń, użyteczności tych zdarzeń oraz zamiast prawdopodobieństw - użyteczności prawdopodobieństw. Kwestia ta jednak leży poza tematem - obiektywnie nie potrafilibyśmy określić który wybór jest lepszy.


Wróćmy zatem do paradoksu Newcomba. Możemy stworzyć następującą macierz wypłat:



Jaka jest strategia dominująca? Łatwo zauważyć, że nie istnieje. W takim razie użyjmy metody wartości oczekiwanej. Przyjmijmy, że P przewiduje z prawdopodobieństwem p. Wtedy wartość oczekiwana będzie następująca:

W bierze oba pudełka: p*1000 + (1-p)*1001000 = 1001000 - p*1000000
W bierze pudełko 2 : p*1000000 + (1-p)*0 = p*1000000

Niech p = 0,99.
W bierze oba pudełka: 1001000 - 0,99*1000000 = 11000
W bierze pudełko 2 : 0,99*1000000 = 990000.

Wynika z tego, że lepiej jest wziąć pudełko 2.

Czy nie ma jednak w tej konstrukcji jakiegoś fałszu? Moim zdaniem jest. W sposób podstępny zakłada się tu, że działania W i P są skorelowane (a nawet powiązane łańcuchem przyczynowo-skutkowym). To co zrobi W za chwilę, P właśnie już przewidział. Nie tyle przewidział, co po prostu wyprognozował, a więc ta czynność prognozowania już się zakończyła. Nie można jednak określać tej prognozy w kategoriach poprawności. P nie może ani przewidzieć poprawnie, ani niepoprawnie w trakcie dokonywania wyboru przez W, bo ten akt przewidywania dopiero zależy od wyboru W, który zależy od tej macierzy. (Jak W może dokonać wyboru skoro P już przewidział to dobrze lub źle?).

Zachowania obydwu graczy stają się zbyt uwikłane ze sobą. Musimy zbudować tak macierz, aby zachowania te były niezależne. Oto ta macierz:



Teraz strategia dominująca istnieje, gdyż niezależnie od wyboru P, dla W bardziej opłacalne będzie wzięcie obydwu pudełek. Łatwo porównać: 1000 (oba pudełka) > 0 (pudełko 2) oraz 1001000 (oba pudełka) > 1000000 (pudełko 2).

Strategia oparta na wartości oczekiwanej:

W bierze oba pudełka: p*1000 + (1-p)*1001000 = 1001000 - p*1000000
W bierze pudełko 2 : p*0 + (1-p)*1000000 = 1000000 - p*1000000.

Wybór obu pudełek jest korzystniejszy niezależnie od prawdopodobieństwa. W zasadzie przedstawiono tu rozwiązanie oparte po prostu na spostrzeżeniu z drugiego rozwiązania - nie można już zmienić zawartości pudełek. Rozwiązanie to nieco doprecyzowaliśmy.
....................................................................

Zmodyfikowany paradoks Newcomba i dylemat więźnia w jednym występuje na efektywnym rynku kapitałowym. Opiszę go w następnym poście.

środa, 17 lutego 2010

CAPM - Security Market Line (SML)

Jak już zostało powiedziane, CAPM (Capital Assets Pricing Model) składa się z dwóch zależności: linii rynku kapitałowego (Capital Market Line - CML) oraz linii rynku papierów wartościowych (Security Market Line - SML). Pierwszą zależność przedstawiłem w poprzednim poście. Obecnie zajmę się drugą.

Przedsiębiorczy inwestor poszukuje najlepszych, tj. przynoszących największe zyski, walorów na rynku. Gdyby był inwestorem pasywnym, maksymalnie dywersyfikowałby portfel, co znaczyłoby, że nie wierzy w możliwość zainwestowania w najlepsze spółki i opierałby się na teorii efektywności rynku - teorii portfela Markowitza oraz CAPM-CML. Czy jest racjonalne bycie przedsiębiorczym inwestorem czy raczej pasywnym? Odpowiedź zależy od tego czy rynek jest efektywny czy nie. Jeśli jest efektywny, to jedynie racjonalne jest bycie inwestorem pasywnym (co jest oczywiście paradoksem, bo gdyby wszyscy byli racjonalni, nikt nie dyskontowałby nowych informacji, a więc rynek nie byłby efektywny; o tym paradoksie warto byłoby jeszcze podyskutować). Jeśli nie jest efektywny, wtedy warto być inwestorem przedsiębiorczym. Wynika z tego, że trzeba najpierw sprawdzić hipotezę efektywności rynku, a następnie obrać odpowiednią postawę.

Model SML pozwala właśnie sprawdzić czy rynek jest efektywny czy nie. Jest to bowiem model "wyceny" dowolnego aktywa kapitałowego, na przykład pojedynczych papierów wartościowych. Jeśli aktywo nie leży na SML, rynek nie jest efektywny. Przypomnijmy, że model CML dotyczył jedynie portfeli leżących na granicy portfeli efektywnych, a więc służył jedynie inwestorowi pasywnemu. W tym sensie model SML staje się bardziej ogólny od CML. Interpretacja SML jest następująca:

zysk z aktywów = cena czasu + cena jednostki ryzyka rynkowego*ilość ryzyka rynkowego.

Postać SML wyznacza równanie:



gdzie:

μ(i) - oczekiwana stopa zwrotu inwestycji w i-ty walor lub portfel ryzykowny w warunkach równowagi
R(f) - stopa wolna od ryzyka
μ(M) - oczekiwany zysk portfela rynkowego
beta(i) - współczynnik ryzyka systematycznego (rynkowego) i-tego waloru dany wzorem:



gdzie:

cov - kowariancja
σ(M)^2 - wariancja portfela rynkowego
R(M) - zysk portfela rynkowego
R(i) - stopa zwrotu inwestycji w i-ty walor lub portfel ryzykowny

Współczynnik beta staje się wskaźnikiem ryzyka (ilość ryzyka), zastępując tym samym odchylenie standardowe w modelu CML. Wielkość R(M)-R(f) nazywana jest premią za ryzyko. Premia za ryzyko stanowi więc cenę jednostki ryzyka.

Można udowodnić, że w warunkach równowagi (rynku efektywnego), kiedy wszyscy inwestorzy wybierają portfele znajdujące się na CML, stopy zwrotu poszczególnych portfeli ryzykownych (w tym również pojedynczych walorów) są wyznaczane przez równanie SML.

1. Wyprowadzenie modelu

Przypomnijmy metodę tworzenia linii CML. Na poniższym rysunku widać krzywą minimalnego ryzyka, na której leży portfel rynkowy M, zaś CML powstaje poprzez dołączenie do tego portfela instrumentu bez ryzyka rynkowego F, co graficznie powoduje utworzenie się linii prostej łączącej F z M:



Pamiętajmy, że ta krzywa powstaje w oparciu o wszystkie ryzykowne aktywa kapitałowe. Dzięki temu dywersyfikacja ryzyka jest maksymalna dla aktywów ryzykownych, co powoduje, że krzywa minimalnego ryzyka przesunięta jest maksymalnie w lewo.

Jednym z aktywów ryzykownych jest walor A widoczny na rysunku. Możemy zrobić następujący zabieg: potraktować portfel M jak zwykły walor i stworzyć portfele złożone z dwóch walorów: A i M. Taki schemat pokazano na poniższym rysunku:



Należy zauważyć, że powstała krzywa musi mieć nachylenie równe CML. Dlaczego? Spójrzmy na sytuację, gdy krzywa jest nachylona na lewo od punktu M:



A teraz na prawo od M:



W obydwu przypadkach nowa zakreskowana CML jest mocniej nachylona niż pierwotna, co zostaje spowodowane innym nachyleniem krzywej minimalnego ryzyka. Staje się więc możliwe uzyskanie wyższej oczekiwanej stopy zwrotu przy danym ryzyku, albowiem nowa CML okazuje się być bardziej efektywna. Ale to przeczy logice: pierwotna krzywa minimalnego ryzyka optymalizuje portfele składające się ze wszystkich ryzykowanych walorów, zatem również powstająca w oparciu o nią CML musi być najlepszą z możliwych. Wynika z tego, że nowa krzywa minimalnego ryzyka musi mieć w punkcie M nachylenie równe pierwotnej CML.

Na naszym rysunku widoczny jest portfel P1 złożony z A i M. Oczekiwana stopa zwrotu P1 (μ(P1)) jest dana wzorem:

(1)


gdzie:

x - udział waloru A, μ(A) - oczekiwana stopa zwrotu waloru A, μ(M) - oczekiwana stopa zwrotu portfela rynkowego M.

Z kolei odchylenie standardowe stopy zwrotu P1 (σ(P1)) jest równe:

(2)


σ(A)^2 - wariancja stopy zwrotu A, σ(M)^2 - wariancja stopy zwrotu M, Cov(A,M) - kowariancja stóp zwrotu A i M.

Rozważmy nachylenie krzywej minimalnego ryzyka w punkcie P1, z którym ściśle związany jest tangens kąta nachylenia tej krzywej. Tangens kąta jest to pochodna μ(P1) względem σ(P1). Jednocześnie μ(P1) oraz σ(P1) są funkcjami zależnymi od udziału x. Zatem pochodna μ(P1) względem σ(P1) jest pochodną zewnętrzną, natomiast zarówno pochodna μ(P1) względem x jak i σ(P1) względem x jest pochodną wewnętrzną. Aby wyznaczyć pochodną zewnętrzną, wyznaczamy najpierw wewnętrzną zgodnie ze wzorem:

(3)


Na podstawie (1) dostajemy:

(4)


Na podstawie (2) dostajemy

(5)


Kolejny krok polega na tym, że przesuwamy po krzywej portfel P1 w stronę M. W punkcie M udział x wynosi 0. Uwzględniając to i podstawiając (4) i (5) do (3) otrzymujemy:

(6)


Przedostatni krok polega na spostrzeżeniu, że w punkcie M nachylenie krzywej minimalnego ryzyka jest równe nachyleniu CML. Przypomnijmy, że wzór na oczekiwaną stopę zwrotu portfela CML jest dany wzorem:

(7)


Dla przypomnienia - tutaj wyprowadzam CML.

Zatem tangens kąta nachylenia krzywej jest równy współczynnikowi kierunkowemu CML:



Po przekształceniu tego równania otrzymujemy:



Upraszczając to zapisujemy:



Ostatni krok polega na zauważeniu, że powyższą procedurę możemy powtarzać dla każdego i-tego waloru. Zastąpimy A literką i:



I to jest właśnie równanie SML.

Ponieważ beta(i) i μ(i) będą zmieniać swoje wartości dla różnych i-tych aktywów, natomiast R(f) i μ(M) są stałe, to możemy potraktować SML jako zwykłą funkcję liniową. Wielkość R(f) - μ(M) to współczynnik kierunkowy SML. Graficznie SML przedstawia rysunek:



Teraz udowodnimy, że SML stanowi uogólnienie CML. Wzór na betę zawiera kowariancję. Przypomnijmy, że kowariancja może być wyrażona za pomocą wzoru:



gdzie ρ(i,M) to współczynnik korelacji liniowej pomiędzy walorem i oraz M.

Zatem równanie SML można wyrazić w postaci:



Łatwo zauważyć, że gdy współczynnik korelacji równa się 1, wtedy SML = CML. Dokładnie tak; SML staje się CML, ponieważ walor i zmienia się dokładnie z taką samą siłą i kierunkiem jak M. W końcu w CML siedzi zawsze pewna część M, natomiast drugą część stanowi niezmienna stopa zwrotu wolna od ryzyka R(f).

Należy rozumieć, że SML jest rozszerzeniem CML na wszelkie aktywa kapitałowe. Portfele CML były efektywne w sensie Markowitza. Portfele SML muszą być dobrze wycenione, a nie muszą być efektywne.

2. Współczynnik beta

Współczynnik beta jest często określany mianem ryzyka systematycznego (rynkowego), gdyż wskazuje na wrażliwość zmiany ceny aktywa na zmiany ceny portfela rynkowego. Współczynnik beta decyduje o tym, jaką część premii za ryzyko rynku stanowi premia za ryzyko z tytułu inwestycji w portfel ryzykowny. Można bowiem zapisać, że


Jeżeli beta=0, wówczas stopa zwrotu i-tego waloru nie zależy od zmian koniunktury giełdowej. Jeżeli 0 < beta < 1, wówczas poprawie koniunktury na giełdzie mierzonej przyrostem tempa wzrostu portfela rynkowego (przybliżanego indeksem giełdowym) o 1% towarzyszy przyrost stopy zwrotu i-tego waloru o mniej niż 1%. W przypadku, gdy beta=1 stopa zwrotu z analizowanego waloru wzrasta w takim samym tempie jak indeks giełdowy. Jeżeli beta > 1, wtedy poprawa koniunktury giełdowej mierzona przyrostem tempa wzrostu indeksu giełdowego o 1% wywołuje przyrost stopy zwrotu i-tego waloru o więcej niż 1%. Ujemna wartość współczynnika beta może być interpretowana jako przejaw kształtowania się stopy zwrotu wbrew tendencji panującej na rynku, czyli oznacza jej spadek o beta% w sytuacji poprawy koniunktury o 1%.

Z jednej strony, jeśli akcje są silniej skorelowane z rynkiem, to rośnie beta. Z drugiej strony, jeśli zmienność akcji rośnie szybciej niż zmienność rynku, wtedy też rośnie beta. Beta nazywa się ryzykiem systematycznym, ponieważ nie ma sposobu na jego dywersyfikację - będzie systematycznie towarzyszyć inwestycji.

4. Równowaga na rynku kapitałowym

Co by się stało, gdyby oczekiwana stopa zwrotu nie leżała na linii rynku papierów wartościowych?

a) Leży powyżej SML

μ(i) > R(f)+ β[μ(m) - R(f)] => μ(i)- β[μ(m) - R(f)] > R(f).

Aktywa te stanowią bardzo dobry interes. Po skorygowaniu ich stopy zwrotu o ryzyko przynoszą wciąż wyższy przychód niż aktywa wolne od ryzyka. Jeśli inwestorzy odkryją, że takie aktywa istnieją, zechcą je kupić. Ktoś musi im sprzedać, kto również widzi tę zależność. Żeby więc inwestor mógł kupić aktywa, będzie musiał podnieść swoją cenę. Ponieważ stopa zwrotu to (cena 1 - cena 0)/(cena 0), cena 0 wzrośnie, a więc stopa zwrotu spadnie, tak że nadwyżka zysku zostanie zredukowana.

b) Leży poniżej SML

μ(i) < R(f)+ β[μ(m) - R(f)] => μ(i) - β[μ(m) - R(f)] < R(f).

Wszystko na odwrót. Aktywa te stanowią bardzo zły interes. Po skorygowaniu ich stopy zwrotu o ryzyko przynoszą niższy przychód niż aktywa wolne od ryzyka. Jeśli inwestorzy odkryją, że takie aktywa istnieją, zechcą je sprzedać. Ktoś musi od nich kupić, kto również widzi tę zależność. Żeby więc inwestor mógł sprzedać aktywa, będzie musiał obniżyć swoją cenę 0, co oznacza wzrost stopy zwrotu, czyli redukcję niepożądanej straty.

Rynek powinien więc dążyć do równowagi, czyli do spełnienia równania SML, μ(i) = R(f)+ β[μ(m)-R(f)]

5. Problemy praktyczne

Jeśli oczekiwana stopa zwrotu nie będzie leżeć na linii SML, to CAPM stwierdza, że rynek nie jest efektywny. Należy być jednak ostrożnym w stawianiu tezy o nieefektywności rynku, bo założenie o jednorodności i niezależności parametrów w czasie mogą być nieprawdziwe. (Należy wykorzystać wtedy uogólniony model CAPM).

W końcu trzeba znów podkreślić, że na dziś CAPM jest nieweryfikowalny. Portfel rynkowy bowiem zawiera wszelkie, nawet bardzo specyficzne aktywa na rynku (przy założeniu, że posiadają mierzalne parametry stopy zwrotu), będąc przy tym efektywnym w sensie Markowitza. Portfel indeksu giełdowego, który ma zastępować portfel rynkowy, nie musi być efektywny. Jeśli jakiś walor (portfel) uzyskuje stopę zwrotu średnio większą od indeksu giełdowego, to tylko w tym sensie oceniamy, że przynosi on ponadprzeciętne zyski. Jeśli słyszymy, że jakieś badanie wykazało, że CAPM nie sprawdza się w praktyce, to możemy być pewni, że badacz wcale tego nie udowodnił (na dziś). W istocie portfel rynkowy będzie stanowił indeks giełdowy tylko przy założeniu, że wszyscy inwestorzy będą racjonalni (pełne wyjaśnienie tego zagadnienia we wpisie: Dlaczego indeks ważony kapitalizacją uważany jest za benchmark? ).

6. Podsumowanie

CAPM-SML stanowi swego rodzaju uogólnienie CAPM-CML, rozszerzając go na wszelkie aktywa kapitałowe. Model ma na celu prawidłowo wycenić dowolny walor poprzez wyznaczenie optymalnej struktury zysku jaki on generuje i ryzyka systematycznego towarzyszącego mu. Jest to model zupełnie różny od CML z dwóch związanych ze sobą powodów. Po pierwsze nie służy on inwestorowi pasywnemu, który jedynie dywersyfikuje portfel, lecz przedsiębiorczemu, aby mógł sprawdzić hipotezę rynku efektywnego. Na podstawie SML inwestor może oszacować czy walor jest przewartościowany, niedowartościowany czy dobrze wyceniony. Po drugie zapis SML - choć na pierwszy rzut oka bardzo podobny do CML - znaczy kompletnie co innego. W modelu CML inwestor kupuje w pewnych proporcjach wolne od ryzyka na przykład obligacje skarbowe i portfel rynkowy. Ograniczają go jedynie jego możliwości kapitałowe, stąd wyznacza on własną kombinację zysku wolnego od ryzyka i oczekiwanego zysku z portfela rynkowego. W modelu SML nie musi kupować żadnych obligacji skarbowych ani też portfela rynkowego. Instrumenty te stają się jedynie punktem zaczepienia przy osiąganiu stopy zwrotu z akcji czy innych aktyw kapitałowych. Implikacją jest to, że na efektywnym rynku, czyli na linii SML, giełda pozwala zarobić na dowolnym papierze wartościowym lub portfelu dokładnie tyle ile daje papier wolny od ryzyka (cena za czas) plus tyle ile wynosi premia za ryzyko przemnożona przez ilość ryzyka (cena ryzyka).


P.S. Chociaż CAPM został uogólniony na model APT (Teorię Arbitrażu Cenowego wprowadzoną przez Stephana Rossa), to jednak ten drugi nie jest już modelem tak zwartym teoretycznie jak CAPM. CAPM chociażby teoretycznie (a może nawet kiedyś praktycznie) jest falsyfikowalny, a APT nawet teoretycznie nie jest. Jego uogólnienie polega po prostu na uogólnieniu czynników ryzyka, nie mówi się jednak jakie są to czynniki. Jajuga podaje, że na amerykańskim rynku takimi czynnikami są m.in. zmiany PKB, zmiany stopy bezrobocia, zmiany stopy inflacji, zmiany indeksu produkcji przemysłowej, zmiany w różnicy stóp dochodu obligacji o wysokim i niskim ryzyku itp. W sumie więc wszelkie wskaźniki ekonomiczne. Oczywiście przy większej liczbie zmiennych objaśniających, linia SML (tutaj nazywana linią arbitrażu cenowego) staje się hiperpłaszczyzną. W modelu APT nie musi być wcale oczekiwanego zysku portfela rynkowego. Można powiedzieć, że został on rozbity na wiele czynników, bowiem już ten zysk powinien mieć zakodowaną informację o wszystkich przedstawionych elementach wpływających na zmiany kursu. APT jest to model do eksperymentowania, nie do weryfikowania.

W ten sposób zakończyliśmy klasyczną teorię rynków kapitałowych. Należy jednak powiedzieć wprost - to jedynie wstęp do modeli uogólnionych.

Źródło:

1. T. Bołt, Rynki finansowe, część II, rok akademicki 2004/2005;
2. H. R. Varian, Mikroekonomia, W-wa 2002.
3. K. Jajuga, T. Jajuga, Inwestycje. Instrumenty finansowe, ryzyko finansowe, inżynieria finansowa, 2006.

piątek, 5 lutego 2010

CAPM - Capital Market Line (CML)

Teoria efektywnego rynku mówi prosto i zwięźle: nie można oczekiwać od portfela efektywnego więcej niż dają instrumenty pewne (wolne od ryzyka), jeśli nie uwzględnimy ryzyka związanego z transakcją.
Zgodnie z tą tezą oczekiwana stopa zwrotu z efektywnego portfela aktywów jest równa stopie zwrotu z instrumentu bez ryzyka rynkowego (cenie czasu) skorygowanej o stopę zwrotu z ryzyka (cenę ryzyka). Czyli:

zysk z portfela aktywów kapitałowych = cena czasu + cena ryzyka portfela.

Cenę ryzyka portfela można wyobrazić sobie jako cenę pewnej ilości produktów danego rodzaju. Cena ta zawiera dwa składniki: cenę jednostki produktu (ryzyka) oraz ilość produktu (ryzyka portfela):

zysk z portfela aktywów kapitałowych = cena czasu + cena jednostki ryzyka*ilość ryzyka portfela.

Model wyceny aktywów kapitałowych (Capital Assets Pricing Model - CAPM) ma właśnie taką interpretację. Został on wprowadzony przez Williama Sharpe'a, Johna Lintnera i Jana Mossina. Podstawą CAPM są dwie zależności i zajmiemy się obecnie pierwszą. Jest to linia rynku kapitałowego (Capital Market Line - CML), która wyraża się wzorem:



μ(p) - oczekiwana stopa zwrotu z portfela P
R(f) - stopa wolna od ryzyka (zysk z obligacji skarbowych, bonów skarbowych, lokat)
μ(M) - oczekiwana stopa zwrotu z tzw. portfela rynkowego
σ(M) - odchylenie standardowe stopy zwrotu z portfela rynkowego
σ(p) - odchylenie standardowe stopy zwrotu z portfela P

Wyprowadzenie modelu

1. Parametry portfela

CML wyprowadza się poprzez uogólnienie modelu Markowitza. Model Markowitza optymalizował ryzyko portfela składającego się z aktywów ryzykownych przy danym poziomie oczekiwanej stopy zwrotu. Przy różnych poziomach wymaganej oczekiwanej stopy zwrotu tworzył granicę portfeli efektywnych. Szczególnym przypadkiem aktywów ryzykownych są aktywa wolne od ryzyka. Jeśli portfel został powiększony o takie aktywo, standardowa granica efektywnych portfeli zmieni kształt.

Ponieważ jednak aktywa bez ryzyka mają nieco inny status niż z ryzykiem, nie tworzymy portfela bezpośrednio zawierającego aktywo wolne od ryzyka, ale rozdzielamy: tworzymy kombinację liniową portfela utworzonego za pomocą metody Markowitza i aktywa pozbawionego ryzyka. Takie podejście nie zmienia w ogóle parametrów portfela (oczekiwanego zysku i ryzyka), czyli jest równoważne temu, gdybyśmy potraktowali zwyczajnie aktywo bez ryzyka i wstawili je w skład portfela akcji. Wynika to z twierdzenia o podziale funduszy (Mutual fund separation theorem) - dowód na to twierdzenie można znaleźć np. u Mertona (zob. źródła poniżej).
Załóżmy, że inwestor chce skonstruować portfel inwestycyjny składający się z waloru ryzykownego, którym jest nasz portfel uprzednio konstruowany metodą Markowitza oraz waloru przynoszącego zysk pewny. Stopą zwrotu portfela o takiej strukturze jest:



natomiast wartością oczekiwaną



Wartość oczekiwana stopy wolnej od ryzyka jest równa tej stopie. Zatem wariancją stopy zwrotu tak skonstruowanego portfela jest:



Zatem ryzyko portfela zawierającego walor pewny wynosi:



Czyli odpowiednio podstawiając do wzoru na stopę zwrotu:



Stopa zwrotu z portfela jest funkcją liniową, której współczynnik kierunkowy jest równy:



Tak samo wyprowadzamy dla oczekiwanej stopy zwrotu i otrzymujemy



Z modelu Markowitza wiemy, że walor C musi leżeć na granicy portfeli efektywnych. Uwzględniając walor wolny od ryzyka, dostaniemy nową granicę portfeli efektywnych. Jest to linia prosta, co ukazuje poniższy rysunek:



Zwiększając udział papierów pozbawionych ryzyka w portfelu zmniejszamy ryzyko portfela. Wniosek jest oczywisty. Odcinek FC definiuje dwuskładnikowe kombinacje ryzykownego waloru C oraz waloru pewnego F. Punkty P, P', P'' na tym odcinku oznaczają portfele o różnej strukturze. Pierwszy z nich oznacza portfel o większym udziale papieru ryzykownego, drugi oznacza portfel równomierny, natomiast trzeci o większym udziale papieru pozbawionego ryzyka.
Punkt C oznacza portfel w sytuacji, gdy x(f)=0, czyli jest to portfel ryzykowny C. Przesuwając się od punktu C w kierunku punktu F otrzymujemy portfele zawierające coraz większy udział papierów pewnych. Portfele takie mają coraz mniejsze ryzyko i coraz mniejszą wartość oczekiwaną. Posuwając się od punktu F w górę po odcinku FC otrzymujemy portfele o coraz mniejszym udziale papierów pewnych. Zatem są one coraz bardziej ryzykowne lecz przynoszą większy oczekiwany zysk.

Należy zwrócić uwagę, że uwzględnienie waloru pewnego zmniejsza ryzyko, nie zmniejszając oczekiwanej stopy zwrotu. Tak definiowaliśmy dywersyfikację, którą teraz udoskonaliliśmy. Żeby to zobaczyć, wystarczy spojrzeć na linię oraz krzywą oddaloną na prawo lub na lewo od punktu C. Widać, że ta część linii prostej leży powyżej krzywej Markowitza. Oznacza to, że albo oczekiwany zysk można zwiększyć przy tym samym poziomie ryzyka lub zmniejszyć ryzyko przy tym samym poziomie oczekiwanego zysku. 

2. Pożyczanie

Powstaje pytanie co się dzieje na prawo od punktu C. Gdy przesuwamy się na prawo od tego punktu, na przykład do punktu P''', waga waloru pewnego x(f) staje się ujemna, a więc jest to sytuacja, gdy nie my pożyczamy komuś pieniądze, lecz to nam udziela się kredytu. Na lewo od punktu C przez fakt zakupu obligacji - inwestor pożycza rządowi swoje pieniądze oczekując pewnego zysku w wysokości R(f), a rząd w tym czasie finansuje swoje projekty. Odwrotnie jest, gdy inwestorowi się pożycza pieniądze, które przeznacza na dodatkową inwestycję w walor C. Oczywiście dzięki dodatkowym środkom, można jeszcze więcej zarobić, ale i jeszcze więcej stracić ze względu na konieczność zwrócenia pożyczonych pieniędzy wraz z odsetkami. Jest to więc podobna sytuacja do krótkiej sprzedaży, z jaką mieliśmy do czynienia w modelu Markowitza.

Sztucznie założyliśmy, że stopa procentowa kredytu, pożyczki jest równa stopie wolnej od ryzyka. W rzeczywistości będzie sporo wyższa. Dlatego na prawo od punktu C, linia zmniejszy nachylenie, tak, że oczekiwany zysk inwestora spadnie. W tym temacie kwestia ta jednak nas nie interesuje i zakładamy, że obie stopy procentowe są sobie równe.

3. Portfel rynkowy

Jeśli portfel C zawiera wszystkie walory ryzykowne handlowane na rynku, wtedy nazywamy go portfelem rynkowym. Ponieważ jednocześnie znajduje się on na granicy portfeli efektywnych, jest on doskonale zdywersyfikowany. Portfel rynkowy jest zatem reprezentantem rynku. Taki portfel będziemy oznaczać literką M, która zastępuje C.
Prosta przechodząca przez punkty FM nazywa się linią rynku kapitałowego (Capital Market Line - CML).

W takim razie, wzór na CML jest następujący:



co chcieliśmy wyprowadzić.

Poniższy rysunek przedstawia właśnie CML:



4. Problemy techniczne

Powstaje pytanie jak można interpretować portfel rynkowy z praktycznego punktu widzenia. Gdybyśmy mieli wygenerować taki portfel za pomocą metody Markowitza, to choć teoretycznie jest to możliwe, w praktyce pomysł ten rodzi wielkie komplikacje. Jeśli na rynku występuje n spółek, konieczne jest wyznaczenie n(n-1)/2 wartości współczynników korelacji par akcji (wynika z wzoru na liczbę kombinacji bez powtórzeń). Obecnie na podstawowym rynku jest 319 spółek, a więc musimy obliczyć 50721 współczynników korelacji. Ale pamiętajmy, że portfel rynkowy ma uwzględniać wszystkie walory. Powinniśmy więc uwzględnić w nim wszystkie możliwe i handlowane na całym świecie, nawet bardzo egzotyczne, walory - nie tylko spółki. Już gdyby tylko uwzględnić dodatkowo S&P500, to dostajemy (319+500)(319+500-1)/2 = 334971 kombinacji.

Powyższy problem omija się, zakładając, że indeks giełdowy ważony kapitalizacją dobrze odzwierciedla portfel rynkowy. Trochę to jest niebezpieczne, bo duża kapitalizacja sprawi, że będziemy trzymać dużą część spółek dużych z WIG20, co może być nieadekwatne do ponoszonego ryzyka. Ale coś za coś. Takie rozwiązanie pozwala bardzo szybko obliczyć oczekiwaną stopę zwrotu z CML. Dlaczego wybieramy akurat indeks ważony kapitalizacją? Ponieważ, jeśli wszyscy racjonalnie inwestują w spółki w oparciu o CML, to wszyscy muszą posiadać portfel rynkowy M. Wówczas M staje się indeksem ważonym kapitalizacją. Szerzej wyjaśniłem ten problem w artykule Dlaczego indeks ważony kapitalizacją uważany jest za benchmark?.

5. Wybór portfela

Podobnie jak w teorii Markowitza inwestor dokonuje wyboru kombinacji oczekiwanego zysku z portfela μ(p)* i ryzyka mu towarzyszącego σ(p)*. Oczywiście wybiera albo pewien poziom zysku i przygląda się odpowiadającemu mu ryzyku, albo pewien poziom ryzyka, któremu odpowiada jakiś zysk. Preferencje zależą od funkcji użyteczności, którą reprezentują krzywe obojętności, już wcześniej definiowane (z matematycznego punktu widzenia są to warstwice funkcji). Od kształtu krzywej obojętności zależy, który punkt zostanie wybrany. Punkt styczności krzywej obojętności z CML jest właśnie punktem optymalnym. Krzywa obojętności, która styka się z CML leży możliwie najdalej od początku układu współrzędnych, tak jak to pokazuje poniższy rysunek.



Inwestor wybiera ile chce rynku aktywów ryzykownych, a ile instrumentu bez ryzyka. Model CAPM wprowadza więc dodatkowo substytucyjność pomiędzy dwoma dobrami. Trzeba przyznać, bardzo elegancki model.

6. Podsumowanie

Reasumując, CAPM-CML pozwala wyznaczyć optymalną kombinację zysku wolnego od ryzyka oraz zysku generowanego przez rynek aktywów ryzykownych, przy czym ten ostatni jest aproksymowany przez indeks giełdowy ważony kapitalizacją. W jeszcze większym skrócie, wyznacza optymalny zysk na całym rynku kapitałowym, gdy rynek pozostaje efektywny.

Źródło:
1. T. Bołt, Rynki finansowe, część II, rok akademicki 2004/2005;
2. K. Jajuga, T. Jajuga, Inwestycje. Instrumenty finansowe, ryzyko finansowe, inżynieria finansowa.
3. R. C. Merton, An Analytic Derivation of the Efficient Portfolio Frontier. Sep., 1972