niedziela, 26 czerwca 2016

Kiedy oczekiwany zysk z akcji koreluje z ryzykiem?

Zazwyczaj rozpatrujemy średnią (wartość oczekiwaną) i wariancję jako niezależne od siebie parametry rozkładu prawdopodobieństwa. Czasami niektórzy wiążą oba parametry poprzez CAPM, jednak jest to podejście błędne. Jeśli ktoś nie rozumie tego błędu, to krótko wyjaśnię. Dla przypomnienia, CAPM-CML mówił ile można inwestować w aktywa ryzykowne, a w ile bez ryzyka. Poniższy rysunek to ilustruje:





Oczekiwana stopa zwrotu z mojego portfela jest oznaczona na osi pionowej, a ryzyko , czyli odchylenie standardowe na osi poziomej. Tak jak widać oczekiwany zysk jest liniową funkcją ryzyka. Ale w każdym punkcie CML znajduje się inny portfel, tzn. portfel o innym składzie. Jeżeli będziemy utrzymywać ten sam skład portfela, np. 70% indeksu i 30% obligacji skarbowych, to oczekiwany zysk nie będzie korelował z ryzykiem.

Niemal identyczna sytuacja występuje dla CAPM-SML, tylko odchylenie standardowe zostaje zastąpione betą, a punktami na SML nie są już różne udziały indeksu i obligacji skarbowych, ale różne aktywa, np. akcje. Te aktywa nie mają większej średniej stopy zwrotu, gdy jest większe odchylenie standardowe, ale ta stopa jest większa tylko wtedy gdy beta jest większa. Natomiast beta będzie dotyczyła (przede wszystkim) związku pomiędzy tą akcją a indeksem giełdowym.

Pytając o korelację oczekiwanego zysku z akcji a jej ryzykiem miałem na myśli zmiany w czasie. Aby odpowiedzieć na to pytanie, trzeba na początku rozdzielić parametry warunkowe, jak warunkowa wartość oczekiwana i warunkowa wariancja od parametrów niewarunkowych. A więc od razu mówię, że nie zajmuję się w tym artykule warunkowymi parametrami rozkładu.

Przechodząc do rzeczy, zacznę od Lukacsa [1], który w 1942 r. stwierdza:

Potrzebnym i wystarczającym warunkiem dla normalności rozkładu populacji jest to, aby rozkłady z próbki średniej i wariancji były wzajemnie niezależne.

Zhang [2] parafrazuje to zdanie Lukacsa:

Jeżeli wariancja (lub drugi moment) z rozkładu populacji istnieje, wtedy potrzebnym i wystarczającym warunkiem dla normalności rozkładu populacji jest to, aby średnia arytmetyczna dla próby i wariancja dla próby były wzajemnie niezależne.

Z tego twierdzenia wynika, że jeśli stopa zwrotu ma rozkład normalny, to oczekiwana stopa zwrotu i ryzyko (wariancja) są niezależne od siebie.

Powstaje pytanie czy średnia i wariancja są nadal niezależne od siebie, jeżeli rozkład stopy nie jest gaussowski? Odpowiedź brzmi: nie. Oznaczając oczekiwaną stopę zwrotu oraz wariancję dla próby odpowiednio:


gdzie R(t) to stopa zwrotu w okresie t oraz T to zakres próby, Zhang dowodzi, że (dla dowolnego rozkładu prawdopodobieństwa) jeśli trzeci moment centralny z populacji istnieje, który oznaczymy:



to spełniona jest zależność:

(1)

Z tego wzoru wynika, że dla dowolnego rozkładu:
1. zależność pomiędzy średnim zyskiem a ryzykiem zależy od skośności. Rozkład normalny ma zerową skośność (zerowy 3-ci moment centralny)
2. wraz ze wzrostem horyzontu inwestycyjnego, korelacja ryzyka i średniej stopy zwrotu zmniejsza się.

Powyższy problem można skomplikować. Analizując wzór (1) widać, że użyto założenia, że rozkład gęstości średniej i wariancji jest stały w czasie. Jeżeli parametr jest losowany K razy, to powstaje pewien rozkład gęstości (oznacza to K próbek i K*T stóp zwrotu). Można sobie wyobrazić, że po K-tym losowaniu następuje kolejnych K losowań, z których wyłania się inny rozkład parametrów (jeżeli jest N takich losowań, oznacza to N*K*T stóp zwrotu). Czy wtedy nadal będzie spełniona zależność (1) i nadal dla rozkładu normalnego będzie zachowana niezależność? Jeśli np. spółka się nagle zmieniła, czy pod wpływem wzrostu jej zadłużenia, a więc i ryzyka, oczekiwana stopa zwrotu nie powinna też wzrosnąć? Odpowiedź daje Trenkler [3], który podaje ogólniejszą wersję (1). Okazuje się, że że dla tak ogólnej sytuacji postać wzoru się zmienia. Ten nowy wzór jest dużo bardziej skomplikowany, bo operuje na macierzach. Aby oddać jego sens, intuicyjnie można go zapisać:

(2)





Czyli jednak średnia i wariancja mogą stać się zależne w niestacjonarnym rozkładzie normalnym. Jednakże nawet gdyby przyjąć duże parametry, jak średnia = 0,3, odchylenie st = 0,6, to próbując zastosować (2) dostajemy 2*0,3*0,6^2 = 0,216, co po podzieleniu przez T będzie mieć nieduży wpływ. Stąd (1) jest wystarczającym przybliżeniem.


Literatura:
[1] Lukacs, E., A Characterization of the Normal Distribution, 1942,
[2] Zhang, L., Sample Mean and Sample Variance: Their Covariance and Their (In)Dependence, 2007,
[3] Trenkler, G., Zhang, L. (2007), "Sample Mean and Sample Variance: Their Covariance and Their(In)Dependence," "The American Statistician," 61, 159-160: Comment by Trenkler, 2007.

niedziela, 19 czerwca 2016

Jak daleko możesz się odchylić?

Kupując akcje albo inne aktywa, każdy zawsze zastanawia się, jak daleko stopa zwrotu może się odchylić od średniej. Samo odchylenie standardowe nie wystarcza, aby to zmierzyć. Pewną pomocą jest nierówność Czebyszewa-Markowa (Czebyszewa-Bienayme), zgodnie z którą prawdopodobieństwo, że stopa zwrotu odchyli się o co najmniej x odchyleń standardowych, wynosi najwyżej 1/x^2. Np. szansa, że stopa zwrotu odchyli się min. o 2 odchylenia st., wynosi max 25%. Ogólnie nierówność ta jest zapisywana w postaci:



gdzie Pr - prawdopodobieństwo, m - wartość oczekiwana zmiennej X, s - odchylenie standardowe zmiennej X.

Twierdzenie to jednak daje słabą odpowiedź na pytanie na ile dana zmienna może się maksymalnie odchylić. Samuelson [1] w 1968 r. pokazał, że dodatkowa informacja w postaci liczebności populacji danej cechy może zwiększyć precyzję szacunków. Udowodnił on, że jeśli dana populacja zawiera n obserwacji, to żadna z nich nie może odchylić się o więcej niż (n - 1)^0.5 odchyleń standardowych od średniej. Jeśli przyjąć, że populacja na rynku ciągle rośnie, to znaczyłoby to, że możliwe odchylenie też rośnie. Jednak szybko zauważmy, że prawdopodobieństwo tego większego odchylenia spada. Połączmy bowiem tw. Samuelsona z tw. Czebyszewa-Markowa.

(1)



Z twierdzenia Czebyszewa-Markowa wynika, że jeżeli na świecie jest 7 mld ludzi, to prawdopodobieństwo, że wzrost jakiejś osoby przekroczy 7000000000^0,5 (=83666) odchylenia standardowego jest prawie zerowe. Ale twierdzenie Samuelsona mówi, że to prawdopodobieństwo jest dokładnie równe 0.

W artykule Odchylenie od nieznanej wartości oczekiwanej zrobiłem przykład obliczania odchylenia standardowego od nieznanej wartości oczekiwanej dla spółki LPP, gdzie było 10 obserwacji. Gdyby przyjąć, że to cała populacja, to podstawiając do (1), dostałbym informację, że stopa zmian EBIT może się odchylić od średniej o więcej niż 9^1/2 = 3 odchylenia st z szansą mniej niż 1/9. Jednakże dzięki tw. Samuelsona dostaję już informację, że stopa zmian EBIT może się maksymalnie odchylić od średniej o 3 odchylenia st. Wynika z tego, że niezależnie od tego z jakim rozkładem częstości mamy do czynienia (jednak muszą istnieć 2 pierwsze momenty centralne) prawo 3 sigm zadziała przy n = 10.

Niestety przyjęcie założenia, że obserwujemy pełną populację jest sztuczne albo po prostu nieprawdziwe. Wolkowicz i Styan [2], a potem Farnum [3] rozszerzyli twierdzenie Samuelsona na minimalną i maksymalną granicę k-tej obserwacji w populacji n-elementowej.

(2)


gdzie k = 1, 2, ..., n




Dla k = n, wzór (2) sprowadza się do tw. Samuelsona.
Trzeba zwrócić uwagę, że kolejne obserwacje od 1 do n zostały ustawione w kolejności rosnącej, a nie wylosowanej Tak więc, jeśli k = 1/2n , to znaczy, że x = mediana. Wtedy podstawiając do (2) widać, że mediana będzie zawsze większa od średniej pomniejszonej o jedno odchylenie standardowe oraz zawsze mniejsza od średniej powiększonej o prawie jedno odchylenie standardowe. Jeśli natomiast k = 3/4n, to x = trzeci kwartyl. Wtedy ten kwartyl zawsze będzie większy od średniej pomniejszonej o 0,58*odchylenia standardowego oraz zawsze mniejszy od średniej powiększonej o ((3n-4)/(n+1))^0,5 odchylenia standardowego (dla dużego n 1,73 odchylenia st).

Niestety praktyczne zastosowanie wzoru (2) może być nadal ograniczone ze względu na zbyt dużą ogólność rozkładu prawdopodobieństwa oraz fakt, że dostajemy w nich przedział ufności, który rozciąga się na pełen rozkład prawdopodobieństwa (a więc cały możliwy przedział odchylenia, nawet mało prawdopodobny). Pukelsheim [4] wzmocnił tw. Czebyszewa-Markowa pokazując (wcześniej dowiedli to Vysochanskij i Petuni), że dla dowolnego rozkładu jednomodalnego (tzn. zawierającego tylko jedną dominantę - wartość najczęstszą) w uproszczeniu:

(3)


gdzie s może być odchyleniem standardowym pobranym z próby.

Podstawmy do (3) np. d = 2s:

dla każdego d.

Czyli zmienna dowolnego rozkładu z jedną modą może się odchylić na 2 odchylenia standardowe z szansą nie większą niż 1/9. Jest to znaczna poprawa precyzji w stosunku do Czebyszewa, gdzie otrzymano 1/4.

Wzór (3) przedstawiłem w formie uproszczonej. W rzeczywistości jest on bardziej ogólny. Ma to ogromne znaczenie dla rynków. Dotychczasowe rezultaty wymagały nie tylko istnienia wartości oczekiwanej oraz odchylenia standardowego (i wariancji), ale też ich znajomości w populacji generalnej (niektóre rozkłady stabilne nie mają dobrze zdefiniowanych momentów centralnych). Natomiast wzór (3) wcale tego nie wymaga. W (3) użyłem średniej i wariancji, aby zachować spójność z poprzednimi przykładami. Jednak w ogólnym przypadku Pukelsheim podał następującą postać:

(4)

gdzie

v to jakieś centrum (średnia, mediana czy dominanta) zmiennej X,





W praktyce będziemy najczęściej wykorzystywać wzór (4) podstawiając d = cq:

(5)


gdzie c stanowi część q, którą zmienna ma pokonać.

Ogólność (5) pozwala w pewnym stopniu użyć go dla samej ceny. Np. wyobraźmy sobie, że kurs ma lokalną dominantę / medianę / wartość oczekiwaną  v i lokalne q. Wtedy, aby Pr = 0,5, c musi wynieść (8/5)^0,5 = 1,26 (drugi wzór, bo c = 1,26 < 1,63). Z kolei dla Pr = 1, c wynosi 1 (drugi wzór, bo c = 1 < 1,63). Można wyciągnąć wniosek, że najbardziej prawdopodobne c znajdzie się w zakresie od 1 do 1,26. Stąd najbardziej prawdopodobne odchylenie od centrum (v) będzie się mieścić pomiędzy q a 1,26q. Identyczny wniosek będzie oczywiście dla stopy zwrotu: będzie się ona odchylać od mediany, średniej lub dominanty w przedziale 1-1,26q z prawdopodobieństwem co najmniej 0,5.

Ciekawszą jednak implikacją tej formuły będzie chyba użycie jej dla celów analizy technicznej, w której posługujemy się oscylatorami. Poziom 1,26q wyznacza bowiem najbardziej prawdopodobny obszar odchylenia od mediany. Temat ten poruszyłem oddzielnie w artykule
Poziomy wykupienia i wyprzedania w AT mogą być obiektywne.


Literatura:
[1] Samuelson, P. A., How Deviant Can You Be?, Dec. 1968
[2] Wolkowicz, H., Styan, G. P. H., Extensions of Samuelson's Inequality, Aug. 1979
[3] Farnum, N. R., An Alternate Proof of Samuelson's Inequality and Its Extensions, Feb. 1989
[4] Pukelsheim, F., The Three Sigma Rule, May, 1994

sobota, 4 czerwca 2016

Jakie państwo? Jaki kapitalizm?

W internecie pojawiła się bardzo ciekawa lektura autorstwa Leszka Balcerowicza (w formie pytań i odpowiedzi), którą można wysłuchać na stronach załączonych poniżej:

Jakie państwo?

Jaki kapitalizm?

Lekkość tej lektury połączona z wielką wiedzą ekonomiczną autora sprawia, że słucha się jej z przyjemnością, a jednocześnie dostarcza ona klarownych odpowiedzi na wiele ważnych pytań.