niedziela, 13 marca 2016

Odchylenie od nieznanej wartości oczekiwanej

Tworząc portfel długoterminowy, np. fundusz emerytalny, powinniśmy być zainteresowani zarówno oczekiwaną stopą zwrotu, jak i możliwym odchyleniem od niej. W sytuacji gdy wartość oczekiwana jest znana, obliczenie odchylenia standardowego na podstawie próbki nie stanowi problemu. Jednak w rzeczywistym świecie wartość oczekiwana jest nieznana i wówczas sprawa się komplikuje.

Skoro potrafimy już oszacować samą wartość oczekiwaną, nawet gdy nie posiadamy pełnej o niej informacji (dwa ostatnie artykuły), obliczenie odchylenia staje się łatwiejsze. Hasbrouck [1] pokazuje, że wariancja portfela N-podokresowej przyszłej stopy zwrotu określona jest wzorem:

 (1)


gdzie:
R - stopa zwrotu brutto (zwykła stopa zwrotu plus jeden)
N - ostatni okres inwestycji (liczba przyszłych okresów inwestycji)
M - oczekiwana stopa zwrotu (wartość oczekiwana stopy zwrotu), która dla rozkładu normalnego wynosi (W poszukiwaniu nieznanej wartości oczekiwanej - część 1):


A - średnia arytmetyczna z próby
G - średnia geometryczna z próby

natomiast dla rozkładu log-normalnego, mimo że nie jest wersja bezpośrednia, to można zastosować (W poszukiwaniu nieznanej wartości oczekiwanej - część 2):



σ^2 - wariancja 1-okresowej stopy zwrotu brutto (z próby), tzn. dla N = 1.


W Dodatku przedstawiłem dowód, bo jego wyprowadzenie nie jest trudne, a poza tym widać wtedy dokładnie których parametrów w praktyce należy użyć.


Przykład.
Kontynuując przykład spółki LPP w okresie 2004-2014, mamy 10 rocznych stóp wzrostu EBIT i korzystając z danych w bankier.pl dla rozkładu log-normalnego otrzymałem M = 1,34 przy N = 5, co oznacza, że 5-letnia oczekiwana stopa wzrostu brutto wynosi M^5 = 4,32 (tj. stopa netto = 332%). Wiedząc to, chcemy się dowiedzieć, jak całkowita przyszła stopa może się odchylić od tej wartości oczekiwanej. Aby znaleźć odpowiedź, zastosujemy wzór (1). Do jego użycia brakuje nam wariancji dla N = 1, którą normalnie obliczamy z próby. Chociaż chodzi tu o wariancję stopy brutto, to jest ona równoważna wariancji stopy netto. W tym przykładzie wyniosła ona 0,63, czyli mówiąc prosto roczna stopa zmian EBIT miała wariancję 0,63. Podstawiając






Odchylenie standardowe jako pierwiastek z tej wariancji wynosi 8,08. Ostatecznie uzyskaliśmy odpowiedź, że po 5 latach EBIT LPP wzrośnie średnio o 332% +/- 808%. Dopiero teraz jesteśmy w stanie właściwie ocenić ryzyko inwestycyjne.


Dodatek:
Zadaniem jest wyznaczenie wariancji przyszłej stopy zwrotu R(N), która składa się z mniejszych, kapitalizowanych stóp zwrotu od okresu 1 do N. Każdą taką mniejszą stopę zwrotu możemy zapisać jako oczekiwaną stopę zwrotu M plus składnik losowy e(t). Kapitalizowana stopa zwrotu powstanie poprzez iloczyn tych mniejszych stóp zwrotu:


Składnik losowy e jest zmienną losową IID o wartości oczekiwanej równej 0.
Stąd wariancję możemy odpowiednio przekształcić:

(2)

Wykorzystujemy twierdzenie mówiące, że wartość oczekiwana iloczynu zmiennej losowej IID równa się iloczynowi wartości oczekiwanych tej zmiennej (zob. np. [2]), tzn. ogólnie:


Dzięki temu dwa przedostatnie wyrażenia we wzorze (2) zastąpimy odpowiednio przez:


Czyli podstawiając obydwa wyrazy do (2):

(3)

Na koniec zauważamy, że wariancja 1-okresowej stopy zwrotu (która jest znana) równa się wariancji składnika losowego:


Podstawiając ten wyraz do (3) dostajemy wzór (1).


Literatura:
[1] J. Hasbrouck, On Estimates of Long-Run Rates of Return: A Note, Dec., 1983
[2] P. Cheng, M. K. Deets, Statistical Biases and Security Rates of Return, Jun., 1971

niedziela, 14 lutego 2016

W poszukiwaniu nieznanej wartości oczekiwanej - część 2

Rozkłady log-normalne (logarytmicznie normalne), podobnie jak rozkłady normalne, znajdowane są dość często w przyrodzie. Opisywane są nimi wielkości populacji niektórych bakterii (np. [1], [2]), szybkość podwajania się średnicy niektórych przerzutów nowotworowych [3], mikroflora w Marsylii [4] czy ciśnienie krwi dla danej grupy wiekowej [5]. Angielska wikipedia podaje jeszcze wiele innych przykładów [6].

Wyjaśnienie jak powstaje rozkład log-normalny zawiera artykuł Pokrzywiony dzwon - rozkład lognormalny .W sytuacji gdy interesuje nas bardziej stopa zmian niż bezpośrednia zmiana, rozkłady te mogą okazać się poprawniejsze od normalnego.

W pierwszej części artykułu przedstawiłem formułę Blume'a na oszacowanie nieznanej oczekiwanej stopy wzrostu przy założeniu, że rozkład stóp jest normalny [7]. Jacqiuer, Kane, Marcus (JKM) wyprowadzili również wzór na oczekiwaną stopę, ale przy założeniu lognormalności [8, 9]. Wówczas jeżeli r to stopa zwrotu, to ln(1+r) posiada rozkład normalny. Zapamiętać można to w taki intuicyjny sposób, że logarytmując, dokonujemy "normalizacji" stopy zwrotu (jeżeli stopy mają rozkład log-normalny, to cena podlega geometrycznemu ruchowi Browna [10], wzrost jest więc multiplikatywny, a po logarytmicznej transformacji staje się arytmetycznym ruchem Browna, stąd stopy stają się "normalne").

W sumie rozważymy ich 3 wzory, które są tak naprawdę jednym i tym samym. Podstawowy wzór JKM na wartość oczekiwaną ceny akcji (aktywa) w przyszłym okresie N jest następujący

 

 gdzie:
g - średnia geometryczna stopa kapitalizacji ciągłej w rozkładzie lognormalnym. Uwaga: jednocześnie jest to średnia arytmetyczna logarytmów w rozkładzie normalnym. Wyznaczona z okresu od 1 do T,
σ^2 - wariancja logarytmicznej stopy dla rozkładu normalnego wyznaczona z okresu od 1 do T,
T - ostatni okres przeszłości, na podstawie którego wyznaczane są parametry,
N - okres przyszłości, dla którego szukamy wartości oczekiwanej stopy zwrotu M,
P(t) - cena akcji, aktywa w okresie t. 

Inaczej:
 

Zatem wartość oczekiwana stopy zwrotu brutto w całym okresie od 1 do N jest to:

(1)

 Oznaczmy m(N) samą stopę kapitalizacji:

(2)
 

Wzór (2) można rozpisać następująco:

 


Podstawmy ten wynik do (1):
(3)

 

Przypomnijmy, że bieżąca wartość oczekiwana w rozkładzie log-normalnym (a więc w okresie 0), estymowana przez średnią arytmetyczną brutto (A), jest dana wzorem (zob. [6]):

 (4)


Czyli wtedy kapitalizacja:

Moglibyśmy więc zapisać:


Stopa kapitalizacji ciągłej m(N) może być więc wyrażona w postaci średniej ważonej geometryczną stopą kapitalizacji i arytmetyczną stopą kapitalizacji. Otrzymujemy więc wzór podobny do estymatora Blume'a.

Jednakże m(N) jako kapitalizacja ciągła mniej nas interesuje, gdyż chcemy doprowadzić do porównywalności z estymatorem Blume'a. Chcemy uzyskać średnią efektywną stopę procentową. Brakuje nam do tego jeszcze średniej geometrycznej stopy brutto (G). Zważmy, że ani a, ani g nie są tutaj tymi samymi stopami netto rozważanymi w poprzedniej części, tylko kapitalizacjami ciągłymi. Najłatwiej odróżnić to w ten sposób, że stopa netto stanowi efektywną stopę procentową, tj. powstaje po prostu przez odjęcie 1 od brutto.

Mimo że nie mamy nigdzie podanej stopy G, możemy użyć wprost definicji średniej geometrycznej brutto zadając pytanie jak średnio cena rosła z okresu 0 do T:


Czyli:

(5)
 

Jednocześnie wiemy, że w kapitalizacji ciągłej stopa G pod wpływem ciągłości zastępowana zostaje przez 1+g, stąd:


Czyli:

(6)

Na marginesie warto zaznaczyć, że wzór (6) można rozpisać jako średnią arytmetyczną logarytmów stóp zwrotu (pokazałem to w artykule O relacji między arytmetyczną a geometryczną stopą zwrotu  - wzór (6)), a ponieważ  ln(1+r) posiada rozkład normalny, to oznacza, że g musi stanowić średnią arytmetyczną dla rozkładu normalnego.
Zauważmy, że (5) = (6), zatem wnioskujemy, że:

(7)


W końcu podstawiamy wynik z (4) do (3) oraz (7) do (3):

(8)


Podsumowując część techniczną, mamy 3 wzory, które stanowią tę samą formułę: (1),  (3), (8). Kapitalizacja m(N) we wzorze (3) przypomina estymator Blume'a, bo jest to faktycznie jego analogia. Najlepiej widać to analizując wzór (8). Jeśli podstawimy N = 1, to dla dużego T otrzymamy w przybliżeniu średnią arytmetyczną (dla 0 jest idealnie arytmetyczna), a gdy N = T, średnią geometryczną, a więc bardzo podobnie jak u Blume'a.

W celach praktycznych będzie nas raczej interesować uśrednione M(N), tj. pierwiastek z M(N). Po pierwsze:

(9) średnia efektywna stopa brutto


Po drugie wzory (1) i (2) prowadzą do związku:

(10) stopa kapitalizacji ciągłej


Przykład.
Wykorzystajmy przykład spółki LPP, który posłużył do obliczenia oczekiwanej stopy wzrostu EBIT w części 1 za pomocą estymatora Blume'a. Estymator ten zakładał jednak normalność tempa wzrostu. Jeżeli okaże się, że tempo to nie jest gaussowskie, ale za to zlogarytmowane tempo (tj. ln(1+tempo)) już tak, wtedy należy użyć estymatora JKM. Dla przypomnienia zakres danych to 2004-2014, zatem 10 rocznych stóp zwrotu (pierwsza obserwacja jest z grudnia 2004), na podstawie bankier.pl, zaś testy wykonałem w Gretlu. Testy na normalność stopy EBIT dały następujące wyniki:




Wszystkie 4 testy jednoznacznie każą nam odrzucić normalność. Natomiast testy dla obserwacji zlogarytmowanych przestają być tak oczywiste:



Próbka jest za mała, by obiektywnie ocenić czy jest to rozkład normalny czy nie. Widać jednak, że tendencja zmieniła się na korzyść normalności (p ok. 0,1 w dwóch testach). Aby obiektywniej przetestować hipotezę, zwiększyłem częstość obserwacji do kwartałów, tj. do 40 obserwacji. Testy znów wykazały brak normalności surowych danych:


 

co graficznie ilustruje poniższy histogram tej zmiennej:


 Jednak po zlogarytmowaniu (pozostało 36 poprawnych obserwacji), kwartalne stopy zysku stały się "normalne" dla wszystkich testów (wszystkie dają p znacznie powyżej 0,1):


  

 Histogram zmienia się diametralnie:

 

Przyznaję, nie jest to idealny dzwon, delikatnie mówiąc, ale testy eliminują subiektywizm. Reasumując, rozkład tempa zmian EBIT możemy uznać za log-normalny.

Przypomnę, że A = 1,41, G = 1,28 oraz chcemy wyznaczyć roczną oczekiwaną stopę zwrotu w ciągu 5 lat, tj. N = 5, mając 10 obserwacji (T=10). Po podstawieniu danych do... no właśnie i teraz uwaga. Mamy tu dwie różne wielkości: średnią efektywną stopę zwrotu oraz stopę kapitalizacji. Obliczmy obydwie wykorzystując formuły (9) i (10). Po podstawieniu danych do (9) dostałem M(N)^(1/N) = 1,34, czyli tak wyznaczona stopa netto 34% (dokładnie 34,3%) jest o 1,5 pkt proc. niższa niż wynikająca ze wzoru Blume'a.
Z kolei stopa kapitalizacji ciągłej na podstawie (10) równa się ln(1,34) = 29,5%. Jej porównanie z estymatorem Blume'a nie ma jednak sensu, bo dotyczy ona wielkości ciągłych, podczas gdy estymator Blume'a nie opiera się na nich.

Jeżeli nie jesteśmy przekonani czy nasza estymacja nie jest za wysoka lub za niska, zawsze możemy zastosować pierwotną wersję z wariancją:

(11)

Trzeba pamiętać wtedy, że wariancja pochodzi z rozkładu normalnego, czyli jest to wariancja z ln(1+r). Po podstawieniu danych do (11) dostałem wartość netto bardzo zbliżoną do 34% (dokładnie 33,8%), co potwierdza poprawność wyliczeń.
Porównując estymatory JKM i Blume'a stwierdzamy, że stosując estymator Blume'a zawyżylibyśmy potencjał wzrostu dla LPP.


[1] S. S. Hirano, E. V. Nordheim, D. C. Arny, C. D. Upper, Lognormal Distribution of Epiphytic Bacterial Populations on Leaf Surfaces, 1982 Sep,
[2] J. E. Loper, T. V. Suslow, M. N. Schroth, Lognormal distribution of bacterial populations in the rhizosphere, 1984,
[3] J. S. Spratt Jr, T. L. Spratt, Rates of Growth of Pulmonary Metastases and Host Survival, 1964
[4] C. Di Giorgio, A. Krempff, H. Guiraud, P. Binder, C. Tiret, G. Dumenil, Atmospheric pollution by airborne microorganisms in the city of Marseilles, 1996,
[5] R. W. Makuch, D. H. Freeman Jr., M. F. Johnson, Justification for the lognormal distribution as a model for blood pressure, 1979,
[6] https://en.wikipedia.org/wiki/Log-normal_distribution,
[7] M. E. Blume, Unbiased Estimators of Long-Run Expected Rates of Return, Sep., 1974,
[8] E. Jacqiuer, A. Kane, A. Marcus, Optimal Forecasts of Long-Term Returns and Asset Allocation: Geometric, Arithmetic, or Other Means?, October 31, 2002,
[9] E. Jacqiuer, A. Kane, A. Marcus, Geometric or Arithmetic Mean: Reconsideration , October 31, 2002,
[10] R. R. Marathe, S. M. Ryan, On the validity of the geometric Brownian motion assumption, 2005.