niedziela, 14 lutego 2016

W poszukiwaniu nieznanej wartości oczekiwanej - część 2

Rozkłady log-normalne (logarytmicznie normalne), podobnie jak rozkłady normalne, znajdowane są dość często w przyrodzie. Opisywane są nimi wielkości populacji niektórych bakterii (np. [1], [2]), szybkość podwajania się średnicy niektórych przerzutów nowotworowych [3], mikroflora w Marsylii [4] czy ciśnienie krwi dla danej grupy wiekowej [5]. Angielska wikipedia podaje jeszcze wiele innych przykładów [6].

Wyjaśnienie jak powstaje rozkład log-normalny zawiera artykuł Pokrzywiony dzwon - rozkład lognormalny .W sytuacji gdy interesuje nas bardziej stopa zmian niż bezpośrednia zmiana, rozkłady te mogą okazać się poprawniejsze od normalnego.

W pierwszej części artykułu przedstawiłem formułę Blume'a na oszacowanie nieznanej oczekiwanej stopy wzrostu przy założeniu, że rozkład stóp jest normalny [7]. Jacqiuer, Kane, Marcus (JKM) wyprowadzili również wzór na oczekiwaną stopę, ale przy założeniu lognormalności [8, 9]. Wówczas jeżeli r to stopa zwrotu, to ln(1+r) posiada rozkład normalny. Zapamiętać można to w taki intuicyjny sposób, że logarytmując, dokonujemy "normalizacji" stopy zwrotu (jeżeli stopy mają rozkład log-normalny, to cena podlega geometrycznemu ruchowi Browna [10], wzrost jest więc multiplikatywny, a po logarytmicznej transformacji staje się arytmetycznym ruchem Browna, stąd stopy stają się "normalne").

W sumie rozważymy ich 3 wzory, które są tak naprawdę jednym i tym samym. Podstawowy wzór JKM na wartość oczekiwaną ceny akcji (aktywa) w przyszłym okresie N jest następujący

 

 gdzie:
g - średnia geometryczna stopa kapitalizacji ciągłej w rozkładzie lognormalnym. Uwaga: jednocześnie jest to średnia arytmetyczna logarytmów w rozkładzie normalnym. Wyznaczona z okresu od 1 do T,
σ^2 - wariancja logarytmicznej stopy dla rozkładu normalnego wyznaczona z okresu od 1 do T,
T - ostatni okres przeszłości, na podstawie którego wyznaczane są parametry,
N - okres przyszłości, dla którego szukamy wartości oczekiwanej stopy zwrotu M,
P(t) - cena akcji, aktywa w okresie t. 

Inaczej:
 

Zatem wartość oczekiwana stopy zwrotu brutto w całym okresie od 1 do N jest to:

(1)

 Oznaczmy m(N) samą stopę kapitalizacji:

(2)
 

Wzór (2) można rozpisać następująco:

 


Podstawmy ten wynik do (1):
(3)

 

Przypomnijmy, że bieżąca wartość oczekiwana w rozkładzie log-normalnym (a więc w okresie 0), estymowana przez średnią arytmetyczną brutto (A), jest dana wzorem (zob. [6]):

 (4)


Czyli wtedy kapitalizacja:

Moglibyśmy więc zapisać:


Stopa kapitalizacji ciągłej m(N) może być więc wyrażona w postaci średniej ważonej geometryczną stopą kapitalizacji i arytmetyczną stopą kapitalizacji. Otrzymujemy więc wzór podobny do estymatora Blume'a.

Jednakże m(N) jako kapitalizacja ciągła mniej nas interesuje, gdyż chcemy doprowadzić do porównywalności z estymatorem Blume'a. Chcemy uzyskać średnią efektywną stopę procentową. Brakuje nam do tego jeszcze średniej geometrycznej stopy brutto (G). Zważmy, że ani a, ani g nie są tutaj tymi samymi stopami netto rozważanymi w poprzedniej części, tylko kapitalizacjami ciągłymi. Najłatwiej odróżnić to w ten sposób, że stopa netto stanowi efektywną stopę procentową, tj. powstaje po prostu przez odjęcie 1 od brutto.

Mimo że nie mamy nigdzie podanej stopy G, możemy użyć wprost definicji średniej geometrycznej brutto zadając pytanie jak średnio cena rosła z okresu 0 do T:


Czyli:

(5)
 

Jednocześnie wiemy, że w kapitalizacji ciągłej stopa G pod wpływem ciągłości zastępowana zostaje przez 1+g, stąd:


Czyli:

(6)

Na marginesie warto zaznaczyć, że wzór (6) można rozpisać jako średnią arytmetyczną logarytmów stóp zwrotu (pokazałem to w artykule O relacji między arytmetyczną a geometryczną stopą zwrotu  - wzór (6)), a ponieważ  ln(1+r) posiada rozkład normalny, to oznacza, że g musi stanowić średnią arytmetyczną dla rozkładu normalnego.
Zauważmy, że (5) = (6), zatem wnioskujemy, że:

(7)


W końcu podstawiamy wynik z (4) do (3) oraz (7) do (3):

(8)


Podsumowując część techniczną, mamy 3 wzory, które stanowią tę samą formułę: (1),  (3), (8). Kapitalizacja m(N) we wzorze (3) przypomina estymator Blume'a, bo jest to faktycznie jego analogia. Najlepiej widać to analizując wzór (8). Jeśli podstawimy N = 1, to dla dużego T otrzymamy w przybliżeniu średnią arytmetyczną (dla 0 jest idealnie arytmetyczna), a gdy N = T, średnią geometryczną, a więc bardzo podobnie jak u Blume'a.

W celach praktycznych będzie nas raczej interesować uśrednione M(N), tj. pierwiastek z M(N). Po pierwsze:

(9) średnia efektywna stopa brutto


Po drugie wzory (1) i (2) prowadzą do związku:

(10) stopa kapitalizacji ciągłej


Przykład.
Wykorzystajmy przykład spółki LPP, który posłużył do obliczenia oczekiwanej stopy wzrostu EBIT w części 1 za pomocą estymatora Blume'a. Estymator ten zakładał jednak normalność tempa wzrostu. Jeżeli okaże się, że tempo to nie jest gaussowskie, ale za to zlogarytmowane tempo (tj. ln(1+tempo)) już tak, wtedy należy użyć estymatora JKM. Dla przypomnienia zakres danych to 2004-2014, zatem 10 rocznych stóp zwrotu (pierwsza obserwacja jest z grudnia 2004), na podstawie bankier.pl, zaś testy wykonałem w Gretlu. Testy na normalność stopy EBIT dały następujące wyniki:




Wszystkie 4 testy jednoznacznie każą nam odrzucić normalność. Natomiast testy dla obserwacji zlogarytmowanych przestają być tak oczywiste:



Próbka jest za mała, by obiektywnie ocenić czy jest to rozkład normalny czy nie. Widać jednak, że tendencja zmieniła się na korzyść normalności (p ok. 0,1 w dwóch testach). Aby obiektywniej przetestować hipotezę, zwiększyłem częstość obserwacji do kwartałów, tj. do 40 obserwacji. Testy znów wykazały brak normalności surowych danych:


 

co graficznie ilustruje poniższy histogram tej zmiennej:


 Jednak po zlogarytmowaniu (pozostało 36 poprawnych obserwacji), kwartalne stopy zysku stały się "normalne" dla wszystkich testów (wszystkie dają p znacznie powyżej 0,1):


  

 Histogram zmienia się diametralnie:

 

Przyznaję, nie jest to idealny dzwon, delikatnie mówiąc, ale testy eliminują subiektywizm. Reasumując, rozkład tempa zmian EBIT możemy uznać za log-normalny.

Przypomnę, że A = 1,41, G = 1,28 oraz chcemy wyznaczyć roczną oczekiwaną stopę zwrotu w ciągu 5 lat, tj. N = 5, mając 10 obserwacji (T=10). Po podstawieniu danych do... no właśnie i teraz uwaga. Mamy tu dwie różne wielkości: średnią efektywną stopę zwrotu oraz stopę kapitalizacji. Obliczmy obydwie wykorzystując formuły (9) i (10). Po podstawieniu danych do (9) dostałem M(N)^(1/N) = 1,34, czyli tak wyznaczona stopa netto 34% (dokładnie 34,3%) jest o 1,5 pkt proc. niższa niż wynikająca ze wzoru Blume'a.
Z kolei stopa kapitalizacji ciągłej na podstawie (10) równa się ln(1,34) = 29,5%. Jej porównanie z estymatorem Blume'a nie ma jednak sensu, bo dotyczy ona wielkości ciągłych, podczas gdy estymator Blume'a nie opiera się na nich.

Jeżeli nie jesteśmy przekonani czy nasza estymacja nie jest za wysoka lub za niska, zawsze możemy zastosować pierwotną wersję z wariancją:

(11)

Trzeba pamiętać wtedy, że wariancja pochodzi z rozkładu normalnego, czyli jest to wariancja z ln(1+r). Po podstawieniu danych do (11) dostałem wartość netto bardzo zbliżoną do 34% (dokładnie 33,8%), co potwierdza poprawność wyliczeń.
Porównując estymatory JKM i Blume'a stwierdzamy, że stosując estymator Blume'a zawyżylibyśmy potencjał wzrostu dla LPP.


[1] S. S. Hirano, E. V. Nordheim, D. C. Arny, C. D. Upper, Lognormal Distribution of Epiphytic Bacterial Populations on Leaf Surfaces, 1982 Sep,
[2] J. E. Loper, T. V. Suslow, M. N. Schroth, Lognormal distribution of bacterial populations in the rhizosphere, 1984,
[3] J. S. Spratt Jr, T. L. Spratt, Rates of Growth of Pulmonary Metastases and Host Survival, 1964
[4] C. Di Giorgio, A. Krempff, H. Guiraud, P. Binder, C. Tiret, G. Dumenil, Atmospheric pollution by airborne microorganisms in the city of Marseilles, 1996,
[5] R. W. Makuch, D. H. Freeman Jr., M. F. Johnson, Justification for the lognormal distribution as a model for blood pressure, 1979,
[6] https://en.wikipedia.org/wiki/Log-normal_distribution,
[7] M. E. Blume, Unbiased Estimators of Long-Run Expected Rates of Return, Sep., 1974,
[8] E. Jacqiuer, A. Kane, A. Marcus, Optimal Forecasts of Long-Term Returns and Asset Allocation: Geometric, Arithmetic, or Other Means?, October 31, 2002,
[9] E. Jacqiuer, A. Kane, A. Marcus, Geometric or Arithmetic Mean: Reconsideration , October 31, 2002,
[10] R. R. Marathe, S. M. Ryan, On the validity of the geometric Brownian motion assumption, 2005.

niedziela, 10 stycznia 2016

W poszukiwaniu nieznanej wartości oczekiwanej - część 1

Czasami można spotkać się z zarzutami, że wyznaczenie wartości fundamentalnej akcji jest niemożliwe, bo prawdziwa wartość oczekiwana parametrów potrzebnych do obliczeń jest nieznana. Na ten problem można spojrzeć z dwóch różnych punktów widzenia. Z jednej strony dane statystyczne należą do jednej próbki, tj. ułamka populacji, w której niektóre dane należą do przyszłości. A przyszłość jest nieznana. Z drugiej strony można filozoficznie uznać, że przyszłość nie istnieje, a jedynie jest tworzona na bieżąco. To oznacza, że mamy wgląd do pełnej populacji statystycznej, a jedynie rozkład prawdopodobieństwa może się zmieniać w czasie, czyli proces jest niestacjonarny. W przypadku takich cech jak tempo zmian zysków firmy znaczenie może mieć cykliczność gospodarcza. Wiemy jednak, że cykle w ekonomii są nieokresowe, chaotyczne i bliżej im do losowości niż do niezmiennych reguł - tyle że potrzebny jest odpowiednio długi okres czasu.  Stąd szukanie wartości oczekiwanej zmian procentowych ma sens.

Te dwa punkty widzenia prowadzą do wspólnego mianownika: wyznaczając wartość oczekiwaną dla przyszłości na podstawie przeszłości, napotkamy barierę w postaci błędu statystycznego, którego wartość oczekiwana będzie różna od zera.

Ten artykuł jest swego rodzaju kontynuacją poprzedniego, który przygotowywał Czytelnika do zrozumienia pojęcia terminowej oczekiwanej stopy zwrotu. Wówczas operowałem jedynie pojęciem średniej terminowej, rozróżniając średnią arytmetyczną - jako krótkoterminową średnią oraz geometryczną stopę - jako długoterminową średnią. Następnie zwróciłem uwagę, że średnia może mieć zupełnie inną formę i być np. nachyleniem trendu liniowego.

Podział na okres krótki i długi jest umowny. Jeżeli nawet umówimy się, że średnia arytmetyczna to okres krótki, a geometryczna długi, to gdzie umieścić inne formy średniej? Np. jeżeli chcemy wyznaczyć prognozę dywidendy, to użyjemy regresji liniowej z logarytmiczną stopą zwrotu w roli nachylenia trendu (patrz Istota i znaczenie logarytmicznej stopy zwrotu), ale skoro wiemy, że to nachylenie wiąże średnią arytmetyczną  i geometryczną, to czy w takim razie jest ono swego rodzaju wartością oczekiwaną w średnim okresie?

Najpierw Blume [1] a później innym tropem Jacqiuer, Kane, Marcus (JKM) [2, 3] wyprowadzili różne optymalne nieobciążone estymatory wartości oczekiwanej długoterminowego tempa wzrostu. Oczywiście nasuwa się pytanie czym różnią się te estymatory pomiędzy sobą. Po pierwsze Blume stosuje przy dowodzeniu twierdzenie Taylora, a więc jego estymator daje przybliżoną wartość, podczas gdy JKM otrzymują dokładne wyniki. Po drugie Blume zakłada, że stopy zwrotu mają rozkład normalny, natomiast u JKM stopy mają rozkład logarytmiczno-normalny - wyjaśnienie tego założenia w artykule Pokrzywiony dzwon - rozkład lognormalny.

To tyle tematem wstępu. Obecnie zajmę się jedynie estymatorem Blume'a. W następnym artykule opiszę estymatory JKM.

Zanim przejdę do dalszej części, od razu zwrócę uwagę na rozróżnienie pomiędzy stopą brutto a netto. Stopa brutto to stopa o postaci R = 1+r, gdzie r to stopa netto. Aby wprowadzić jasny podział będę używał wielkich liter na zapisanie stóp brutto, a małych liter do stóp netto. Zauważmy też, że stopa brutto może być interpretowana jako wartość aktywa o początkowym kapitale 1 zł.

Blume dowodzi, że gdy wartość oczekiwana stopy brutto w przyszłości po N okresach jest nieznana, to prawidłowym estymatorem tej wartości jest średnia ważona średnią arytmetyczną i geometryczną o następującej postaci:

(1)


gdzie:
T - okres przeszłości
N - prognozowany okres przyszłości
A - średnia arytmetyczna stopa brutto (liczona dla danych z okresu T)
G - średnia geometryczna stopa brutto (liczona dla danych z okresu T)

Dowód wzoru (1) zamieściłem w dodatku.
Jeżeli N = 1, to estymator M sprowadza się do A. Jeżeli N = T, to estymator M sprawdza się do G. Precyzyjnie widać w jaki sposób kształtowana jest długoterminowa średnia, o której rozprawiałem w poprzednim artykule. Średnia arytmetyczna dotyczy prognozy 1 okresu wprzód, a geometryczna prognozy na T okresów wprzód (a więc dla geometrycznej okres przyszłości jest traktowany symetrycznie do okresu przeszłości). Estymator Blume'a uwzględnia także wspomnianą w poprzednim artykule względność krótkiego i długiego okresu czasu. Jeżeli bowiem T dąży do nieskończoności, to dla dowolnego stałego N wartość M sprowadza się do A, ponieważ zobaczmy, że możemy zapisać:



Tak więc nawet dla dużego N średnia arytmetyczna będzie prawidłowym estymatorem, bo w stosunku do jeszcze większego T będzie średnią krótkoterminową.


Przykład.
Obliczmy wartość oczekiwaną rocznej stopy wzrostu zysku operacyjnego spółki LPP przy założeniu, że prognozujemy 5 następnych lat, czyli N = 5. Dane pobrałem z bankier.pl, w którym dane finansowe spółki są dostępne od 2004 r., zatem w okresie 2004-2014 było 10 stóp zwrotu, co oznacza T = 10. Otrzymałem następujące parametry:
A = 1,405 (a = 40,5%)
G = 1,28 (g = 28%)

Po podstawieniu danych do (1) oraz wyciągnięciu pierwiastka 5-tego stopnia z M^5, uzyskałem
M = 1,355. Stąd m = 1-M = 35,5%.



Dodatek nr 1. Wyprowadzenie estymatora Blume'a.
M jest pewną nieznaną wartością oczekiwaną stopy brutto. W każdym okresie t (od 1 do T) stopa brutto odchyla się od M:

(2)

Pierwszą częścią wyprowadzenia (1) jest znalezienie przybliżonej wartości oczekiwanej średniej arytmetycznej. Wynika z tego, że średnią traktujemy jak zmienną losową. (Jednak szukana wartość oczekiwana nie dotyczy tylko okresu T, ale także abstrakcyjnej przyszłości).
Sumując wszystkie R(t) dostaniemy:

(3)


Dzieląc obie strony przez T uzyskamy średnią arytmetyczną:

(4)



Oznaczmy:

(5)

i podnieśmy (4) do N:





 Poszukujemy wartości oczekiwanej średniej arytmetycznej w okresie N:

(6)


 Funkcję (1+h/M)^N możemy przybliżyć za pomocą wzoru Taylora (Maclaurina). Wszystkie składniki tej funkcji są stałymi poza h. Zakładamy, że h jest zmienną losową o rozkładzie normalnym, której wartość oczekiwana jest równa 0. W takim razie uznamy, że ostatni wyraz we wzorze Taylora zatrzyma się na potędze 2, ponieważ h^3 będzie równe 0 (wiąże się ze skośnością), natomiast pozostałe będą wyrazy będą niewielkie (h^4 = 3 dla r. Gaussa, ale dzielone zostanie przez 24). Stąd przybliżeniem będzie:

(7)



Samo h jest średnią arytmetyczną składnika losowego, zmienną w czasie. Nie wiadomo jaka będzie jej wartość w prognozowanym okresie. Wiadomo tylko, że h jest zmienną losową z E(h) = 0. Teraz znajdziemy wariancję h. Jest ona powiązana z wariancją składnika losowego e. W przeciwieństwie do średniej z próby, wariancja z próby składnika losowego e jest znana, tzn. przyjmujemy, że jest równa wariancji z populacji i może być wyznaczona w oparciu o historyczne dane z okresu od 1 do T. Zapiszmy:


Pamiętając czym jest h ze wzoru (5) oraz ze względu na niezależność od siebie składników losowych e(t), wykorzystujemy własność wariancji polegającej na tym, że wariancja sumy niezależnych zmiennych jest równa sumie wariancji tych zmiennych (zob. np. https://en.wikipedia.org/wiki/Variance)


 


Nasze składniki losowe e(t) mają nie tylko znaną wariancję, ale ich wariancja pozostaje zawsze ta sama (tak zakładamy). Skoro T-krotnie sumowane są stałe, to znaczy, że możemy znak sumy zastąpić T, tak że uzyskujemy poszukiwaną wariancję h:

(8)


Wkładamy (7) do (6), wykorzystujemy możliwość rozbicia wartości oczekiwanej na części (pamiętamy, że E(h) = 0) i do tej formuły podstawiamy rozwiązanie z (8), dostając:


(9)



Zauważmy, że mimo iż zgodnie z prawem wielkich liczb średnia arytmetyczna dąży do swojej wartości oczekiwanej, to twierdzenie to nie dotyczy średnich podnoszonych do potęgi N > 1.

Drugą częścią jest znalezienie przybliżenia dla wartości oczekiwanej geometrycznej stopy zwrotu.

Geometryczną stopę brutto możemy zapisać jako iloczyn prawdziwej średniej skorygowaną o błędy statystyczne po T okresach i spierwiastkowaną T-tym okresem:

Prognozowana średnia geometryczna w okresie N będzie podnoszona N-tą potęgą:


Ponieważ nie znamy przyszłości, to nie znamy prawdziwej średniej geometrycznej, więc G^N to zmienna losowa. Poszukujemy więc wartości oczekiwanej tej zmiennej. Dokonujemy dodatkowo przekształcenia:

(10)



Wiedząc, że e(t) to zmienna losowa o rozkładzie normalnym, stosujemy podobnie jak poprzednio (7) stosujemy przybliżenie za pomocą wzoru Taylora-Maclaurina do drugiego rzędu,



Otrzymany wynik wkładamy do (10):


Pierwsze wyrazy w nawiasie kwadratowym moglibyśmy zapisać w postaci sum:



Wprowadzamy oczywiste założenie:


Składniki e(t) sumarycznie w okresie od 1 do T nie dają zera (bo h nie równa się zero). Sumy te wyzerują się  dopiero ze względu na to, że E(e) = 0. Ponadto składniki e(t) są od siebie niezależne. Stąd otrzymujemy:

(11)

Elementy oznaczone (...) stają niewielkie, dlatego je odrzuciliśmy. Powracając do pierwotnych oznaczeń zamiast X i Y, równanie (11) zapiszemy:

(12)


Widzimy, że wyraz K pojawia się po raz drugi. W tym miejscu podejmiemy nieco kontrowersyjną decyzję, by drugi wyraz w nawiasie w (12) uznać za zerowy, czyli że K^2 = 0. Chodzi tu o uproszczenie obliczeń. (Blume robi trochę inaczej, ponieważ używa podwójnej aproksymacji ze wzoru Taylora, ale także opuszcza rzędy wyższe niż 2). Czyli wtedy:

(13)

Ponieważ w (9) pojawiło się także K, rozwiązujemy układ równań (9-13), znajdując K dla pierwszego i dla drugiego i zrównujemy ze sobą:



Rozwiązanie tego równania względem M^N daje wzór (1).


Literatura:
[1] M. E. Blume, Unbiased Estimators of Long-Run Expected Rates of Return, Sep., 1974
[2] E. Jacqiuer, A. Kane, A. Marcus, Optimal Forecasts of Long-Term Returns and Asset Allocation: Geometric, Arithmetic, or Other Means?, October 31, 2002
[3] E. Jacqiuer, A. Kane, A. Marcus, Geometric or Arithmetic Mean: Reconsideration , October 31, 2002
[4] P. Cheng, M. K. Deets, Statistical Biases and Security Rates of Return, Jun., 1971
[5] https://en.wikipedia.org/wiki/Variance

..................................................................

Dodatek nr 2:
Jeżeli zachowalibyśmy pełne równanie (12), wtedy rozwiązanie układu równań (9-12) również jest możliwe, ale wynik wydaje się szalenie skomplikowany. Po pierwsze powstają 2 dodatnie rozwiązania. Aby wynik znajdował się zgodnie z intuicją pomiędzy A a G, należy wybrać to większe. Po drugie Wolfram Alpha pokazał następujące (to większe) rozwiązanie:

(14)

To samo uzyskane w Matlabie rozwiązanie jest już kompletnie nieczytelne:

(14)

H = -(C - (- 3*B^2*N^2 + 6*B^2*N*T - 3*B^2*T^2 + 2*B*C*N^2 - 6*B*C*N*T + 2*B*C*N + 4*B*C*T^2 - 2*B*C*T + C^2*N^2 - 2*C^2*N + C^2)^(1/2) + B*N - B*T - 2*C*N + B*N^2 + 2*B*T^2 + C*N^2 + N*(- 3*B^2*N^2 + 6*B^2*N*T - 3*B^2*T^2 + 2*B*C*N^2 - 6*B*C*N*T + 2*B*C*N + 4*B*C*T^2 - 2*B*C*T + C^2*N^2 - 2*C^2*N + C^2)^(1/2) - 3*B*N*T)/(2*(- N^2 + N*T + N - T^2 + T - 1))

gdzie oznaczono:
H = M^N
B = A^N
C = G^N

Gdy podstawimy te same dane co w przykładzie powyżej, tj. B = 1,405^5, C = 1,28^5, N = 5 i T = 10, to dostaniemy H = 4.3778, czyli M = 1,3435 (różnica 1,15 pkt proc). Różnica między (1) a (14) zachowuje się nieliniowo. Gdy T = 15, dla (1) M = 1,3737, a dla (14) M = 1,3558, czyli różnica wzrasta (do 1,79 pkt proc).

Gdy N rośnie, (1) i (14) jeszcze bardziej się zbliżają. W tym przypadku gdyby N = 75 i T = 80, to dla (1) M = 1,404, a dla (14) M = 1,4045. Wzór (14) w punktach granicznych zachowuje się identycznie jak (1). Czyli jeśli N = 1, to w (14) M = A oraz jeśli N = T, to w (14) M = G.

Krótko mówiąc wzór (1) jest zupełnie wystarczającym przybliżeniem, gdy liczba obserwacji wynosi powyżej 40, natomiast dla małej liczby można wziąć pewną niewielką ujemną poprawkę (1-2 pkt proc.).

wtorek, 15 grudnia 2015

Krótkoterminowa vs. długoterminowa średnia stopa zwrotu

Inwestorzy przyzwyczaili się do sformułowania "długoterminowa stopa zwrotu" w rozumieniu stopy zwrotu w długim okresie czasu. Jednakże długoterminowa średnia stopa zwrotu to termin oznaczający zupełnie coś innego. Właściwie długoterminową średnią stopę zwrotu można utożsamić z geometryczną średnią stopą zwrotu, natomiast krótkoterminową średnią stopę zwrotu z arytmetyczną średnią stopą zwrotu. Jeżeli jednak takie definicje uznamy za prawdziwe, to po co tworzę tutaj nowe nazwy zamiast po prostu używać pojęć geometryczna i arytmetyczna średnia? Żeby poczuć trochę to zagadnienie, podam przykład. Oto wykres miesięcznego kursu spółki ERG od początku 2007 do 30.11.2015:


Kurs spadł w ciągu 9 lat z 80 zł do 20 zł (po uwzględnieniu splitów). Geometryczna miesięczna średnia stopa zwrotu, jak łatwo się domyślić, jest ujemna i wynosi w tym okresie -1,3%. Ale już zupełnie nieintuicyjnym faktem jest arytmetyczna średnia miesięczna, która równa się w tym samym okresie +0,182%. Czyli arytmetyczna średnia kompletnie zafałszowuje obraz sytuacji. Dlaczego tak się dzieje? Właśnie dlatego, że średnia arytmetyczna oddaje zmiany w krótkim okresie (1 miesiąc), zaś geometryczna bierze pod uwagę tylko stosunek ostatniej i pierwszej ceny uśredniając go w odpowiednim przedziale czasu.

Głębsze wyjaśnienie skąd wynika ta różnica zawiera artykuł O relacji między arytmetyczną a geometryczną stopą zwrotu. Pokazałem tam, że średnia geometryczna może być wyrażona jako relacja między średnią arytmetyczną, kurtozą i skośnością. Podstawiając dla ERG parametry do wzoru G1 w tym artykule, dostaniemy przybliżenie średniej geometrycznej równe -1,46% a więc bardzo blisko prawdziwej wartości -1,3%.

Mówiąc krótko, w krótkich okresach czasu uwidacznia się wpływ wariancji, kurtozy i skośności, a w długim okresie ich wpływ traci na znaczeniu.

Można byłoby więc zapytać czy w takim razie bardziej opłacalna jest strategia krótkoterminowa polegająca na szukaniu spółek o wysokiej wariancji, ujemnej (lewostronnej) skośności i wysokiej kurtozie, dająca wyższe arytmetyczne stopy zwrotu? Po pierwsze na przeszkodzie stoją koszty prowizji, w przypadku ERG sprowadzają dodatnią stopę do ujemnej - dla średniej stopy 0,182% po uwzględnieniu prowizji nawet 0,2% dostaniemy stopę -0,22%, a stosując ten manewr w przeciągu 106 miesięcy (od 31.01.2007 do 30.11.2015) -21% (patrz - Czy stop lossy są opłacalne? ). Po drugie jeśli przyjąć, że wybieramy tylko pojedyncze miesiące na transakcję, trzeba uwzględnić ryzyko mierzone właśnie przez wariancję, kurtozę i skośność (patrz - Uogólniony wskaźnik Sharpe'a ).

Powróćmy do początkowego pytania dlaczego długoterminową średnią nie nazywam po prostu geometryczną średnią? Na głębsze wyjaśnienie przyjdzie jeszcze czas, ale teraz tylko zadam takie pytanie: czy obliczona na podstawie modelu regresji liniowej logarytmiczna stopa zwrotu jest średnią długoterminową czy krótkoterminową? W artykule  Istota i znaczenie logarytmicznej stopy zwrotu
przedstawiam ideę logarytmicznej stopy zwrotu, która łączy w sobie elementy średniej geometrycznej i arytmetycznej. Pokażę to teraz trochę matematycznie.

A) Element średniej geometrycznej.
Wiadomo, że logarytmiczna średnia stopa stanowi tutaj nachylenie linii trendu logarytmicznej ceny. Wiedząc to oraz wykorzystując równanie podane w Istota i znaczenie logarytmicznej stopy zwrotu możemy zapisać prognozowaną cenę w postaci:

(1)





gdzie r(L) - logarytmiczna stopa zwrotu dla kapitalizacji ciągłej, a, b - stałe, t - czas.
W równaniu (1) zamieniłem także  a = lnP(0), bo jest to po prostu pierwsza logarytmiczna cena w okresie 0.

Zauważamy, że średnia geometryczna stopa zwrotu w okresie t, G(t), w kapitalizacji ciągłej może być przybliżona logarytmiczną stopą zwrotu:




B) Element średniej arytmetycznej.

Na podstawie (1) zapisujemy:

(2)


Tak jak wcześniej powiedziano, parametr a jest po prostu pierwszą (w t = 0) logarytmiczną ceną. Natomiast prognozowana logarytmiczna cena w okresie t jest wartością oczekiwaną lnP(t). W sumie więc (2) zapiszemy w postaci:

(3)





Wyraz ten możemy przekształcić:



















Stąd widać, że parametr nachylenia z modelu regresji, jest wartością oczekiwaną średniej (arytmetycznej) logarytmicznej stopy zwrotu.


I na koniec: parametr nachylenia regresji liniowej jest obliczany wzorem:

(4)


gdzie standardowo kreska pozioma oznacza średnią.

Tak wyznaczony parametr jest estymatorem nieobciążonym, a więc wartość parametru jest równa wartości oczekiwanej tego parametru, tj:

r(L) = E(r(L))

Innymi słowy wartość oczekiwana logarytmicznej stopy zwrotu jest równa formule (4). Jak wiadomo zgodnie z prawem wielkich liczb średnia arytmetyczna będzie dążyć w długim okresie do wartości oczekiwanej.
Trzeba nadmienić, że z punktu widzenia prognozy estymator otrzymany z regresji liniowej (za pomocą MNK) jest estymatorem często najefektywniejszym, a więc lepszym od średniej arytmetycznej i geometrycznej - tj. posiada najmniejszą wariancję spośród estymatorów nieobciążonych. 

Powyższa analiza ilustruje, że pojęcie długoterminowej średniej stopy zwrotu nie musi dotyczyć tylko średniej geometrycznej. W momencie gdy estymacja średniej dokonywana jest metodą regresji liniowej, mamy do czynienia z zupełnie nową miarą długoterminowej średniej. W przykładzie ERG nachylenie log ceny uzyskamy oczywiście ujemne, co upodabnia tę miarę do geometrycznej średniej. Z drugiej strony poziom tego nachylenia jest też kształtowany przez zmiany wewnątrz całego okresu, co przybliża je do średniej arytmetycznej.





 Nachylenie linii regresji wyniosło -0,0155. Po przekształceniu na prostą stopę dostaniemy exp(-0,0155)-1 = -0,0154.

niedziela, 6 grudnia 2015

Krótka ocena koniunktury w Polsce na tle WIG

Na blogach giełdowych aż huczy wiadomość, że WIG wpadł w bessę. Faktycznie, jeśli kryterium zaczęcia bessy ma być przecięcie od góry spadającej 200-sesyjnej średniej kroczącej przez spadającą 50-sesyjną średnią kroczącą (tzw. krzyż śmierci), to taki scenariusz już w sierpniu został spełniony:



Przebicie ostatnich dołków potwierdziło sygnał bessy. Zwracam uwagę, że sam "krzyż śmierci" wcale nie oznacza na 100%, że giełda będzie spadać przez kolejne kilka lat. Jeszcze przecież niedawno w 2011 mieliśmy do czynienia z ostrą zapaścią, ale zapaść ta miała miejsce przed zetknięciem się obydwu średnich, natomiast po tym zdarzeniu indeks stał w miejscu przez ok. 9 miesięcy. Co ciekawe, właśnie wtedy nastąpił kolejny "krzyż śmierci", który tym razem rozpoczął hossę... 


Zdecydowanie bardziej racjonalne jest przyjrzenie się danym makro. Ponieważ giełda głównie oddaje klimat gospodarczy i nastroje inwestorów, dobrze jest porównać ze wskaźnikiem ogólnego klimatu koniunktury obliczanego przez GUS co miesiąc. W Wyjaśnieniach metodyczne GUS objaśnia, że "Wskaźnik ogólnego klimatu koniunktury jest średnią arytmetyczną z ważonych sald odnoszących się do pytań o aktualną oraz przewidywaną ogólną sytuację gospodarczą przedsiębiorstwa."

Poniżej przedstawiam wykres tego wskaźnika dla wybranych składników gospodarczych w kolejnych miesiącach w okresie 1.2000-11.2015:



Aby ocenić naocznie sytuację bieżącą, wklejam ten sam wykres w okresie 1.2011-11.2015



Wśród 4 grup tylko budownictwo jest na lekkim minusie. Jak widać budownictwo, handel i przemysł są ze sobą skorelowane, bo zachowują się podobnie i wszystkie 3 składniki systematycznie, wręcz sezonowo, wzrastają. Przemysł trochę niepokoi, bo kolejny szczyt znalazł się poniżej poprzedniego. Inaczej sprawa wygląda w finansach, które posiadają wysoki optymizm, ale one charakteryzują się średnio wyższym optymizmem na tle reszty, prawdopodobnie z powodu psychologicznej charakterystyki zawodu. Ostatnie zawirowania na WIG_BANKI, który stracił w ciągu ostatniego roku 30% (sam WIG stracił 13%) pokazują, że nie można ufać finansistom co do ich własnej percepcji branży. Jeżeli właśnie chodzi o banki, to na blogu App Funds pojawił się wpis dokładniej tłumaczący ostatnie kłopoty banków na parkiecie. DM BPS prognozuje, że sektor bankowy straci na nowym podatku bankowym średnio 36% zysku netto. Czy można więc dziwić się spadku 30% w ciągu roku? Pytanie jest retoryczne, co więcej spadki banków będą zapewne większe.

Produkcja natomiast wcale nie jest w złej kondycji. Tak jak wspomniałem, przemysł trochę budzi niepewność. Dla rozjaśnienia sytuacji sprawdziłem samą miesięczną produkcję przemysłową na podstawie danych GUS. Poniżej zamieściłem jej wykres w okresie 1.2010-11.2015.


Wykres wskazuje, że sektor przemysłowy znajduje się w lekkim trendzie rosnącym.


Źródło danych:
http://stat.gov.pl/
http://appfunds.blogspot.com

niedziela, 25 października 2015

Pokrzywiony dzwon - rozkład lognormalny

W wielu współczesnych modelach ekonomicznych pojawia się założenie lognormalności rozkładu tempa zmian jakiejś cechy, choć rozkład ten nie jest zbyt dobrze znany w finansach. Z czego wynika to założenie? To jest tematem tego artykułu. Gdyby najprościej chcieć zdefiniować rozkład logarytmicznie normalny (log-normalny), to powiedzielibyśmy, że jeśli logarytm zmiennej x ma rozkład normalny, to sama zmienna x ma rozkład lognormalny. O ile dla logarytmu z x rozkład jest normalny, to dla samego x będzie log-normalny. To przekształcenie z funkcji ln(x) na x przekształca kształt rozkładu, który staje się asymetryczny. Poniższy przykład pozwala porównać oba rozkłady:




Jak widać lognormalny rozkład może posiadać dużą prawostronną skośność. Co więcej, posiada on także niezerową kurtozę odpowiadającą za to, że rzadkie zdarzenia nie są aż tak rzadkie.

Wprowadźmy logarytmiczną stopę zwrotu w okresie od 0 do t:

(1)

Czysto matematycznie stopę tę możemy rozłożyć na sumę wielu podokresów:


Zgodnie z centralnym twierdzeniem granicznym w ogólnej postaci, jeśli losowa logarytmiczna stopa w każdym podokresie będzie miała skończoną wartość oczekiwaną i wariancję, to suma wielu takich stóp zwrotu będzie dążyć do rozkładu normalnego. Nie jest konieczna niezależność stóp zwrotu (chociaż musi być zachowana ogólna losowość i autokorelacja stóp może być tylko czasowa) ani identyczność rozkładów w każdym okresie - proste ujęcie można przeczytać w angielskiej wikipedii:
https://en.wikipedia.org/wiki/Central_limit_theorem#Central_limit_theorems_for_dependent_processes

Bardziej szczegółowe i specjalistyczne omówienie tego zagadnienia Czytelnik znajdzie np. w [1].

Skoro suma takich stóp dąży do normalności, to znaczy, że logarytmiczna stopa zwrotu podana we wzorze (1) ma w gruncie rzeczy rozkład normalny. Przekształćmy teraz wzór (1):



Ale matematycznie oznacza to, że:



 I w ten sposób dotarliśmy do rozkładu lognormalnego: jeżeli zmienna x ma rozkład normalny, to exp(x) ma rozkład lognormalny (zob. np. Log-normal_distribution ). Wynika z tego, że stopa brutto P(t) / P(t-1) musi mieć rozkład log-normalny. A zatem prosta stopa zwrotu netto, P(t) / P(t-1) - 1, także ma rozkład log-normalny.

Oparcie się na centralnym twierdzeniu granicznym wynika z faktu, że logarytmiczne stopy zwrotu można do siebie dodawać. Rozumowanie to nie jest więc możliwe do przeprowadzenia na zwykłych stopach zwrotu. Z drugiej strony jeśli suma zmiennych dąży do rozkładu normalnego, to również średnia arytmetyczna musi do niego dążyć. W związku z tym ostatnim zdaniem rodzą się liczne nieporozumienia: można pomyśleć, że skoro tak, to średnia miesięczna stopa zwrotu z danego roku powinna dążyć do rozkładu Gaussa. Ale przecież jest to średnia zaledwie z 12 miesięcy, podczas gdy twierdzenie dotyczy granicy w nieskończoności okresów.

Z punktu widzenia miar średnich możemy uznać, że:
- geometryczna stopa zwrotu powstająca poprzez cechę multiplikatywności stóp zwrotu brutto będzie mieć rozkład logarytmicznie normalny
- arytmetyczna stopa zwrotu powstająca poprzez sumę stóp zwrotu netto będzie mieć rozkład normalny.

Dodatkowo również warto zastanowić się nad kwestią wskaźnika Sharpe'a opartym na idei symetryczności ryzyka. Jeśli już stosujemy ten wskaźnik to powinniśmy raczej używać logarytmicznych stóp zwrotu, aby uzyskać rozkład normalny, a przez to symetryczność. Właściwie wszędzie tam gdzie potrzebna jest symetria rozkładu, trzeba oprzeć się na logarytmicznych stopach zwrotu. Nic dziwnego więc, że w modelach Markowitza, CAPM i innych często się ich używa.

Podsumowując, rozkład log-normalny jest bardziej naturalnym czy nawet "normalnym" rozkładem od rozkładu Gaussa dla stóp zwrotu, a jego zrozumienie zmienia nasze spojrzenie na statystykę w finansach.



Literatura:

[1] Andrews D. W. K., An  Empirical  Process  Central  Limit  Theorem for  Dependent  Non-identically  Distributed Random  VariableJournal of Multivariate Analysis 38, 187-203 (1991);
[2] E. Limpert, W. A. Stahel, M. Abbt, Log-normal Distributions across the Sciences: Keys and Clues, May 2001 / Vol. 51 No. 5
[2] https://en.wikipedia.org 

wtorek, 13 października 2015

Czym się różni oczekiwany zysk od wartości oczekiwanej zysku?

Ten wpis mógłbym rozpocząć i zakończyć jednym zdaniem: Oczekiwana stopa w sensie ekonomicznym to nie jest wartość oczekiwana stopy w sensie matematycznym. Zakończenie takim zdaniem nie jest jednak do końca pełne. Gdybym sam się mocniej nad tym nie zastanawiał, to uznałbym to zdanie za banalne - na pierwszą kategorię spojrzałbym przez pryzmat wymagań: inwestorzy będą brać pod uwagę nie tylko dane statystyczne, tzn. ilościowe, ale także jakościowe, czy finanse są przejrzyste, czy zarząd wypełnia swoje obowiązki i wywiązuje się z obietnic lub prognoz itp. Ponadto mogą przyjść informacje ekonomiczne, które zmienią poziom ryzyka, a więc i wymaganą premię za ryzyko.
Z tego punktu widzenia oczekiwana stopa wydaje się być czymś ulotnym, subiektywnym, opartym bardziej na funkcji użyteczności niż twardych danych historycznych.
Jednak idąc tropem modeli ekonomicznych, takich jak CAPM dochodzimy do wniosku, że oczekiwana stopa zwrotu jest jak najbardziej do obliczenia. Tak więc pełniejsza odpowiedź na tytułowe pytanie byłaby następująca. O ile wartość oczekiwana jest po prostu miarą statystyczną, o tyle na oczekiwaną stopę zwrotu wpływają koszty ekonomiczne jak czas i ryzyko. To ryzyko może mieć charakter zarówno mikroekonomiczny, a więc dotyczyć tylko samej spółki, jak i makroekonomiczny, a więc dotyczyć gospodarki, która z kolei przekłada się na zmiany indeksu giełdowego. W pierwszym przypadku, jeżeli przychodzi wiadomość, że spółka zostaje zmuszona zwiększyć zadłużenie, wzrasta ryzyko niewypłacalności, zatem inwestorzy będą wymagać większej premii za ryzyko trzymania akcji - oczekiwana stopa zwrotu rośnie (cena spada), ale przecież wartość oczekiwana nie zmienia się... W drugim przypadku, jeżeli gospodarka nagle się osłabia, to zwiększa się niepewność rynku, tak że inwestorzy będą wymagać większej premii za ryzyko trzymania akcji, tj. zwiększa się oczekiwana stopa zwrotu (indeksy spadają), ale - znów - wartość oczekiwana stopy nie zmieniła się. A przecież dokładnie o tym mówi CAPM, zgodnie z którym oczekiwana stopa zwrotu stanowi funkcję ceny za ryzyko (tj. powiązania awersji do ryzyka z samym ryzykiem). Jeżeli więc akcje są skorelowane z rynkiem , to sama wartość oczekiwana może być zupełnie różna.

Jednak chyba najtrudniejszą rzeczą do zrozumienia tutaj jest przejście od modelu Markowitza do CAPM. Model Markowitza opiera się na oczekiwanych stopach zwrotu, które mogą jeszcze zostać utożsamione z wartościami oczekiwanymi (średnimi). Ale jego przejście w CAPM zmienia skalę mikro w makro, tzn. powstaje korelacja z całym rynkiem i z tego powodu oczekiwana stopa zwrotu staje się miarą opartą na ryzyku rynkowym - a więc nie może być obliczona tak po prostu przez średnią. To daje do myślenia!

Zmiany i ceny akcji są miarami subiektywnych oczekiwań inwestorów. Zupełnie inna sprawa dotyczy takich kategorii jak zmiany przychodów, zysku, dywidendy czy przepływów pieniężnych. Inwestorzy nie mają wpływu na te parametry, nie mogą więcej wymagać od spółki, bo wymagają maksimum efektywności zarządzania. Oczywiście kolejne informacje zarówno mikro jak i makro, będą wpływać na ocenę oczekiwań finansów spółki. Tylko że ocena tych oczekiwań kształtuje właśnie kurs i stopy zwrotu, a nie kategorie księgowe. Można powiedzieć, że kategorie księgowe są obiektywne, a rynkowe subiektywne. O ile oczekiwana stopa zwrotu z akcji jest funkcją "subiektywnej" awersji do ryzyka oraz "subiektywnej" miary ryzyka, o tyle parametry księgowe im nie podlegają, a na pewno nie podlegają w tak szerokim zakresie. Dlatego ich oczekiwania będą wyznaczane przez jakieś średnie.

Podsumowując: zawsze musimy wiedzieć co dokładnie chcemy wyznaczyć. Jeżeli chcemy stworzyć tylko optymalny portfel Markowitza, to wystarczy wyznaczyć pewną średnią stopę zwrotu. Jeśli chcemy oszacować stopę zwrotu w równowadze rynkowej (ile inwestor ma prawa wymagać), wtedy sięgamy do modeli równowagowych, jak CAPM. Jeśli utożsamimy wartość fundamentalną akcji z wartością w równowadze, to do wyznaczenia takiej wartości będzie potrzebna stopa dyskontowa w równowadze - a taką uzyskamy z modeli równowagowych, jak CAPM. Jeśli z kolei interesują nas kategorie księgowe, to ich zmiany będziemy badać wyznaczając odpowiednie średnie.