niedziela, 10 stycznia 2016

W poszukiwaniu nieznanej wartości oczekiwanej - część 1

Czasami można spotkać się z zarzutami, że wyznaczenie wartości fundamentalnej akcji jest niemożliwe, bo prawdziwa wartość oczekiwana parametrów potrzebnych do obliczeń jest nieznana. Na ten problem można spojrzeć z dwóch różnych punktów widzenia. Z jednej strony dane statystyczne należą do jednej próbki, tj. ułamka populacji, w której niektóre dane należą do przyszłości. A przyszłość jest nieznana. Z drugiej strony można filozoficznie uznać, że przyszłość nie istnieje, a jedynie jest tworzona na bieżąco. To oznacza, że mamy wgląd do pełnej populacji statystycznej, a jedynie rozkład prawdopodobieństwa może się zmieniać w czasie, czyli proces jest niestacjonarny. W przypadku takich cech jak tempo zmian zysków firmy znaczenie może mieć cykliczność gospodarcza. Wiemy jednak, że cykle w ekonomii są nieokresowe, chaotyczne i bliżej im do losowości niż do niezmiennych reguł - tyle że potrzebny jest odpowiednio długi okres czasu.  Stąd szukanie wartości oczekiwanej zmian procentowych ma sens.

Te dwa punkty widzenia prowadzą do wspólnego mianownika: wyznaczając wartość oczekiwaną dla przyszłości na podstawie przeszłości, napotkamy barierę w postaci błędu statystycznego, którego wartość oczekiwana będzie różna od zera.

Ten artykuł jest swego rodzaju kontynuacją poprzedniego, który przygotowywał Czytelnika do zrozumienia pojęcia terminowej oczekiwanej stopy zwrotu. Wówczas operowałem jedynie pojęciem średniej terminowej, rozróżniając średnią arytmetyczną - jako krótkoterminową średnią oraz geometryczną stopę - jako długoterminową średnią. Następnie zwróciłem uwagę, że średnia może mieć zupełnie inną formę i być np. nachyleniem trendu liniowego.

Podział na okres krótki i długi jest umowny. Jeżeli nawet umówimy się, że średnia arytmetyczna to okres krótki, a geometryczna długi, to gdzie umieścić inne formy średniej? Np. jeżeli chcemy wyznaczyć prognozę dywidendy, to użyjemy regresji liniowej z logarytmiczną stopą zwrotu w roli nachylenia trendu (patrz Istota i znaczenie logarytmicznej stopy zwrotu), ale skoro wiemy, że to nachylenie wiąże średnią arytmetyczną  i geometryczną, to czy w takim razie jest ono swego rodzaju wartością oczekiwaną w średnim okresie?

Najpierw Blume [1] a później innym tropem Jacqiuer, Kane, Marcus (JKM) [2, 3] wyprowadzili różne optymalne nieobciążone estymatory wartości oczekiwanej długoterminowego tempa wzrostu. Oczywiście nasuwa się pytanie czym różnią się te estymatory pomiędzy sobą. Po pierwsze Blume stosuje przy dowodzeniu twierdzenie Taylora, a więc jego estymator daje przybliżoną wartość, podczas gdy JKM otrzymują dokładne wyniki. Po drugie Blume zakłada, że stopy zwrotu mają rozkład normalny, natomiast u JKM stopy mają rozkład logarytmiczno-normalny - wyjaśnienie tego założenia w artykule Pokrzywiony dzwon - rozkład lognormalny.

To tyle tematem wstępu. Obecnie zajmę się jedynie estymatorem Blume'a. W następnym artykule opiszę estymatory JKM.

Zanim przejdę do dalszej części, od razu zwrócę uwagę na rozróżnienie pomiędzy stopą brutto a netto. Stopa brutto to stopa o postaci R = 1+r, gdzie r to stopa netto. Aby wprowadzić jasny podział będę używał wielkich liter na zapisanie stóp brutto, a małych liter do stóp netto. Zauważmy też, że stopa brutto może być interpretowana jako wartość aktywa o początkowym kapitale 1 zł.

Blume dowodzi, że gdy wartość oczekiwana stopy brutto w przyszłości po N okresach jest nieznana, to prawidłowym estymatorem tej wartości jest średnia ważona średnią arytmetyczną i geometryczną o następującej postaci:

(1)


gdzie:
T - okres przeszłości
N - prognozowany okres przyszłości
A - średnia arytmetyczna stopa brutto (liczona dla danych z okresu T)
G - średnia geometryczna stopa brutto (liczona dla danych z okresu T)

Dowód wzoru (1) zamieściłem w dodatku.
Jeżeli N = 1, to estymator M sprowadza się do A. Jeżeli N = T, to estymator M sprawdza się do G. Precyzyjnie widać w jaki sposób kształtowana jest długoterminowa średnia, o której rozprawiałem w poprzednim artykule. Średnia arytmetyczna dotyczy prognozy 1 okresu wprzód, a geometryczna prognozy na T okresów wprzód (a więc dla geometrycznej okres przyszłości jest traktowany symetrycznie do okresu przeszłości). Estymator Blume'a uwzględnia także wspomnianą w poprzednim artykule względność krótkiego i długiego okresu czasu. Jeżeli bowiem T dąży do nieskończoności, to dla dowolnego stałego N wartość M sprowadza się do A, ponieważ zobaczmy, że możemy zapisać:



Tak więc nawet dla dużego N średnia arytmetyczna będzie prawidłowym estymatorem, bo w stosunku do jeszcze większego T będzie średnią krótkoterminową.


Przykład.
Obliczmy wartość oczekiwaną rocznej stopy wzrostu zysku operacyjnego spółki LPP przy założeniu, że prognozujemy 5 następnych lat, czyli N = 5. Dane pobrałem z bankier.pl, w którym dane finansowe spółki są dostępne od 2004 r., zatem w okresie 2004-2014 było 10 stóp zwrotu, co oznacza T = 10. Otrzymałem następujące parametry:
A = 1,405 (a = 40,5%)
G = 1,28 (g = 28%)

Po podstawieniu danych do (1) oraz wyciągnięciu pierwiastka 5-tego stopnia z M^5, uzyskałem
M = 1,355. Stąd m = 1-M = 35,5%.



Dodatek nr 1. Wyprowadzenie estymatora Blume'a.
M jest pewną nieznaną wartością oczekiwaną stopy brutto. W każdym okresie t (od 1 do T) stopa brutto odchyla się od M:

(2)

Pierwszą częścią wyprowadzenia (1) jest znalezienie przybliżonej wartości oczekiwanej średniej arytmetycznej. Wynika z tego, że średnią traktujemy jak zmienną losową. (Jednak szukana wartość oczekiwana nie dotyczy tylko okresu T, ale także abstrakcyjnej przyszłości).
Sumując wszystkie R(t) dostaniemy:

(3)


Dzieląc obie strony przez T uzyskamy średnią arytmetyczną:

(4)



Oznaczmy:

(5)

i podnieśmy (4) do N:





 Poszukujemy wartości oczekiwanej średniej arytmetycznej w okresie N:

(6)


 Funkcję (1+h/M)^N możemy przybliżyć za pomocą wzoru Taylora (Maclaurina). Wszystkie składniki tej funkcji są stałymi poza h. Zakładamy, że h jest zmienną losową o rozkładzie normalnym, której wartość oczekiwana jest równa 0. W takim razie uznamy, że ostatni wyraz we wzorze Taylora zatrzyma się na potędze 2, ponieważ h^3 będzie równe 0 (wiąże się ze skośnością), natomiast pozostałe będą wyrazy będą niewielkie (h^4 = 3 dla r. Gaussa, ale dzielone zostanie przez 24). Stąd przybliżeniem będzie:

(7)



Samo h jest średnią arytmetyczną składnika losowego, zmienną w czasie. Nie wiadomo jaka będzie jej wartość w prognozowanym okresie. Wiadomo tylko, że h jest zmienną losową z E(h) = 0. Teraz znajdziemy wariancję h. Jest ona powiązana z wariancją składnika losowego e. W przeciwieństwie do średniej z próby, wariancja z próby składnika losowego e jest znana, tzn. przyjmujemy, że jest równa wariancji z populacji i może być wyznaczona w oparciu o historyczne dane z okresu od 1 do T. Zapiszmy:


Pamiętając czym jest h ze wzoru (5) oraz ze względu na niezależność od siebie składników losowych e(t), wykorzystujemy własność wariancji polegającej na tym, że wariancja sumy niezależnych zmiennych jest równa sumie wariancji tych zmiennych (zob. np. https://en.wikipedia.org/wiki/Variance)


 


Nasze składniki losowe e(t) mają nie tylko znaną wariancję, ale ich wariancja pozostaje zawsze ta sama (tak zakładamy). Skoro T-krotnie sumowane są stałe, to znaczy, że możemy znak sumy zastąpić T, tak że uzyskujemy poszukiwaną wariancję h:

(8)


Wkładamy (7) do (6), wykorzystujemy możliwość rozbicia wartości oczekiwanej na części (pamiętamy, że E(h) = 0) i do tej formuły podstawiamy rozwiązanie z (8), dostając:


(9)



Zauważmy, że mimo iż zgodnie z prawem wielkich liczb średnia arytmetyczna dąży do swojej wartości oczekiwanej, to twierdzenie to nie dotyczy średnich podnoszonych do potęgi N > 1.

Drugą częścią jest znalezienie przybliżenia dla wartości oczekiwanej geometrycznej stopy zwrotu.

Geometryczną stopę brutto możemy zapisać jako iloczyn prawdziwej średniej skorygowaną o błędy statystyczne po T okresach i spierwiastkowaną T-tym okresem:

Prognozowana średnia geometryczna w okresie N będzie podnoszona N-tą potęgą:


Ponieważ nie znamy przyszłości, to nie znamy prawdziwej średniej geometrycznej, więc G^N to zmienna losowa. Poszukujemy więc wartości oczekiwanej tej zmiennej. Dokonujemy dodatkowo przekształcenia:

(10)



Wiedząc, że e(t) to zmienna losowa o rozkładzie normalnym, stosujemy podobnie jak poprzednio (7) stosujemy przybliżenie za pomocą wzoru Taylora-Maclaurina do drugiego rzędu,



Otrzymany wynik wkładamy do (10):


Pierwsze wyrazy w nawiasie kwadratowym moglibyśmy zapisać w postaci sum:



Wprowadzamy oczywiste założenie:


Składniki e(t) sumarycznie w okresie od 1 do T nie dają zera (bo h nie równa się zero). Sumy te wyzerują się  dopiero ze względu na to, że E(e) = 0. Ponadto składniki e(t) są od siebie niezależne. Stąd otrzymujemy:

(11)

Elementy oznaczone (...) stają niewielkie, dlatego je odrzuciliśmy. Powracając do pierwotnych oznaczeń zamiast X i Y, równanie (11) zapiszemy:

(12)


Widzimy, że wyraz K pojawia się po raz drugi. W tym miejscu podejmiemy nieco kontrowersyjną decyzję, by drugi wyraz w nawiasie w (12) uznać za zerowy, czyli że K^2 = 0. Chodzi tu o uproszczenie obliczeń. (Blume robi trochę inaczej, ponieważ używa podwójnej aproksymacji ze wzoru Taylora, ale także opuszcza rzędy wyższe niż 2). Czyli wtedy:

(13)

Ponieważ w (9) pojawiło się także K, rozwiązujemy układ równań (9-13), znajdując K dla pierwszego i dla drugiego i zrównujemy ze sobą:



Rozwiązanie tego równania względem M^N daje wzór (1).


Literatura:
[1] M. E. Blume, Unbiased Estimators of Long-Run Expected Rates of Return, Sep., 1974
[2] E. Jacqiuer, A. Kane, A. Marcus, Optimal Forecasts of Long-Term Returns and Asset Allocation: Geometric, Arithmetic, or Other Means?, October 31, 2002
[3] E. Jacqiuer, A. Kane, A. Marcus, Geometric or Arithmetic Mean: Reconsideration , October 31, 2002
[4] P. Cheng, M. K. Deets, Statistical Biases and Security Rates of Return, Jun., 1971
[5] https://en.wikipedia.org/wiki/Variance

..................................................................

Dodatek nr 2:
Jeżeli zachowalibyśmy pełne równanie (12), wtedy rozwiązanie układu równań (9-12) również jest możliwe, ale wynik wydaje się szalenie skomplikowany. Po pierwsze powstają 2 dodatnie rozwiązania. Aby wynik znajdował się zgodnie z intuicją pomiędzy A a G, należy wybrać to większe. Po drugie Wolfram Alpha pokazał następujące (to większe) rozwiązanie:

(14)

To samo uzyskane w Matlabie rozwiązanie jest już kompletnie nieczytelne:

(14)

H = -(C - (- 3*B^2*N^2 + 6*B^2*N*T - 3*B^2*T^2 + 2*B*C*N^2 - 6*B*C*N*T + 2*B*C*N + 4*B*C*T^2 - 2*B*C*T + C^2*N^2 - 2*C^2*N + C^2)^(1/2) + B*N - B*T - 2*C*N + B*N^2 + 2*B*T^2 + C*N^2 + N*(- 3*B^2*N^2 + 6*B^2*N*T - 3*B^2*T^2 + 2*B*C*N^2 - 6*B*C*N*T + 2*B*C*N + 4*B*C*T^2 - 2*B*C*T + C^2*N^2 - 2*C^2*N + C^2)^(1/2) - 3*B*N*T)/(2*(- N^2 + N*T + N - T^2 + T - 1))

gdzie oznaczono:
H = M^N
B = A^N
C = G^N

Gdy podstawimy te same dane co w przykładzie powyżej, tj. B = 1,405^5, C = 1,28^5, N = 5 i T = 10, to dostaniemy H = 4.3778, czyli M = 1,3435 (różnica 1,15 pkt proc). Różnica między (1) a (14) zachowuje się nieliniowo. Gdy T = 15, dla (1) M = 1,3737, a dla (14) M = 1,3558, czyli różnica wzrasta (do 1,79 pkt proc).

Gdy N rośnie, (1) i (14) jeszcze bardziej się zbliżają. W tym przypadku gdyby N = 75 i T = 80, to dla (1) M = 1,404, a dla (14) M = 1,4045. Wzór (14) w punktach granicznych zachowuje się identycznie jak (1). Czyli jeśli N = 1, to w (14) M = A oraz jeśli N = T, to w (14) M = G.

Krótko mówiąc wzór (1) jest zupełnie wystarczającym przybliżeniem, gdy liczba obserwacji wynosi powyżej 40, natomiast dla małej liczby można wziąć pewną niewielką ujemną poprawkę (1-2 pkt proc.).

wtorek, 15 grudnia 2015

Krótkoterminowa vs. długoterminowa średnia stopa zwrotu

Inwestorzy przyzwyczaili się do sformułowania "długoterminowa stopa zwrotu" w rozumieniu stopy zwrotu w długim okresie czasu. Jednakże długoterminowa średnia stopa zwrotu to termin oznaczający zupełnie coś innego. Właściwie długoterminową średnią stopę zwrotu można utożsamić z geometryczną średnią stopą zwrotu, natomiast krótkoterminową średnią stopę zwrotu z arytmetyczną średnią stopą zwrotu. Jeżeli jednak takie definicje uznamy za prawdziwe, to po co tworzę tutaj nowe nazwy zamiast po prostu używać pojęć geometryczna i arytmetyczna średnia? Żeby poczuć trochę to zagadnienie, podam przykład. Oto wykres miesięcznego kursu spółki ERG od początku 2007 do 30.11.2015:


Kurs spadł w ciągu 9 lat z 80 zł do 20 zł (po uwzględnieniu splitów). Geometryczna miesięczna średnia stopa zwrotu, jak łatwo się domyślić, jest ujemna i wynosi w tym okresie -1,3%. Ale już zupełnie nieintuicyjnym faktem jest arytmetyczna średnia miesięczna, która równa się w tym samym okresie +0,182%. Czyli arytmetyczna średnia kompletnie zafałszowuje obraz sytuacji. Dlaczego tak się dzieje? Właśnie dlatego, że średnia arytmetyczna oddaje zmiany w krótkim okresie (1 miesiąc), zaś geometryczna bierze pod uwagę tylko stosunek ostatniej i pierwszej ceny uśredniając go w odpowiednim przedziale czasu.

Głębsze wyjaśnienie skąd wynika ta różnica zawiera artykuł O relacji między arytmetyczną a geometryczną stopą zwrotu. Pokazałem tam, że średnia geometryczna może być wyrażona jako relacja między średnią arytmetyczną, kurtozą i skośnością. Podstawiając dla ERG parametry do wzoru G1 w tym artykule, dostaniemy przybliżenie średniej geometrycznej równe -1,46% a więc bardzo blisko prawdziwej wartości -1,3%.

Mówiąc krótko, w krótkich okresach czasu uwidacznia się wpływ wariancji, kurtozy i skośności, a w długim okresie ich wpływ traci na znaczeniu.

Można byłoby więc zapytać czy w takim razie bardziej opłacalna jest strategia krótkoterminowa polegająca na szukaniu spółek o wysokiej wariancji, ujemnej (lewostronnej) skośności i wysokiej kurtozie, dająca wyższe arytmetyczne stopy zwrotu? Po pierwsze na przeszkodzie stoją koszty prowizji, w przypadku ERG sprowadzają dodatnią stopę do ujemnej - dla średniej stopy 0,182% po uwzględnieniu prowizji nawet 0,2% dostaniemy stopę -0,22%, a stosując ten manewr w przeciągu 106 miesięcy (od 31.01.2007 do 30.11.2015) -21% (patrz - Czy stop lossy są opłacalne? ). Po drugie jeśli przyjąć, że wybieramy tylko pojedyncze miesiące na transakcję, trzeba uwzględnić ryzyko mierzone właśnie przez wariancję, kurtozę i skośność (patrz - Uogólniony wskaźnik Sharpe'a ).

Powróćmy do początkowego pytania dlaczego długoterminową średnią nie nazywam po prostu geometryczną średnią? Na głębsze wyjaśnienie przyjdzie jeszcze czas, ale teraz tylko zadam takie pytanie: czy obliczona na podstawie modelu regresji liniowej logarytmiczna stopa zwrotu jest średnią długoterminową czy krótkoterminową? W artykule  Istota i znaczenie logarytmicznej stopy zwrotu
przedstawiam ideę logarytmicznej stopy zwrotu, która łączy w sobie elementy średniej geometrycznej i arytmetycznej. Pokażę to teraz trochę matematycznie.

A) Element średniej geometrycznej.
Wiadomo, że logarytmiczna średnia stopa stanowi tutaj nachylenie linii trendu logarytmicznej ceny. Wiedząc to oraz wykorzystując równanie podane w Istota i znaczenie logarytmicznej stopy zwrotu możemy zapisać prognozowaną cenę w postaci:

(1)





gdzie r(L) - logarytmiczna stopa zwrotu dla kapitalizacji ciągłej, a, b - stałe, t - czas.
W równaniu (1) zamieniłem także  a = lnP(0), bo jest to po prostu pierwsza logarytmiczna cena w okresie 0.

Zauważamy, że średnia geometryczna stopa zwrotu w okresie t, G(t), w kapitalizacji ciągłej może być przybliżona logarytmiczną stopą zwrotu:




B) Element średniej arytmetycznej.

Na podstawie (1) zapisujemy:

(2)


Tak jak wcześniej powiedziano, parametr a jest po prostu pierwszą (w t = 0) logarytmiczną ceną. Natomiast prognozowana logarytmiczna cena w okresie t jest wartością oczekiwaną lnP(t). W sumie więc (2) zapiszemy w postaci:

(3)





Wyraz ten możemy przekształcić:



















Stąd widać, że parametr nachylenia z modelu regresji, jest wartością oczekiwaną średniej (arytmetycznej) logarytmicznej stopy zwrotu.


I na koniec: parametr nachylenia regresji liniowej jest obliczany wzorem:

(4)


gdzie standardowo kreska pozioma oznacza średnią.

Tak wyznaczony parametr jest estymatorem nieobciążonym, a więc wartość parametru jest równa wartości oczekiwanej tego parametru, tj:

r(L) = E(r(L))

Innymi słowy wartość oczekiwana logarytmicznej stopy zwrotu jest równa formule (4). Jak wiadomo zgodnie z prawem wielkich liczb średnia arytmetyczna będzie dążyć w długim okresie do wartości oczekiwanej.
Trzeba nadmienić, że z punktu widzenia prognozy estymator otrzymany z regresji liniowej (za pomocą MNK) jest estymatorem często najefektywniejszym, a więc lepszym od średniej arytmetycznej i geometrycznej - tj. posiada najmniejszą wariancję spośród estymatorów nieobciążonych. 

Powyższa analiza ilustruje, że pojęcie długoterminowej średniej stopy zwrotu nie musi dotyczyć tylko średniej geometrycznej. W momencie gdy estymacja średniej dokonywana jest metodą regresji liniowej, mamy do czynienia z zupełnie nową miarą długoterminowej średniej. W przykładzie ERG nachylenie log ceny uzyskamy oczywiście ujemne, co upodabnia tę miarę do geometrycznej średniej. Z drugiej strony poziom tego nachylenia jest też kształtowany przez zmiany wewnątrz całego okresu, co przybliża je do średniej arytmetycznej.





 Nachylenie linii regresji wyniosło -0,0155. Po przekształceniu na prostą stopę dostaniemy exp(-0,0155)-1 = -0,0154.

niedziela, 6 grudnia 2015

Krótka ocena koniunktury w Polsce na tle WIG

Na blogach giełdowych aż huczy wiadomość, że WIG wpadł w bessę. Faktycznie, jeśli kryterium zaczęcia bessy ma być przecięcie od góry spadającej 200-sesyjnej średniej kroczącej przez spadającą 50-sesyjną średnią kroczącą (tzw. krzyż śmierci), to taki scenariusz już w sierpniu został spełniony:



Przebicie ostatnich dołków potwierdziło sygnał bessy. Zwracam uwagę, że sam "krzyż śmierci" wcale nie oznacza na 100%, że giełda będzie spadać przez kolejne kilka lat. Jeszcze przecież niedawno w 2011 mieliśmy do czynienia z ostrą zapaścią, ale zapaść ta miała miejsce przed zetknięciem się obydwu średnich, natomiast po tym zdarzeniu indeks stał w miejscu przez ok. 9 miesięcy. Co ciekawe, właśnie wtedy nastąpił kolejny "krzyż śmierci", który tym razem rozpoczął hossę... 


Zdecydowanie bardziej racjonalne jest przyjrzenie się danym makro. Ponieważ giełda głównie oddaje klimat gospodarczy i nastroje inwestorów, dobrze jest porównać ze wskaźnikiem ogólnego klimatu koniunktury obliczanego przez GUS co miesiąc. W Wyjaśnieniach metodyczne GUS objaśnia, że "Wskaźnik ogólnego klimatu koniunktury jest średnią arytmetyczną z ważonych sald odnoszących się do pytań o aktualną oraz przewidywaną ogólną sytuację gospodarczą przedsiębiorstwa."

Poniżej przedstawiam wykres tego wskaźnika dla wybranych składników gospodarczych w kolejnych miesiącach w okresie 1.2000-11.2015:



Aby ocenić naocznie sytuację bieżącą, wklejam ten sam wykres w okresie 1.2011-11.2015



Wśród 4 grup tylko budownictwo jest na lekkim minusie. Jak widać budownictwo, handel i przemysł są ze sobą skorelowane, bo zachowują się podobnie i wszystkie 3 składniki systematycznie, wręcz sezonowo, wzrastają. Przemysł trochę niepokoi, bo kolejny szczyt znalazł się poniżej poprzedniego. Inaczej sprawa wygląda w finansach, które posiadają wysoki optymizm, ale one charakteryzują się średnio wyższym optymizmem na tle reszty, prawdopodobnie z powodu psychologicznej charakterystyki zawodu. Ostatnie zawirowania na WIG_BANKI, który stracił w ciągu ostatniego roku 30% (sam WIG stracił 13%) pokazują, że nie można ufać finansistom co do ich własnej percepcji branży. Jeżeli właśnie chodzi o banki, to na blogu App Funds pojawił się wpis dokładniej tłumaczący ostatnie kłopoty banków na parkiecie. DM BPS prognozuje, że sektor bankowy straci na nowym podatku bankowym średnio 36% zysku netto. Czy można więc dziwić się spadku 30% w ciągu roku? Pytanie jest retoryczne, co więcej spadki banków będą zapewne większe.

Produkcja natomiast wcale nie jest w złej kondycji. Tak jak wspomniałem, przemysł trochę budzi niepewność. Dla rozjaśnienia sytuacji sprawdziłem samą miesięczną produkcję przemysłową na podstawie danych GUS. Poniżej zamieściłem jej wykres w okresie 1.2010-11.2015.


Wykres wskazuje, że sektor przemysłowy znajduje się w lekkim trendzie rosnącym.


Źródło danych:
http://stat.gov.pl/
http://appfunds.blogspot.com

niedziela, 25 października 2015

Pokrzywiony dzwon - rozkład lognormalny

W wielu współczesnych modelach ekonomicznych pojawia się założenie lognormalności rozkładu tempa zmian jakiejś cechy, choć rozkład ten nie jest zbyt dobrze znany w finansach. Z czego wynika to założenie? To jest tematem tego artykułu. Gdyby najprościej chcieć zdefiniować rozkład logarytmicznie normalny (log-normalny), to powiedzielibyśmy, że jeśli logarytm zmiennej x ma rozkład normalny, to sama zmienna x ma rozkład lognormalny. O ile dla logarytmu z x rozkład jest normalny, to dla samego x będzie log-normalny. To przekształcenie z funkcji ln(x) na x przekształca kształt rozkładu, który staje się asymetryczny. Poniższy przykład pozwala porównać oba rozkłady:




Jak widać lognormalny rozkład może posiadać dużą prawostronną skośność. Co więcej, posiada on także niezerową kurtozę odpowiadającą za to, że rzadkie zdarzenia nie są aż tak rzadkie.

Wprowadźmy logarytmiczną stopę zwrotu w okresie od 0 do t:

(1)

Czysto matematycznie stopę tę możemy rozłożyć na sumę wielu podokresów:


Zgodnie z centralnym twierdzeniem granicznym w ogólnej postaci, jeśli losowa logarytmiczna stopa w każdym podokresie będzie miała skończoną wartość oczekiwaną i wariancję, to suma wielu takich stóp zwrotu będzie dążyć do rozkładu normalnego. Nie jest konieczna niezależność stóp zwrotu (chociaż musi być zachowana ogólna losowość i autokorelacja stóp może być tylko czasowa) ani identyczność rozkładów w każdym okresie - proste ujęcie można przeczytać w angielskiej wikipedii:
https://en.wikipedia.org/wiki/Central_limit_theorem#Central_limit_theorems_for_dependent_processes

Bardziej szczegółowe i specjalistyczne omówienie tego zagadnienia Czytelnik znajdzie np. w [1].

Skoro suma takich stóp dąży do normalności, to znaczy, że logarytmiczna stopa zwrotu podana we wzorze (1) ma w gruncie rzeczy rozkład normalny. Przekształćmy teraz wzór (1):



Ale matematycznie oznacza to, że:



 I w ten sposób dotarliśmy do rozkładu lognormalnego: jeżeli zmienna x ma rozkład normalny, to exp(x) ma rozkład lognormalny (zob. np. Log-normal_distribution ). Wynika z tego, że stopa brutto P(t) / P(t-1) musi mieć rozkład log-normalny. A zatem prosta stopa zwrotu netto, P(t) / P(t-1) - 1, także ma rozkład log-normalny.

Oparcie się na centralnym twierdzeniu granicznym wynika z faktu, że logarytmiczne stopy zwrotu można do siebie dodawać. Rozumowanie to nie jest więc możliwe do przeprowadzenia na zwykłych stopach zwrotu. Z drugiej strony jeśli suma zmiennych dąży do rozkładu normalnego, to również średnia arytmetyczna musi do niego dążyć. W związku z tym ostatnim zdaniem rodzą się liczne nieporozumienia: można pomyśleć, że skoro tak, to średnia miesięczna stopa zwrotu z danego roku powinna dążyć do rozkładu Gaussa. Ale przecież jest to średnia zaledwie z 12 miesięcy, podczas gdy twierdzenie dotyczy granicy w nieskończoności okresów.

Z punktu widzenia miar średnich możemy uznać, że:
- geometryczna stopa zwrotu powstająca poprzez cechę multiplikatywności stóp zwrotu brutto będzie mieć rozkład logarytmicznie normalny
- arytmetyczna stopa zwrotu powstająca poprzez sumę stóp zwrotu netto będzie mieć rozkład normalny.

Dodatkowo również warto zastanowić się nad kwestią wskaźnika Sharpe'a opartym na idei symetryczności ryzyka. Jeśli już stosujemy ten wskaźnik to powinniśmy raczej używać logarytmicznych stóp zwrotu, aby uzyskać rozkład normalny, a przez to symetryczność. Właściwie wszędzie tam gdzie potrzebna jest symetria rozkładu, trzeba oprzeć się na logarytmicznych stopach zwrotu. Nic dziwnego więc, że w modelach Markowitza, CAPM i innych często się ich używa.

Podsumowując, rozkład log-normalny jest bardziej naturalnym czy nawet "normalnym" rozkładem od rozkładu Gaussa dla stóp zwrotu, a jego zrozumienie zmienia nasze spojrzenie na statystykę w finansach.



Literatura:

[1] Andrews D. W. K., An  Empirical  Process  Central  Limit  Theorem for  Dependent  Non-identically  Distributed Random  VariableJournal of Multivariate Analysis 38, 187-203 (1991);
[2] E. Limpert, W. A. Stahel, M. Abbt, Log-normal Distributions across the Sciences: Keys and Clues, May 2001 / Vol. 51 No. 5
[2] https://en.wikipedia.org