niedziela, 13 września 2015

O relacji między arytmetyczną a geometryczną średnią stopą zwrotu

W literaturze finansowej przewijają się trzy miary średnich - arytmetyczna, geometryczna i logarytmiczna (średnia) stopa zwrotu. Patrząc na całe zagadnienie z dystansu, dostajemy dość zagmatwany obraz złożony z trzech różnych miar. Dobrze byłoby odnaleźć ścisłe relacje pomiędzy nimi, aby móc się poruszać w gąszczu matematyki finansowej.

Średnia arytmetyczna stopy zwrotu (r) dana jest wzorem:

(1)

gdzie
r(k) to k-ta stopa zwrotu,
n - liczba wszystkich stóp zwrotu, tj. liczebność próby.

Średnia geometryczna powstaje w następujący sposób. Najpierw tworzymy łańcuch n cen w oparciu o procent składany:

(2)

Następnie zastępujemy sam łańcuch składanych procentów średnim składanym procentem:

(3)

Rozwiązując to równanie względem G uzyskujemy wzór na średnią geometryczną:
(4)

Najczęściej stosowany w matematyce zapis to:

(5)

Zauważmy prostą zależność. Ponieważ z definicji na stopę zwrotu r(k) dla ceny P(k):


to podstawiając ten wzór do poprzedniego dostajemy:




Inaczej mówiąc wewnętrzne stopy zwrotu wzajemnie się eliminują, więc wzór od nich nie zależy. W ten sposób jasno widać, że geometryczna stopa zwrotu zależy tylko od pierwszej i ostatniej ceny, nie uwzględniając w ogóle zmian wewnętrznych.

Wyprowadzę teraz zależność pomiędzy arytmetyczną a geometryczną stopą zwrotu. Pośrednikiem jest tu twierdzenie Taylora.

Poniższa definicja zaczerpnięta jest z Wikipedii


Wzór Taylora, szczególnie Maclaurina, jest bardzo często używanym narzędziem dowodu przy wyprowadzeniach różnych wzorów w ekonomii.

Wróćmy teraz do wzoru nr (3). Możemy go zlogarytmować i wykorzystać własności logarytmów:

 (6)



Zgodnie z twierdzeniem Taylora stała a jest dowolna, więc możemy podstawić pod nią średnią arytmetyczną, tj. (1). W ten sposób logarytmiczna stopa zwrotu ln(1+r) może być wyrażona przez szereg Taylora:

(7)


Podstawmy prawą stronę (7) do prawej strony (6). Widać od razu, że powstają po prawej stronie sumy, które możemy rozdzielić i podzielić przez n, dostając

(8)


Przeanalizujmy prawą stronę (8). Pierwszy wyraz to średnia ze stałych, więc sumę można zapisać jako n*ln(1+A), stąd całość skraca się do ln(1+A). Drugi wyraz zawiera pierwszy moment centralny, a ten zawsze jest równy zero. Trzeci wyraz zawiera wariancję. Czwarty - trzeci moment centralny, czyli miarę asymetrii ściśle powiązaną ze skośnością, piąty - z kurtozą. Pozostałe składniki będą zawierać kolejne momenty centralne zmiennej r, ale w statystyce są praktycznie pomijane, więc uznamy, że są równe zero. W związku z tym również reszta Peano zniknie. Na koniec musimy pamiętać o pochodnych 4-ch kolejnych rzędów. W konsekwencji dostajemy przekształcony wzór:

(9)

gdzie:
V - wariancja
Sk - skośność, czyli 3-moment centralny podzielony przez wariancję do 3/2
K - kurtoza, czyli 4-moment centralny podzielony przez wariancję do kwadratu.

Jeżeli rozkład jest normalny, wtedy skośność wynosi zero, a kurtoza = 3 (nadwyżka kurtozy = 0). Kurtoza jest podzielona przez 4*(1+A)^4 i dodatkowo przez mnożona przez wariancję, która przecież zazwyczaj będzie ułamkiem.  Dlatego przyjmijmy, że 2 ostatnie składniki w (9) znikają. Z tak utworzonego wyrażenia wyciągamy G:

(10)


Średnia geometryczna stopa zwrotu jest czymś w rodzaju arytmetycznej średniej stopy zwrotu zdyskontowanej pewną stopą zmienności.
Wzór (10) jest mało znany i prawie nigdzie go nie znajdziemy w literaturze (wzór (9), z którego przecież można wyprowadzić najbardziej ogólny wzór na G jest rzadko spotykany. Dość niedawno Mindlin [1] wyprowadził różne przybliżenia geometrycznej stopy zwrotu i tam znalazł się (10), aczkolwiek Autor nie analizował momentów centralnych wyższych rzędów niż 2, a więc już (9) tam nie znajdziemy.

Problem można zaatakować nieco z innej strony. Powróćmy do wzoru (6). Ponownie zakładamy -1 < x < 1 , ale tym razem podstawiamy a=0, wtedy funkcja ln(1+x) będzie aproksymowana przez wzór Maclaurina, który sprowadza się do postaci:

(11)

Wzór ten zastosujemy zarówno dla prawej, jak i lewej strony równania (6).


czyli:

Przenieśmy wszystkie składniki oprócz pierwszego z lewej strony na prawą:

(12)

Składniki prawej strony (12) częściowo się znoszą, a kolejne wyrazy stają się coraz mniejsze. Jeśli zaniedbamy wszystkie składniki oprócz pierwszego i drugiego, to dostaniemy:



Ze wzoru skróconego mnożenia można wywnioskować, że:


Wtedy:

(13)

Rozwiązanie (13) względem G daje wzór:

(14)


Wzór (14) również nie jest popularny. Faktycznie, nie wygląda zbyt interesująco. Najczęściej więc zakłada się w (13), że (A^2 - G^2) / 2 jest w przybliżeniu równe zero. W ten sposób dochodzimy do znanego prostego wzoru:

(15)
Wzór (15) ma podobną interpretację co (10), ale dużo prostszą. Tam średnia arytmetyczna była dyskontowana połową wariancji, która była z kolei dyskontowana samą średnią arytmetyczną ("stopa dyskontowa" wynosiła 0,5V/(1+A)^2). Tutaj od średniej arytmetycznej odejmujemy połowę wariancji. Wzór (15) rzeczywiście powstał trochę sztucznie, ale wybór takiej postaci nie jest przypadkowy. Przypomnę artykuł Kiedy większa niepewność zwiększa wartość akcji? gdzie naturalnie doszedłem do rozkładu logarytmiczno-normalnego. Jeśli zmienna g ma rozkład normalny, to zmienna exp(g) ma rozkład logarytmiczno-normalny. Z kolei wartość oczekiwana zmiennej o rozkładzie logarytmiczno-normalnym jest dana wzorem:


gdzie G - wartość oczekiwana zmiennej g, V(g) - wariancja zmiennej g.

Zauważmy, że wariancja V(g) nie jest tym samym co V, bo jest wariancją zmiennej losowej g (a nie r). Zmienna losowa g stanowi stopę kapitalizacji kapitału w rozkładzie normalnym, którego parametry wynoszą G - wartość oczekiwana oraz V(g) - wariancja. Dla rozkładu normalnego wzór G + V(g)/2 nie ma żadnego znaczenia. Dopiero przechodząc do rozkładu log-normalnego wzór ten staje się średnią arytmetyczną kapitalizacji ciągłej dla zmiennej r. Wielkość exp(G+V(g)/2) wyraża z kolei średnią arytmetyczną efektywnej stopy procentowej.

W tym miejscu warto zaznaczyć, że wartość oczekiwana stopy zwrotu nie musi być wcale równa oczekiwanej stopie zwrotu, ponieważ pierwsza wielkość jest czysto matematyczna, podczas gdy druga ekonomiczna, może zawierać elementy psychologii, może być wyrażona przez użyteczność, tzn. przez funkcję wartości oczekiwanej stopy zwrotu, a więc może np. być logarytmiczną stopą zwrotu.

Podsumujmy.

a) Najbardziej ogólny wzór na geometryczną stopę zwrotu powstaje z przekształcenia (9)


b) Przy założeniu normalności rozkładu powyższy wzór można przybliżyć za pomocą:


c) Innym przybliżeniem, nie zakładającym jednak normalności jest:


d) Uproszczoną wersją, sensowną dla rozkładu logarytmiczno-normalnego daje następujące przybliżenie:


Przykład. Możemy teraz przetestować G1-G4. Zacznijmy od rocznych stóp zwrotu WIG od początku 1998 do końca 2014 (dane ze stooq.pl). Zanim podam uzyskane parametry zwracam uwagę na kurtozę. We wzorze na G1 podana K to kurtoza, podczas gdy najczęściej kurtozę utożsamia się z nadwyżką kurtozy. Nadwyżka ta jest równa kurtoza minus 3. Ponieważ obliczam parametry w Excelu, który oblicza nadwyżkę kurtozy, to muszę de facto do tak obliczonej kurtozy dodać liczbę 3. Excel oblicza kurtozę z próby, więc de facto jest to 3 przemnożone przez (n-1)^2/((n-2)*(n-3)). Czyli kurtozę z Excela plus 3 (ewentualnie dla precyzji razy podany współczynnik) można podstawić do wzoru G1 jako kurtozę. W końcu
 
 Uzyskane parametry są następujące:
A = 0,1148
V = 0,0765
Sk = -0,6026
K =3,512

G1 = 0,0742
G2 = 0,0811
G3 = 0,0726
G4 = 0,0766

Prawdziwa geometryczna stopa zwrotu (tj. obliczona z definicji) G = 0,0722.
W tym przykładzie G3 okazuje się być najlepszym estymatorem, na drugim miejscu G1, potem G4, na końcu G2. 

Kolejny przykład zrobię dla kwartalnych stóp zwrotu WIG w tym samym okresie.

A = 0,0260, V = 0,0148, Sk = -0,2165, K = 2,708. Wyniki:
G1 = 0,0185
G2 = 0,0188
G3 = 0,0184
G4 = 0,0185

Prawdziwa G = 0,01834, więc znów G3 wygrywa.

Ostatni przykład będzie dotyczył kwartalnych stóp KGHM w tym samym okresie.
A = 0,0742; V = 0,059; Sk = 0,3086; K = 3,3457
Wyniki:
G1 = 0,046
G2 = 0,047
G3 = 0,0428
G4 = 0,0447

Prawdziwa G = 0,046, więc tym razem G1 wygrywa. Główną przyczyną jest tutaj uwzględnienie kurtozy, która jest większa niż dla WIG.


Literatura:
[1] D. Mindlin, On the Relationship between arithmetic and geometric return, 2011
[2]  T. Messmore, Variance Drain. Is your investment return leaking down the variance drain?, 1995,
[3] https://pl.wikipedia.org