piątek, 29 lipca 2016

Głębsze wprowadzenie do ekonometrii - publikacje Uriela

Jak wiadomo Internet stanowi ogromną, ale chaotyczną masę informacji, w tym publikacji naukowych. Znalezienie tego, co nas w danej chwili chwili interesuje to jak znalezienie igły w stogu siana. Czasami igieł jest bardzo dużo, ale większość w nich jest pozakrzywiana, skręcona i trudna do uchwycenia dla kogoś, kto nie jest zawodowcem w danej dziedzinie. Na przykład jest jakaś książka, w której niemal wszystko się znajduje, ale napisana przez matematyka dla matematyków albo przez specjalistę dla specjalistów. Weźmy choćby ekonometrię i analizę regresji. W angielskiej Wikipedii jest taki temat, ale liczba odniesień, które dokładniej wyjaśniają dane metody, jest przytłaczająca i ciężko znaleźć odpowiedź.

Dlaczego podczas regresji najczęściej stosowana jest Metoda Najmniejszych Kwadratów (MNK) i na czym ona polega? Kiedy i dlaczego MNK i Metoda Największej Wiarygodności dają te same wyniki?  Jak można dokonać dekompozycji wariancji zmiennej objaśnianej (analiza wariancji - ANOVA)? Jak obliczyć wariancję składnika losowego? Następnie, chociaż parametry regresji są z założenia stałe, to ich precyzja zależy od wielkości próbki, a przez to wartość współczynników podlega zmianom (wraz z wielkością próby). Jak więc obliczyć wariancję tych parametrów? Dlaczego kwadrat współczynnika korelacji jest równy współczynnikowi determinacji? Jak ocenić dopasowanie modelu regresji? Jak testować różne hipotezy statystyczne (statystyka t, F i ich relacja)? Na te i wiele innych pytań, znajdziemy przejrzystą odpowiedź na stronie internetowej E. Uriela:
http://www.uv.es/uriel/libroin.htm

Uriel opublikował tam 6 rozdziałów/tomów podręcznika wprowadzającego do ekonometrii wraz z ćwiczeniami. Wydaje mi się, że jest to jedna z najlepszych darmowych pozycji w Internecie dla kogoś, kto chciałby sam przestudiować podstawy ekonometrii. Z jednej strony opis nie jest okraszony skomplikowanym nazewnictwem, a nawet wzory wyglądają przyjaźnie. Z drugiej strony nie mamy tutaj ogólników w stylu "wzór jest taki a taki, bo tak", które zniechęcają czytelnika, skoro nie wiadomo co się skąd wzięło. Znajdziemy tu nawet dowód twierdzenia Gaussa-Markova. W porównaniu do Wikipedii, w której pokazany jest dowód na macierzach, tutaj łatwiej jest go zrozumieć, bo został przeprowadzony najpierw na skalarach, a potem macierzach.

Został też poświęcony rozdział przekształceniom regresji z funkcji nieliniowej do liniowej za pomocą logarytmów. Jest to ważne zagadnienie w ekonomii, dlatego można mieć zastrzeżenie co do jednej rzeczy. Autor wskazuje na możliwość przybliżenia stopy zwrotu za pomocą logarytmicznej stopy zwrotu, wykorzystując twierdzenie Taylora. Niestety to przybliżenie jest nie do końca przekonujące. Dużo lepiej i prościej byłoby gdyby Uriel pokazał następujący prosty dowód, że dla małych zmian logarytmiczna stopa będzie równa zwykłej stopie:


Bo jak wiadomo (1+r/n)^n dąży do exp(r).*
Autor mógł też pokazać podobne rozumowanie, które nakreśliłem w art. Istota i znaczenie logarytmicznej stopy zwrotu

Mimo iż Uriel zawarł też tom poświęcony bardziej zaawansowanym kwestiom jak opuszczanie klasycznych założeń MNK, to trzeba pamiętać o tym, co napisałem wcześniej - jest to tylko wprowadzenie do ekonometrii. I to bardzo dobre.


*

niedziela, 26 czerwca 2016

Kiedy oczekiwany zysk z akcji koreluje z ryzykiem?

Zazwyczaj rozpatrujemy średnią (wartość oczekiwaną) i wariancję jako niezależne od siebie parametry rozkładu prawdopodobieństwa. Czasami niektórzy wiążą oba parametry poprzez CAPM, jednak jest to podejście błędne. Jeśli ktoś nie rozumie tego błędu, to krótko wyjaśnię. Dla przypomnienia, CAPM-CML mówił ile można inwestować w aktywa ryzykowne, a w ile bez ryzyka. Poniższy rysunek to ilustruje:





Oczekiwana stopa zwrotu z mojego portfela jest oznaczona na osi pionowej, a ryzyko , czyli odchylenie standardowe na osi poziomej. Tak jak widać oczekiwany zysk jest liniową funkcją ryzyka. Ale w każdym punkcie CML znajduje się inny portfel, tzn. portfel o innym składzie. Jeżeli będziemy utrzymywać ten sam skład portfela, np. 70% indeksu i 30% obligacji skarbowych, to oczekiwany zysk nie będzie korelował z ryzykiem.

Niemal identyczna sytuacja występuje dla CAPM-SML, tylko odchylenie standardowe zostaje zastąpione betą, a punktami na SML nie są już różne udziały indeksu i obligacji skarbowych, ale różne aktywa, np. akcje. Te aktywa nie mają większej średniej stopy zwrotu, gdy jest większe odchylenie standardowe, ale ta stopa jest większa tylko wtedy gdy beta jest większa. Natomiast beta będzie dotyczyła (przede wszystkim) związku pomiędzy tą akcją a indeksem giełdowym.

Pytając o korelację oczekiwanego zysku z akcji a jej ryzykiem miałem na myśli zmiany w czasie. Aby odpowiedzieć na to pytanie, trzeba na początku rozdzielić parametry warunkowe, jak warunkowa wartość oczekiwana i warunkowa wariancja od parametrów niewarunkowych. A więc od razu mówię, że nie zajmuję się w tym artykule warunkowymi parametrami rozkładu.

Przechodząc do rzeczy, zacznę od Lukacsa [1], który w 1942 r. stwierdza:

Potrzebnym i wystarczającym warunkiem dla normalności rozkładu populacji jest to, aby rozkłady z próbki średniej i wariancji były wzajemnie niezależne.

Zhang [2] parafrazuje to zdanie Lukacsa:

Jeżeli wariancja (lub drugi moment) z rozkładu populacji istnieje, wtedy potrzebnym i wystarczającym warunkiem dla normalności rozkładu populacji jest to, aby średnia arytmetyczna dla próby i wariancja dla próby były wzajemnie niezależne.

Z tego twierdzenia wynika, że jeśli stopa zwrotu ma rozkład normalny, to oczekiwana stopa zwrotu i ryzyko (wariancja) są niezależne od siebie.

Powstaje pytanie czy średnia i wariancja są nadal niezależne od siebie, jeżeli rozkład stopy nie jest gaussowski? Odpowiedź brzmi: nie. Oznaczając oczekiwaną stopę zwrotu oraz wariancję dla próby odpowiednio:


gdzie R(t) to stopa zwrotu w okresie t oraz T to zakres próby, Zhang dowodzi, że (dla dowolnego rozkładu prawdopodobieństwa) jeśli trzeci moment centralny z populacji istnieje, który oznaczymy:



to spełniona jest zależność:

(1)

Z tego wzoru wynika, że dla dowolnego rozkładu:
1. zależność pomiędzy średnim zyskiem a ryzykiem zależy od skośności. Rozkład normalny ma zerową skośność (zerowy 3-ci moment centralny)
2. wraz ze wzrostem horyzontu inwestycyjnego, korelacja ryzyka i średniej stopy zwrotu zmniejsza się.

Powyższy problem można skomplikować. Analizując wzór (1) widać, że użyto założenia, że rozkład gęstości średniej i wariancji jest stały w czasie. Jeżeli parametr jest losowany K razy, to powstaje pewien rozkład gęstości (oznacza to K próbek i K*T stóp zwrotu). Można sobie wyobrazić, że po K-tym losowaniu następuje kolejnych K losowań, z których wyłania się inny rozkład parametrów (jeżeli jest N takich losowań, oznacza to N*K*T stóp zwrotu). Czy wtedy nadal będzie spełniona zależność (1) i nadal dla rozkładu normalnego będzie zachowana niezależność? Jeśli np. spółka się nagle zmieniła, czy pod wpływem wzrostu jej zadłużenia, a więc i ryzyka, oczekiwana stopa zwrotu nie powinna też wzrosnąć? Odpowiedź daje Trenkler [3], który podaje ogólniejszą wersję (1). Okazuje się, że że dla tak ogólnej sytuacji postać wzoru się zmienia. Ten nowy wzór jest dużo bardziej skomplikowany, bo operuje na macierzach. Aby oddać jego sens, intuicyjnie można go zapisać:

(2)





Czyli jednak średnia i wariancja mogą stać się zależne w niestacjonarnym rozkładzie normalnym. Jednakże nawet gdyby przyjąć duże parametry, jak średnia = 0,3, odchylenie st = 0,6, to próbując zastosować (2) dostajemy 2*0,3*0,6^2 = 0,216, co po podzieleniu przez T będzie mieć nieduży wpływ. Stąd (1) jest wystarczającym przybliżeniem.


Literatura:
[1] Lukacs, E., A Characterization of the Normal Distribution, 1942,
[2] Zhang, L., Sample Mean and Sample Variance: Their Covariance and Their (In)Dependence, 2007,
[3] Trenkler, G., Zhang, L. (2007), "Sample Mean and Sample Variance: Their Covariance and Their(In)Dependence," "The American Statistician," 61, 159-160: Comment by Trenkler, 2007.