czwartek, 21 stycznia 2010

Giełda nie jest normalna

Dziś napisałem dwa posty, a ten jest bardzo krótki. Sprawdziłem czy w poprzedniej analizie metodą Markowitza stopy zwrotu mogły być przybliżane rozkładem normalnym. Ogólnie mówiąc test Shapiro-Wilka wykazał, że w 2009 r. dla większości spółek nie można było odrzucić hipotezy o normalności rozkładów tygodniowych stóp zwrotu. Wyjątkiem był INK, który nie miał z pewnością rozkładu normalnego, a IEA był na granicy i raczej też nie (na poziomie istotności 0,05). Zresztą potwierdzają to dane o kurtozie i współczynniku asymetrii, które dla tych spółek istotnie różnią się od 0 (dla rozkładu Gaussa równe są zero). Oczywiście brak istotności co do odrzucenia hipotezy wynikło głównie z faktu, iż tygodniowych danych było jedynie 30. Gdy zbadałem KGH od 2000 r. rozkład okazał się daleki od normalnego i leptokurtyczny (kurtoza > 0). To samo WIG - im większy zakres danych, tym bardziej uwidacznia się leptokurtoza. Warto wiedzieć, że rozkłady leptokurtyczne są dobrze opisywane przez rozkłady Levy'ego. Rozkład ten jednak posiada nieskończoną wariancję. Oznacza to, że wariancja nie zbiega do żadnej średniej. Wszystko to sprawia, że model Markowitza w formie standardowej nie może być poprawnym modelem minimalizującym ryzyko portfela dla akcji. Należałoby go zmodyfikować lub uogólnić.

piątek, 8 stycznia 2010

Markowitz w praktyce

Na tym blogu ważna jest teoria, ale jeszcze ważniejsza praktyka. Dlatego sporządziłem analizę portfela akcji kilku spółek na warszawskiej giełdzie w oparciu o teorię portfela Markowitza. W sumie postawiłem 2 cele: odnaleźć wagi portfelowe, przy których ryzyko byłoby najmniejsze dla wymaganej stopy zwrotu w danym okresie oraz sprawdzić czy obliczone wagi faktycznie warto byłoby ekstrapolować w przyszłość.

Wybrałem 5 spółek z różnych sektorów. Są to: KGHM Polska Miedź SA (przemysł metalowy) (KGH), PKN Orlen (PKN) (przemysł paliwowy), Instal Kraków (budownictwo) (INK), ING Bank Śląski (BSK) (banki), Immoeast AG (IEA) (deweloperzy). Intuicyjnie domyślamy się, że przemysł metalowy będzie dość mocno korelował z budownictwem, budownictwo z bankami oraz z deweloperami. Czy tezy te okażą się słuszne?

Dane objęły okres od 2.03.2009 do 31.12.2009, a więc od początku hossy na WIG-ach do końca 2009 r - 10 miesięcy (jednak jak widać niektóre spółki zaczęły wcześniej hossę). Popatrzmy na zachowania wybranych spółek.



Od drugiej połowy jedynie INK traci impet ze względu na stagnację/osłabienie rynku budowlanego (jednak sektor ten gwałtownie odbija na giełdzie od końca 2009) Generalnie WIG-BUDOWNICTWO przeżywa dużą korektę od drugiej połowy roku, jednak na jego tle INK trzyma się i tak całkiem nieźle. Mimo wszystko pokazuje to, że przy inwestycji w akcje pewnej spółki po pierwsze należy ocenić ją na tle WIG20 (oraz indeksów światowych) i WIG, po drugie na tle indeksu sektora, do którego należy dana spółka, po trzecie dopiero wówczas jej własną sytuację. Chodzi przede wszystkim o to, że koniunktura na zewnątrz prędzej czy później wpłynie na koniunkturę samej spółki.

Aby zrealizować 2 powzięte cele, podzieliłem analizę na dwa etapy: pierwszy dotyczy 7 kolejnych miesięcy - od 02.03.09 do 29.09.09, a drugi całego okresu badań, po to by na końcu porównać wyniki z obu okresów. Interesowały mnie tygodniowe i miesięczne stopy zwrotu. Tak więc każdy z dwu etapów jest podzielony na dwie części: analizę tygodniowych oraz miesięcznych stóp zwrotu.

ETAP 1 (od 02.03.09 do 29.09.09).

a) Tygodniowe stopy zwrotu.

Oczekiwana stopa zwrotu z akcji została aproksymowana do średniej arytmetycznej stopy zwrotu(%). Wektor średnich stóp zwrotu μ ma postać:



Odchylenie standardowe z akcji:



Tu warto na chwilę się zatrzymać. Zgodnie z teorią, większemu oczekiwanemu zyskowi z danego waloru powinno towarzyszyć większe ryzyko. Jednak dane pokazują, iż jest to prawda tylko w przypadku skrajnych średnich zysków. Zależności te ilustruje poniższy rysunek. Niebieski kolor oznacza odchylenie standardowe waloru. brązowy - średnią stopę zwrotu.



Ciekawym przypadkiem jest BSK, który przynosi bardzo duże tygodniowe średnie zyski, bo aż 6,2% przy 6,4% ryzyku (odchyleniu standardowym). W porównaniu z resztą aktywów kurs porusza się niemal po linii prostej. Kiedy spojrzymy na wykres, zobaczymy, że tak jest w istocie. Inaczej już jest z IEA, którego średni tygodniowy zysk to aż 8%, lecz już przy 13,9% ryzyku. I to również widać po kursie jak mocno się odchyla. Łatwo się więc domyślić, że BSK będzie zajmował w portfelu dużą część, jeśli wymagana stopa zwrotu będzie niezbyt niska.

Macierz korelacji:



Korelacja pomiędzy KGH (p. metalowy) a INK (budownictwo) rzeczywiście jest silna, wynosi ponad 0,6 i jest najwyższa ze wszystkich. Jednak pomiędzy INK a IEA (deweloperzy) korelacja jest nieco ujemna. W ogóle IEA zachowuje się w sposób odwrotny do reszty spółek. Najsilniejsza ujemna korelacja występuje pomiędzy KGH a IEA (-0,2).

Znając parametry możemy obliczyć wagi portfelowe przy minimalnym ryzyku, wykorzystując podane wzory w poprzednim wykładzie, które można tutaj odnaleźć. W jaki sposób wyprowadza się te wzory, można zobaczyć tutaj.

I tak chcąc uzyskać średnio 6% tygodniowo przy 4,66% ryzyku, wagi powinny być w przybliżeniu następujące: 8% KGH, -0,5% PKN, 19,2% INK, 54% BSK, 19,2% IEA. Ujemna waga PKN oznacza więc, że aby uzyskać 6% tygodniowo minimalnie przy tym ryzykując, potrzeba wykorzystać krótką sprzedaż. Im większą chcemy oczekiwać stopę zwrotu, tym więcej musielibyśmy sprzedać "krótko". Niestety nie uwzględniamy tutaj, że krótka sprzedaż jest rodzajem oprocentowanej pożyczki, a więc ryzyko takiej transakcji się zwiększa, a model komplikuje. Aby model mógł być realistyczny, powinniśmy więc wymagać nieco mniejszą stopę zwrotu niż 6%, na przykład 5,5%. Wtedy wagi wynoszą: 1,74%; 9,4%; 26,3%; 46,6%; 16%. Przy takich wagach odchylenie standardowe wynosi 4,6%. Pojawienie się krótkiej sprzedaży przy niewygórowanym zysku wynika z występowania słabej korelacji pomiędzy oczekiwaną stopą zwrotu a wariancją (współczynnik korelacji = 0,5). Niejako "pozbywamy się" "gorszych" walorów, aby więcej inwestować w "lepsze" (jak BSK). W sumie nieopłacalne było trzymanie PKN w tym okresie w porównaniu z innymi akcjami.

Należy odnotować, że gdybyśmy podzielili wszystkie udziały walorów po równo, czyli stworzyli arytmetyczną średnią oczekiwaną stopę zwrotu z portfela, zarabialibyśmy tygodniowo średnio 5% przy 5,17% odchylenia. Ten sam zysk, lecz przy odchyleniu 4,74% uzyskalibyśmy, gdybyśmy przyjęli wagi: -4,5%; 19,3%; 33,5%; 39%; 12,7%, a więc już przy krótkiej sprzedaży KGH - po pierwsze spółka ta posiada trzecią co do wysokości wariancję, po drugie ważną rolę odgrywają korelacje. Graficzne relacje pomiędzy oczekiwanymi zyskami z portfela a minimalnym ryzykiem (odchyleniem standardowym) w procentach, czyli krzywą minimalnego ryzyka ilustruje poniższy rysunek:



b) Miesięczne stopy zwrotu.

Średnie arytmetyczne stopy zwrotu(%) z akcji jako wektor μ mają postać:


Odchylenie standardowe z akcji:



Zależności średni zysk-ryzyko ilustruje poniższy rysunek.



Tym razem jedynie BSK zachowuje się "nieefektywnie".

Macierz korelacji:



Sytuacja "się normuje", IEA koreluje dodatnio ze wszystkimi spółkami z wyjątkiem INK, z którym nie jest skorelowana. Warto zwrócić uwagę na korelację pomiędzy KGH a INK, która wynosi prawie 1.

Średnia miesięczna stopa zwrotu portfela (wszystkie udziały akcji po równo) wyniosła 28% przy 17% ryzyka. Ten sam zysk można uzyskać przy 12,7% ryzyka stosując wagi(%): 22,9; 12,4; 17,8; 59,5; -0,12. Krzywą minimalnego ryzyka przedstawia poniższy rysunek:



ETAP 2 (od 02.03.09 do 31.12.09).

a) Tygodniowe stopy zwrotu.

Średnie arytmetyczne stopy zwrotu(%) z akcji jako wektor μ mają postać:


Odchylenie standardowe (z populacji) z akcji:



Macierz korelacji:



Średnia tygodniowa stopa zwrotu portfela (wszystkie udziały akcji po równo) wyniosła 3,86% przy 4,9% ryzyka. Ten sam zysk można uzyskać przy 4,43% ryzyka stosując wagi(%): -2; 16,4; 32,4; 40,9; 12,3.

Możemy porównać wyniki z okresu 02.03.09-29.09.09 z wynikami z okresu 02.03.09-31.12.09. Czy sporządzone optymalne wagi portfelowe dla pierwszego z tych okresów byłyby również optymalne dla drugiego, czyli całego okresu badań? Poniższy rysunek ilustruje, że krzywa minimalnego ryzyka znacznie przesuwa się, gdy uwzględnimy cały zakres danych. Różowymi kropkami oznaczono krzywą granicy minimalnego ryzyka dla okresu 02.03.09-29.09.09 (to co być powinno - dlatego na różowo, dla optymistów), zaś niebieskimi dla 02.03.09-31.12.09 (to co jest).



Okazuje się, że dla całego okresu oczekiwany zysk jest mniejszy, przesunięcie krzywej jest niekorzystne dla inwestora, gdyż na granicy efektywnej przy danym oczekiwanym zysku ponosi on większe ryzyko.

b) Miesięczne stopy zwrotu.

Średnie arytmetyczne stopy zwrotu(%) μ mają postać:


Odchylenie standardowe (z populacji) z akcji:



Macierz korelacji:



Równoważona średnia miesięczna stopa zwrotu z portfela wyniosła 18,1% przy 17,3% ryzyku. A więc w stosunku do okresu z pierwszego etapu zysk spada o 10 pkt proc., a ryzyko pozostaje prawie na tym samym poziomie. Jednak ten zysk 18,1% można uzyskać przy 1,2% ryzyku stosując wagi(%): 51,9; 29,6; -20,15; 70; -31.

Porównajmy wyniki z okresu 1 etapu 02.03.09-29.09.09 z wynikami z okresu 2 etapu 02.03.09-31.12.09. Poniższy rysunek ilustruje, że krzywa minimalnego ryzyka nie tylko teraz znacznie przesuwa się, ale także zmienia nachylenie. Różowymi kropkami oznaczono krzywą granicy minimalnego ryzyka dla okresu 02.03.09-29.09.09 (to co być powinno - widok przez różowe okulary), zaś niebieskimi dla 02.03.09-31.12.09 (to co jest).



Przesunięcie jest znacznie niekorzystne dla inwestora. Z różowego rysunku wynika, że inwestor mógłby na przykład wymagać spokojnie 30% zysku miesięcznie przy 12,7% ryzyka, ale w rzeczywistości aby wymagać takiego średniego zysku musiałby ponieść średnio ryzyko 20,6%. Gdyby zastosował wagi, które są rozwiązaniem różowego modelu dla 30-procentowej stopy zwrotu ponosiłby ryzyko nie 12,7%, lecz 15,2% i jego średnia stopa zwrotu wyniosłaby 23%, a nie 30%, jak tego oczekiwał. Może się wydawać, że to nie są aż wielkie odchylenia, ale trzeba pamiętać, że wybrany okres charakteryzował się względną stabilnością. Gdyby w okresie październik-grudzień przyszła duża korekta, model kompletnie by się nie sprawdził.

Wnioski.

Od początku było oczywiste, że optymalne wagi wynikające z próby losowej będą różnić się od optymalnych wag z populacji. Powstaje jednak pytanie czy różnice pomiędzy parametrami z próbki i populacji wynikają jedynie z tego, że długość próbki może być niewystarczająca czy raczej z tego, że parametry zmieniają się wraz z przesunięciem w czasie. Wiadomo, że na rynkach parametry zmieniają się, ale nie znaczy to, że w pewnych okresach nie mogą być stałe. Jednak stałość i zmienność parametrów to jedynie pewne konwencje, skoro zawsze można z danego okresu wyłuskać stałe albo dzieląc okresy na podokresy otrzymywać różne parametry. Obserwuję, że w jednym podejściu autorzy odchodzą od pojęcia zwykłej wariancji rynkowych stóp zwrotu, stwierdzając, że jest ona nieskończona lub nieokreślona, a w każdym razie niejednorodna w czasie. Inni korzystają ciągle z klasycznego ujęcia wariancji, przy czym wprowadzają zależności od wariancji z poprzednich okresów - jest to wariancja warunkowa. Ogólnie problem parametrów rozkładów jest trudny i głęboki.

Ponadto teoria portfela Markowitza jest rozszerzana, uogólniana, "poprawiana". Choćby z tego względu nie należy z niej szybko rezygnować.

Poprzednio stwierdziłem, że same parametry rozkładu wyliczone z pewnej próby nie są aż tak istotne dla inwestora, którego interesuje przyszłość, a nie przeszłość. Parametry jednak musi wyliczyć, aby mieć pewien punkt zaczepienia, kontekst. Wówczas powinien dokonać ewentualnych korekt tych parametrów w oparciu o swoje techniki. Może obrać tutaj naukowe podejście, które podsuwa znów statystyka. Istnieje nowa metodyka badań wpływu wydarzeń na wartość firmy zwana analizą zdarzeń. Mimo że podstawy analizy zdarzeń zostały sformułowane w latach 70-tych XX w. to najszybszy rozwój tej dziedziny możemy obserwować w latach 90-tych. Jest jej poświęcona duża literatura, która jednak jest nadal mało znana. W Polsce nową pozycją jest "Analiza zdarzeń na rynkach akcji" Henryka Gurgula.

Czasami jest wysuwane zastrzeżenie co do teorii portfela, że przecież wagi portfelowe, które są udziałami pieniężnymi w portfelu, równe są udziałom akcji w portfelu, lecz liczba akcji jest zawsze całkowita, a więc idealne dobranie liczby akcji może nie być możliwe. Może to spowodować, że inwestor przyjmie wagi dalekie od optymalności. Im większy kapitał posiada inwestor, tym zastrzeżenie to traci na znaczeniu.

..................................................................................
UWAGA

W badaniu okresu od 02.03.2009 do 29.09.2009 oraz od 2.03.2009 do 31.12.2009 odchylenia standardowe, a więc i wariancje liczyłem inaczej. Dla drugiego okresu wariancja i-tego waloru było zadana wzorem:



ponieważ dane z całego okresu badawczego potraktowałem jako populację generalną.

Z kolei dla pierwszego okresu wariancja i-tego waloru było dane wzorem:



ponieważ dane z tego okresu należały do "wylosowanej" próbki.

Zastosowany wzór na wariancję z próbki wynika z celu pracy. Zadaniem było ekstrapolowanie parametrów modelu w przyszłość, czyli przybliżanie populacji poprzez próbkę. Wariancję waloru z populacji powinna więc przybliżać wariancja waloru z próbki. Pytanie brzmi: jaka miara daje najlepsze to przybliżenie, oszacowanie? Jeśli Twoja odpowiedź stanowi: "jest to po prostu wzór na wariancję" (i pokazujesz pierwszy wzór pod słowem UWAGA), to znaczy, że nie zastanowiłeś się nad pytaniem. Poprawna odpowiedź jednak jest całkiem prosta i logiczna. Nasza próbka jest dowolnie wylosowaną próbką, nie musi więc mieć tej samej struktury co populacja (a Ty ukrycie założyłeś, że tak jest). Jeśli tak nie jest, to obliczona w ten sam sposób wariancja z próbki jak dla populacji może się daleko od niej różnić. Aby można było zastosować ten sam wzór, próbka musiałaby dobrze aproksymować cechy populacji. Kiedy tak jest? Intuicja podpowiada, że wtedy, gdy próbka będzie duża lub wiele ich pobierzemy, co wychodzi na jedno. I rzeczywiście tak jest. Dzieje się tak za sprawą prawa wielkich liczb, zgodnie z którym średnia z dużych próbek dąży do średniej z populacji generalnej.
Wyobraźmy sobie, że pobieramy wiele takich próbek. Każdej próbce będzie towarzyszyć jej własny rozkład prawdopodobieństwa, który jest charakteryzowany przez jego parametry. Czyli z każdym losowaniem próbki otrzymujemy wylosowane parametry. Oznacza to, że parametr próbki sam staje się zmienną losową - z własnym rozkładem. A zatem możemy wyciągać parametry z rozkładu tych parametrów - na przykład wartość oczekiwaną. Zgodnie z prawem wielkich liczb wraz ze zwiększaniem liczby prób wartość oczekiwana próby będzie zbliżać się do wartości oczekiwanej populacji generalnej. Teraz intuicyjna odpowiedź na pytanie o najlepsze dopasowanie miary wariancji z próby do wariancji z populacji wydaje się brzmieć: jest to taka miara, że jej wartość oczekiwana jest równa wariancji z populacji. Wynika z tego, że stawiasz pytanie: czy moja zwykła wylosowana wariancja, liczona tak samo jak wariancja z populacji, posiada wartość oczekiwaną równą wariancji z populacji? Widzisz, okazuje się, że odpowiedź jest negatywna. Wartość oczekiwana Twojej domniemanej wariancji jest równa (n-1)/n razy wariancja z populacji, a nie samej wariancji. Dopiero trochę przekształcona Twoja domniemana wariancja staje się wariancją z próbki, której wartość oczekiwana jest równa wariancji z populacji. Wzór na nią to właśnie drugi wzór pod słowem UWAGA. Żeby nie mylić nazw, mówimy, że pierwszy wzór wyraża po prostu wariancję (z populacji), zaś drugi estymator wariancji populacji. Co słuszne, tak liczony estymator przyjmuje większe wartości od estymatora, który przyjmowałby ten sam wzór co wariancja z populacji.