sobota, 24 września 2011

S&P500 i PKB USA jeszcze raz w zbliżeniu

Skupiając się na dziennych nerwowych zmianach indeksów giełdowych zapominamy często o szerszej perspektywie czasu sprzyjającej sprawdzaniu się prawidłowości statystycznych. Wklejam jeszcze raz wykres który już był trochę analizowany:



Są to roczne zmiany zmiennych. Ostatni rok to 2009, tj. stopa zwrotu dla tego roku obliczona została jako (wartość w styczniu 2010 / wartość w styczniu 2009) - 1. Przypomnę, że współczynnik korelacji liniowej wynosi 0,47. Warto dodać, że współczynnik korelacji rang Spearmana wynosi też 0,47, a tau Kendalla 0,33. Takie wyniki otrzymałem na podstawie danych z http://www.multpl.com/. Zastanawia czemu dane o PKB pobrane z http://www.bea.gov/ nie odpowiadają tym korelacjom. Porównałem z tej strony nominalne tym razem wielkości PKB z danymi SP500 ze Stooq.pl. Okazuje się, że nie ma żadnej korelacji pomiędzy tymi zmiennymi zarówno Pearsona jak i Spearmana i tau Kendalla. To się okazało dziwne i sądziłem, że błąd gdzieś leży w przesunięciach okresu. Przesunąłem zmiany SP500 o jeden okres w tył. Okazało się, że korelacja Pearsona tym razem istnieje i wynosi 0,39 (Spearmana 0,3, Kendalla 0,19). Jednak nie rozumiem czemu tak sie dzieje. Te obliczenia dowodziłyby, że roczne zmiany indeksu wyprzedzają roczne zmiany PKB. Wykres dostałem taki:



Ostatni rok to tym razem 2010. Stopa zwrotu dla tego roku obliczona została jako (wartość na końcu 2010 / wartość na końcu 2009) - 1.

Na zmiany PKB ze strony http://www.bea.gov/ możemy popatrzeć z różnej perspektywy, np. roczne zmiany o kroku kwartalnym mają od 2003 do dziś następujący przebieg:



Obserwacje tej zmiennej w okresie od początku 2q 1947 do końca 2q 2011 charakteryzują się silną autokorelacją liniową 1 rzędu, wynoszącą 0,372; a także 2 rzędu 0,2155. Długoterminowa autokorelacja z kolei nie występuje (możliwe z powodu zbyt małej liczby obserwacji), za wyjątkiem wariancji, dla której pochodna ułamkowa = 0,266. Niezależnie występuje także efekt GARCH i FIGARCH. Poniższy wykres warunkowej wariancji wizualnie daje to odczuć:



Skoro szacunki za 2q wskazują na delikatną poprawę wzrostu PKB i jeśli nie zostaną one zmienioną in minus, będziemy prawdopodobnie mieć do czynienia również z poprawą PKB w 3q. Będzie więc szansa na odbicie giełdy. Wariancja warunkowa znajduje się na stosunkowo niskich poziomach, zatem nie należy oczekiwać w najbliższym czasie nagłego załamania gospodarki, jakim nas karmią media.

środa, 7 września 2011

Bombowa giełda (i trochę o pochodnej ułamkowej)

Kilka tygodni temu światowym giełdom, w tym oczywiście naszej, przydarzyła się "mała" katastrofa, która zmiotła z powierzchni ziemi ostatni rok hossy:



Małe spółki zostały natomiast kompletnie zmiażdżone, bo sierpniowa hekatomba zniosła niemal cały dwuletni rynek byka:



I co najlepsze, wczoraj znowu giełda panicznie spadała.

Najważniejsze na dziś pytanie brzmi czy to co się stało i dzieje nadal to jedynie mocny:

TEST BOMBY

Niezależnie od tego czy mamy do czynienia jedynie z testem czy faktyczną bessą, dopóki giełda będzie podlegała długozasięgowym, nieliniowym autokorelacjom, krach będzie miał daleki wpływ na przyszłość. Ale czy rzeczywiście nasza giełda podlega takim prawom pamięci? Znanym wskaźnikiem występowania pamięci długoterminowej jest wykładnik Hursta. W rzeczywistości metoda jego obliczania powinna być odpowiednio zmodyfikowana dla rozkładu Levy'ego lub przynajmniej t-Studenta. Możemy przecież sobie wyobrazić co się dzieje, gdy następuje potężna fala spadkowa niemożliwa do uzasadnienia dla rozkładu Gaussa. Nawet jeśli fala ta była całkowicie przypadkowa, a po niej kolejne zmiany będą także całkowicie przypadkowe, to całkowity ruch (fala spadkowa + dalsze zmiany) będzie większy niż dla r. Gaussa.

Zamiast obliczać wykładnik Hursta można obliczyć pochodną ułamkową związaną z modelem ARFIMA. ARFIMA(p,d,q) jest uogólnieniem ARIMA(p,d,q). W przypadku ARIMA rząd różnicowania d jest liczbą całkowitą, natomiast w ARFIMA jest liczbą rzeczywistą. Jeśli pochodna ułamkowa d zawiera się w przedziale (0,1/2), mamy do czynienia z pamięcią długoterminową dla procesów stacjonarnych. Jeśli d jest w przedziale (-1/2,0), proces jest antypersystentny. Pochodna ułamkowa jest ściśle związana z wykładnikiem Hursta o czym już tutaj kiedyś dokładnie pisałem.

Drugi problem jest taki, że w danych może jeszcze siedzieć wariancja o pamięci długoterminowej (lub anty-długiej). Proces taki w połączeniu z GARCH nazywa się FIGARCH. Jeśli pochodna ułamkowa znajdzie się w przedziale (0,1/2), pamięć jest "długa" dla stacjonarnych procesów. Jeśli w procesie pojawiła się duża wariancja, to będzie ona "zapamiętana", tak że w przyszłości także będzie się pojawiać. Jeśli w przedziale (-1/2,0) - pamięć jest "anty-długa". Należy wtedy się spodziewać, że po dużej wariancji przyjdzie mniejsza.

Dwa opisane procesy można połączyć w jeden. Nazywa się wtedy ARFIMA-FIGARCH.

Pochodna ułamkowa jest narzędziem matematycznym używanym w różnych dziedzinach, np. do opisu własności mechaniki kwantowej. Z wikipedii:

Stan splątany — rodzaj skorelowanego stanu kwantowego dwóch lub więcej cząstek lub innych układów kwantowych. Posiada on niemożliwą w fizyce klasycznej cechę polegającą na tym, że stan całego układu jest lepiej określony niż stan jego części.


I tak np. dwie cząstki znajdujące się w dowolnie odległych od siebie miejscach we wszechświecie mogą być od siebie zależne, stanowić jeden układ. Jest to typowa dla mechaniki kwantowej nielokalność, z którą w żaden sposób nie mógł się pogodzić Einstein, i którą nazywał on „tajemniczym działaniem na odległość”.

Przykład ten dobrze ilustruje na czym polega "długa" pamięć. Czas nie jest ograniczeniem, podobnie jak dla tych cząstek ograniczeniem nie jest przestrzeń. Dane stanowią w pewnym sensie jeden układ. Oczywiście jest to tylko pewna ilustracja, gdyż procesy które omawiamy są stochastyczne.

Dane objęły lata połowa 1994-połowa 2011. Badanie sprawdzało hipotezę istnienia ARFIMA-FIGARCH dla rozkładu t-Studenta w indeksach WIG i sWIG80.
Okazuje się, że to czy w naszych danych znajdziemy długą pamięć w stopach zwrotu zależy od tego który WIG badamy.

Dla indeksu szerokiego rynku, w dziennych stopach zwrotu nie znajdziemy długiej pamięci zarówno dla nich samych jak i ich wariancji. Jednak tygodniowe stopy zwrotu, choć same nie zawierają długiej pamięci, to ich wariancje już tak - wynosi ona 0,72. Ponieważ jest to więcej niż 0,5, to znaczy, że wariancje te są niestacjonarnym procesem.

Dla indeksu małych spółek (sWIG80) sytuacja przedstawia się interesująco. Dzienne stopy zwrotu posiadają istotną długą pamięć, gdzie d = 0,113. Zwrócę tylko uwagę, że wartość d jest niezależna od zwykłego AR (AR1 równa się tu 0,06, jest istotny). AR to autoregresja liniowa. Długa pamięć nie jest liniowa i nie jest wyrażona w parametrach regresji. Długa pamięć występuje również w wariancjach i wynosi 0,17.
Jeszcze ciekawsze wyniki dostajemy dla tygodniowych danych. W stopach zwrotu długa pamięć równa się ok. 0,174, zaś w wariancjach 0,196.

Armageddon jaki mieliśmy okazję oglądać będzie miał istotne negatywne konsekwencje dla małych spółek w bliższej i dalszej przyszłości, zarówno pomiędzy dziennymi jak i tygodniowymi obserwacjami. Oczywiście sWIG80 będzie się zachowywał podobnie jak WIG, lecz długość ruchu może mieć "własną". Z drugiej strony należy jednak pamiętać, że każdy dodatni impuls będzie również się kumulował i po jakimś czasie ujemny może zostać całkowicie zniwelowany.

Długa pamięć stóp zwrotu może być również znakiem dla analityków technicznych, mianowicie po przebiciu linii trendu (wsparcia/oporu) kurs z większym prawdopodobieństwem będzie poruszać się przez jakiś czas w nowym kierunku. Można postawić hipotezę, że AT wsparć i oporów lepiej nadaje się do wykresów akcji małych spółek. Należy jednak przy tym pamiętać, że indeks nie odzwierciedla pojedynczych akcji.