piątek, 14 maja 2010

Wykładnik Hursta dla dziennych stóp zwrotu - szersza perspektywa

We wpisie "Wykładnik Hursta na GPW dla dziennych stóp zwrotu w kontekście ostatniej hossy": http://gieldowyracjonalista.blogspot.com/2010/04/wykadnik-hursta-na-gpw-dla-dziennych.html przyglądaliśmy się persystencji na GPW w okrojonej perspektywie roku hossy 2009-2010. Zmiany dzienne okazały się kompletnie przypadkowe na poziomie WIG-ów. Trzeba przyznać, że było to dość zaskakujące, ale to co dziś powiem, będzie zupełnym zaskoczeniem.

Przyjrzymy się obecnie wykładnikowi Hursta na naszej giełdzie w dłuższej perspektywie. Zanim przystąpię do wyników, muszę najpierw przyjąć jedno założenie. Otóż chociaż standardowo przyjmuje się, że H jest istotne wtedy gdy H jest większe od E(H) co najmniej o (1/N)^0,5 , gdzie N to liczba obserwacji, to jednak wielokrotnie założenie to nie zgadza się z tym co powinno być. Weźmy taki przykład błądzenia przypadkowego:



Dla tego przykładu H = 0.567. Jest tutaj sporo obserwacji (N = 10000). W takim przypadku E(H) = 0.546. (1/10000)^0,5 = 0,01. Ponieważ H-E(H)=0.021, należałoby uznać, że proces jest persystentny, co byłoby nieprawdą. Faktycznie można byłoby jedynie powiedzieć, że nie ma podstaw do odrzucenia hipotezy o persystencji. Tak czy owak wpadlibyśmy w pułapkę. Z drugiej strony dokładniej analizując ten przypadek, szybko wychodzi na jaw, że ów "błąd" powstaje dla największych podziałów n (nie mylić z N), a dla mniejszych jest "w porządku". Nie bedę tutaj się znęcał nad czytelnikiem i wyjaśniał różnicy pomiędzy N a n, bo należałoby w zasadzie wyjaśnić analizę R/S. Tego typu błędy mogą również wynikać z występowania tzw. krótkoterminowej pamięci Markowa. Pamięć ta uczestniczy w błądzeniu przypadkowym. Pamiętamy iluzoryczne trendy? Tam właśnie ta pamięć występowała. Ale pamięć ta jest przypadkowa, pomimo, że może się nie wydawać taka. Analiza R/S wychwytuje tę pamięć i zalicza do pamięci długoterminowej. Zatem część pamięci długoterminowej jest przypadkowa. Współczynnik autokorelacji rzędu pierwszego będzie miał wartość lekko dodatnią. Jak sobie radzą z tym statystycy? Odejmują od każdej stopy zwrotu w t-tym okresie tę właśnie stopę pomnożoną przez współczynnik autokorelacji liniowej rzędu pierwszego (tj korelacji pomiędzy okresem t-1 a t).

Ja mam wątpliwości co do takiej metody. Przecież długookresowe zależności w pewnym stopniu wynikają z tego co się działo przed chwilą. Dlaczego więc wycinać tę pamięć? Z drugiej strony można odpowiedzieć w ten sposób, że chodzi o odfiltrowanie badania długiej pamięci od krótkiej pamięci. W badaniu tej ostatniej wystarczyłoby zweryfikować istotność współczynnika autokorelacji liniowej.

Rzeczywiście, gdy przeanalizujemy niektóre indeksy, okazuje się, że współczynnik autokorelacji liniowej rzędu pierwszego jest istotny. Przede wszystkim daje się to zauważyć dla WIG, natomiast dla WIG20 jest nieistotny. Wynika z tego, że raczej powinno się go odejmować.

Ja przyjmuję inne rozwiązanie. Po pierwsze uznam, że dla dłuższych N, np. 3 lat (od 2007), H musi być większe od E(H) o co najmniej dwa odchylenia standardowe, tj. 2*(1/N)^0,5. Po drugie będę krytycznie spoglądał na samą wartość H, jeżeli będzie na wykresie widać, że się gwałtownie zmienia. Takie gwałtowne zmiany H są nieprzewidywalne i mogą dawać złudzenie długiej pamięci.


1. ROK 2008-2010:

Początek kwietnia 2008 - koniec kwietnia 2010: (1/N)^0,5 = 0.0445

WIG: H = 0.6145, E(H) = 0.5696, H - E(H) = 0.0449 > 0.445. A więc wydaje się słabo persystentny. W takiej sytuacji powinniśmy wziąć nieco przesunąć zakres, aby się upewnić. W okresie 14.04.2008 - 14.05.2010 otrzymujemy:

H = 0.597, E(H) = 0.5695, H - E(H) = 0.027 < 0.0445. A zatem jednak brak persystnecji. Nie możemy się skupiać na poprzednich wynikach, jeśli nie są stabilne po przesunięciu w czasie.

WIG20: H = 0.560746114814989, E(H) = 0.569586363783655, H - E(H) = -0.00884024896866575. Brak persystencji.

Dalej będę pisał skrótowo.

KGHM: (sqrt(1/N) = 0.0456)

0.588, 0.575, 0.013 < 0.0456. Brak persystencji.

LTS: (sqrt(1/N) = 0.041667

0.653, 0.568, 0.085 > 0.041667. Kurs jest wyraźnie persystentny, gdyż pokonuje odchylenie standardowe dwukrotnie.

Można sprawdzić czy tak silny wynik jest stabilny. Okazuje się, że tak: gdy wziąłem zakres 27.04.2008-27.04.2010; (sqrt(1/N) = 0.0456, dostałem:

0.68, 0.57465, 0.106 > 0.0456.


2. ROK 2007-2010

Początek kwietnia 2007 - koniec kwietnia 2010: 2*(1/N)^0,5 = 0.0728

WIG:

0.60555, 0.5645, 0.041 < 0.0728. Nadal brak persystencji. Dla upewnienia się sprawdziłem dla innych okresów (od marca, potem od maja 2007) i nie ma wątpliwości: cała bessa i hossa do dziś ma przebieg czysto losowy na poziomie zmian dziennych.

WIG20: 2*(1/N)^0,5 = 0.07454

0.5594, 0.569, -0.0099

KGH: 2*(1/N)^0,5 = 0.07454

0.6055, 0.569, 0.0363 < 0.075. Brak persystencji.

LTS: 2*(1/N)^0,5 = 0.07454

0.6179, 0.569, 0.0486 < 0.07454. Brak persystencji. Mimo to, gdyby założyć, że wystarczy tak jak dla roku 2008 jedno odchylenie standardowe, kurs można byłoby uznać za persystentny. Ale ciągle miejmy na względzie tamto błądzenie przypadkowe.

Porównując wykresy obu spółek:



stwierdzamy, że nie jest możliwe wzrokowe ocenienie że kurs LTS jest bardziej uporczywy, a KGH nie. Wydaje się nawet, że jest odwrotnie.


3. ROK 2006 - 2010:

WIG od kwietnia (0.063):

0.6345, 0.561, 0.073 > 0.063. Kurs wreszcie staje się persystentny.

Sprawdziłem jeszcze dla innego zakresu - od maja. Wynik? Prawie się nie zmienił. H zaczyna być stabilne.

WIG20 (0.063):

0.573, 0.561, 0.0118 < 0.063. Brak persystencji.

KGH (0.063):

0.5889, 0.561, 0.028 < 0.063, Brak persystencji.

LTS (0.063):

0.64697, 0.5612, 0.086 > 0.063. Jest persystencja.

Można powiedzieć, że potwierdza się to, co wcześniej widzieliśmy. Lotos już wcześniej miał "oznaki" uporczywości, od 2006 r. nie ma wątpliwości co do tego.

4. ROK 2005 - 2010 (0.056):

WIG:

0.617799041308435, 0.558995330030493, 0.0588037112779417 > 0.056. Jest persystencja.

WIG20:

0.55321208985619, 0.562780058095387, -0.00956796823919659 < 0.056. Brak persystencji.

KGH:

0.604648625570105, 0.562780058095387, 0.041868567474718 < 0.056. Brak persystencji.

Sytuacja się trochę "poprawia". Gdy wziąłem zakres od maja 2005, kurs był na styku persystencji. Jednak wyglądało to bardzo podobnie, jak tamto błądzenie przypadkowe - gwałtowne zmiany H przy większych n.

LTS:

Zaczął być notowany od czerwca 2005. Kurs jest silnie persystentny, sytuacja niewiele się zmienia od 2006 (H = 0.635348813576748).


5. 2000 - 2010

Od początku kwietnia 2000 do końca kwietnia 2010 (0.03984):

WIG:

0.61226607977128, 0.55601710790948, 0.0562489718617999 > 0.03984. Jest persystencja.

WIG20:

0.570836067255322, 0.55601710790948, 0.0148189593458419 < 0.03984. Brak persystencji.

Na początku to było dla mnie zaskoczenie. 10 lat i żadnej persystencji? Przejrzałem raz jeszcze badania K. Jajugi sprzed ponad 10 lat. Zakres badań objął krótki okres czasu, bo 20.10.1994 do 6.05.1997 r. Obliczył i stwierdził, że WIG20 posiada długą pamięć: H = 0.6268, E(H) = 0.5834, N = 630, sqrt(1/N) = 0.0398. Można by stwierdzić, że różnica H - E(H) 0.0434 jest wystarczająca. Gdyby przyjąć za warunek przekroczenie dwóch odchyleń, już by tak nie było.

Ponadto powtórzyłem badanie Jajugi. Z początku wynik wydał się znacznie inny, bo w całym analizowanym okresie H = 0.569. Ale badacze nie patrzą na uśrednione H z całego okresu, bo w pewnym momencie następuje zanik pamięci. Od tego momentu H zaczyna spadać (lub rosnąć gdy występuje antypersystencja). Uwzględniając ten efekt, H wyniósł tyle samo co u Jajugi.

Problem polega na tym, że analizując lata 2000-2010, 2005-2010 i kolejne, nie dostrzegam występowania efektu kontrakcji.

KGH:

0.607775971229617, 0.55601710790948, 0.0517588633201371 > 0.03984. Jest persystencja.
Powtórzyłem badanie dla zakresu od czerwca 2000 r. Nie ma wątpliwości, że KGHM posiada długą pamięć.

Ponieważ WIG20 wydaje się czysto losowy, ciekawy byłem jak spółki o największej kapitalizacji wyglądają dla danego okresu.

PEKAO:

0.522237527408583. Ruletka.

TPSA:

0.504609312119412. Ruletka do kwadratu.

PKO (od listopada 2004):

0.535202730879272. Brak persystencji.

PKN:

0.541530225478429. Brak persystencji.

BZWBK (od czerwca 2001):

0.571663181584447. Brak persystencji.

Na koniec sprawdziłem Asseco Poland i Bioton.

ACP:

0.534018739738203, 0.55601710790948, -0.0219983681712768. Brak persystencji.

BIO (od kwietnia 2005):

0.580544284172451, 0.562780058095387, 0.0177642260770645 < 2*0.02817. Brak persystencji.

A zatem to czego można było się spodziewać. Być może LTS i KGHM są jednym z uporczywych wyjątków w naszej wielkiej 20-ce.

Skorośmy już tak daleko zaszli spróbujmy zbadać persystencję DJIA dla dziennych stóp zwrotu dla okresu od kwietnia 2000 do końca kwietnia 2010.

DJIA:

0.549616331489658, 0.55601710790948, -0.00640077641982195 < 0.03984. Brak persystencji...

Żeby jeszcze mieć pewność, że nie gubię pamięci, zrobiłem analizę R/S dla mniejszego okresu, od początku 2006. Wynik się praktycznie nie zmienił. H = 0.5497, E(H) = 0.5645.

A lata 90-te? Taki boom, to wszyscy myślą, że na pewno tam musiała być pamięć. Niestety. W całym okresie lat 90-tych (styczeń 1990-kwiecień 2000) H = 0,5. Równo.

To może lata 80-te? Też nie były złe. Także nie. H = 0.549 przy E(H) = 0.556.

................................................................................

Czy kolejny mit upada? WIG20 razem z DJIA okazują się zwykłym błądzeniem przypadkowym. Być może wykazują generalnie efektywność w sensie statystycznym. Wnioski nie są jednak aż tak ponure, gdyż można odnaleźć spółki bardziej persystentne. Z pewnością w długim okresie są nimi KGHM i Lotos. Skoro WIG jest w długim terminie persystentny, a jednocześnie kursy największych spółek poruszają się losowo, to możemy wyciągnąć wniosek, że jest sporo spółek mniejszych, których kursy posiadają długą pamięć.

................................................................................

W końcu, wnioski drastycznie się zmieniają, gdy analizujemy dane miesięczne. Wpis nie dotyczy wprawdzie takich badań, lecz w skrócie powiem co wychodzi.

Począwszy od 1933 r. do mniej więcej dziś dla S&P500 dostajemy:

0.786722462053744, 0.604257003706961, 0.182465458346783 > 0.0658. Czyli H empiryczne pokonuje niemal 6 odchyleń standardowych (2*0.0329 = 0.0658). Przedstawiony wynik uwzględnia już zanikającą pamięć, która w tym przypadku wynosi średnio 42 miesiące (u Petersa było to 48 miesięcy).

Ciekawe jest to, że niemal identyczny wynik otrzymałem, gdy wziąłem dane od 1881 r., zaś średnia pamięć wyniosła również 42 miesiące. Świadczy to o nieprzypadkowym okresie pamięci. Natomiast dla danych od 1980 r. dostałem H = 0.697, który również pokonuje dwukrotnie odchylenie standardowe. Tutaj cykliczność nie uwidacznia się zbytnio, choć największe H występuje w przedziale od 20 do 72 miesięcy, a więc średnio faktycznie 46 miesięcy.

1 komentarz:

  1. Jak liczysz ten wykładnik Hursta? Używasz do tego jakiegoś pakietu statystycznego? Czy może masz napisany swój skrypt ?

    OdpowiedzUsuń