Musimy wreszcie lepiej się przyjrzeć pojęciu pamięci długoterminowej. Wiemy, że jej istnienie wiąże się z trendem. Wspomniałem już jednak wcześniej, że czasu trwania długiej pamięci nie można utożsamiać z długością trendu. Na czym więc polega jej zjawisko?
Można podejść do tego problemu od czysto matematycznego punktu widzenia. Podejście to pozwala zauważyć ścisłą zależność pomiędzy fraktalnością procesu a długą pamięcią. Zrozumielibyśmy wówczas, że długa pamięć nierozerwalnie wiąże się z fraktalami. Doskonale zaczęlibyśmy czuć różnicę pomiędzy trendem (jako dryfem) a długą pamięcią.
Na początek jednak lepiej zacząć od intuicji i przykładów graficznych.
1. Funkcja liniowa
Oto wykres analizy R/S:
Tutaj H = 0.994. Nie może być nic innego - każda kolejna zmiana wartości ma ten sam znak co poprzednia.
2. Funkcja sinus
Dla sinus dostałem H = 0.936 dla całego okresu. A więc zauważmy co się dzieje. Funkcja wydaje się przecież antypersystentna. Dlaczego więc analiza R/S wychwytuje długą pamięć? Żeby to zrozumieć powinniśmy wrócić do wzoru na wariancję i odchylenie standardowe ułamkowego ruchu Browna:
Odchylenie standardowe jest po prostu średnią drogą, jaką pokonuje jakaś cecha zmiennej. Wynika z tego, że im większe H, tym dłuższa jest ta droga. Wiemy, że dla błądzenia przypadkowego H = 0,5. Dla naszego przypadku H = 0,93 oznacza, że średnio zmienna pokonuje dłuższą drogę niż błądzenie losowe. Jeśli zaczniemy powiększać wykres funkcji sinus, zobaczymy, że rzeczywiście tak jest. W dowolnie małym otoczeniu dowolnego punktu kolejna wartość funkcji przyjmie ten sam znak co poprzednia wartość - z bardzo dużym prawdopodobieństwem. To prawdopodobieństwo równałoby się jeden, gdyby nie występujące minima i maksima. Ile wynosi to prawdopodobieństwo? Można powiedzieć, że właśnie H = 0,936. Nie jest to jednak taka oczywista odpowiedź, nie wynika bowiem z definicji prawdopodobieństwa, lecz następujących spostrzeżeń.
Na H powinniśmy patrzeć jak na miarę zmienności. Jeśli w danym czasie ma być pokonana dłuższa droga, to wykres po prostu musi być mniej postrzępiony, a więc mniej zmienny. Jeżeli jednak ma być mniej zmienny, to znaczy, że kolejna zmiana wartości zmiennej z większą szansą będzie miała ten sam znak co poprzednia.
Na przedstawionym wykresie log(R/S) zauważamy, że następuje w pewnym momencie załamanie się linii. Od tego miejsca pamięć długoterminowa szybko zanika, tak że proces staje się wręcz antypersystentny. Dlaczego jednak tak się dzieje, skoro przed chwilą powiedzieliśmy, że w dowolnie małym otoczeniu punktu proces jest prawie zawsze persystentny? Poprzedni wzór na wariancję - również to widzieliśmy - można przedstawić jako:
t > 0, t > s.
Możemy więc analizować różne przedziały drogi od s do t, w której s jest jakimś opóźnieniem. Na wykresie log(R/S) przedziały te są zaznaczone są literką n. I tak dla n = 758 długa pamięć się załamuje. Co to oznacza? Oznacza to, że w takim przedziale proces pokonuje dłuższą drogę niż błądzenie przypadkowe, a w dłuższym przedziale już nie.
Popatrzmy na wykres sinus. Zauważmy, że cykl pamięci kończy się nie w momencie gdy następuje załamanie kierunku - zmiana trendu - ale w momencie, gdy funkcja "przechodzi" cały cykl wzrostów i spadków (n=758). W rzeczywistości nie ma znaczenia od którego punktu startujemy: dopiero gdy sinus pokona nieco ponad cały cykl, wówczas proces staje się antyuporczywy.
Uporczywość istnieje pomimo zmiany trendu, ponieważ błądzenie przypadkowe "nie nadąża" za sinusem, co wynika z większej wariancji, czyli większego H dla sinus. Dopiero kiedy analiza R/S wykrywa, że sinus znowu zaczyna zmieniać kierunek, co u nas wychodzi po punkcie 758, zaczyna "chwytać" powroty do średniej częstsze niż powroty występujące w błądzeniu przypadkowym, co sygnalizuje antyuporczywością.
3. Dla porównania, weźmy bardzo antypersystentną funkcję złożoną jedynie z punktów 1 i 3 (połączonych linią prostą):
Dostajemy H = 0,06. Tutaj jest odwrotnie, ponieważ kolejne zmiany są przeciwnego znaku, dlatego też prawdopodobieństwo warunkowe kontynuacji danego znaku jest bliskie zera.
4. Weźmy przekształcenie sinus:
H = 0,98
Długa pamięć tutaj zanika bardzo wolno z powodu "silnej" gładkości funkcji. Dopiero po 4788 obserwacjach wykres staje się słabo persystentny.
5. Inne przekształcenie sinus
H = 0,665 dla całego okresu. Jednak do punktu załamania H = 1,026. Czas pamięci wynosi n = 158.
Przyjrzyjmy się bliżej temu punktowi:
Przykład ten jest interesujący ponieważ dowodzi, że długa pamięć nie wiąże się z samą cyklicznością funkcji. Przedstawiona wyżej funkcja jest idealnie cykliczna, jednak analiza R/S wychwytuje krótszy okres tej pamięci niż wynosi cykl funkcji.
Jednakże jest to całkowicie poprawny wynik, bowiem funkcja zaczyna powracać do średniej średnio po 158 obserwacjach.
6. Funkcja quasiperiodyczna. Wreszcie najciekawsze, bowiem taka funkcja jest już bardzo bliska chaosowi deterministycznemu.
H = 0,783, E(H) = 0,55, sqrt(1/N) = 0,018, H - E(H) = 0,229 > 0,018
W tym przypadku H jest już na poziomie H dla kursów giełdowych (miesięcznych stóp zwrotu).
Powiększmy ten fragment gdzie przedział n = 199 zawiera długą pamięć, a po nim zaczyna ona zanikać.
Pamiętajmy, że n jest jedynie przedziałem, w którym zmienna pokonuje drogę. Możemy więc punkt startu tego przedziału dowolnie przesuwać, ale sam zakres n musi pozostać stały. I właśnie W TYM ZAKRESIE długa pamięć zostaje wykryta. Przy zwiększeniu n następuje powrót do średniej, tak że proces staje się antyuporczywy.
Ale zwróćmy uwagę, że okres tej pamięci jest jedynie przeciętny. Nigdy nie odgadniemy czy to początek, środek czy koniec okresu spadków lub wzrostów. Jeśli to pojmiemy, to pojmiemy też, że giełda nawet podczas trwania trendu i wykrycia w tym okresie długoterminowej pamięci, jest nieprzewidywalna w tym okresie.
Jedynie co można przewidzieć, to to, że ten sam znak kolejnych zmian obserwacji jest bardziej prawdopodobny niż przeciwny. Jest tak dlatego, że zmienna musi pokonać dłuższą drogę niż błądzenie przypadkowe.
Jeszcze inaczej. Pomimo że trend jest nieprzypadkowy, to tak naprawdę jest... losowy. Innymi słowy długość trendu jest losowa. Każdy kolejny ząbek może być tym ostatnim tylko dlatego, że bierzemy pod uwagę średnią. Może być tak, iż dany trend właśnie osiąga maksimum lub minimum, choć w całym zakresie równym n - a więc w uśrednieniu - kolejny wzrost lub kolejny spadek jest bardziej prawdopodobny.
Ponieważ jednak kolejna obserwacja jest zależna od poprzedniej w tym sensie, że droga staje się dłuższa niż droga błądzenia losowego, to ta obserwacja jest również zależna od wcześniejszych obserwacji, a zatem droga staje się dłuższa od błądzenia losowego w całym przedziale n dopóki analiza R/S wyczuwa długą pamięć.
Nawet więc jeśli następuje silne załamanie, to ponieważ wcześniej droga była dłuższa niż błądzenia przypadkowego, to ma ona jeszcze "zapas" i dopóki nie będzie intensywniejszych powrotów do średniej, proces będzie uznawany za persystentny.
7. Wykres giełdowy S&P500: obserwacje miesięczne od 1933 (odfiltrowana inflacja)
Do momentu utraty pamięci H = 0,787; E(H) = 0,604. Pamięć średnio kończy się po 42 miesiącach. Oznacza to tyle, że hossa lub bessa była tak silna, że nawet gdy następuje odwrócenie trendu, kurs nadal w danym przedziale pokonuje więcej drogi niż błądzenie przypadkowe. I w tym sensie prawdopodobieństwo (uśrednione), że wzrost lub spadek będzie kontynuowany wynosi ok 0,69. Nie możemy uznać, że wynosi 0,79, gdyż wartość oczekiwana wynosi 0,6, a nie 0,5, więc zmniejszam H o 0,1. Natomiast powrót do średniej i zmiana trendu w końcu powoduje, że proces zostaje uznany za błądzenie przypadkowe. Następuje to przeciętnie po 42 miesiącach.
Stopniowo zaczynamy dostrzegać, że nie ma tu żadnych czarów. Wiemy czym jest średnia. Dokładnie tak jak w tym żarcie o psie i trzech nogach. Chaos na giełdzie po prostu skłania nas do przyjęcia koncepcji ułamkowej efektywności rynku.
sobota, 29 maja 2010
piątek, 14 maja 2010
Wykładnik Hursta dla dziennych stóp zwrotu - szersza perspektywa
We wpisie "Wykładnik Hursta na GPW dla dziennych stóp zwrotu w kontekście ostatniej hossy": http://gieldowyracjonalista.blogspot.com/2010/04/wykadnik-hursta-na-gpw-dla-dziennych.html przyglądaliśmy się persystencji na GPW w okrojonej perspektywie roku hossy 2009-2010. Zmiany dzienne okazały się kompletnie przypadkowe na poziomie WIG-ów. Trzeba przyznać, że było to dość zaskakujące, ale to co dziś powiem, będzie zupełnym zaskoczeniem.
Przyjrzymy się obecnie wykładnikowi Hursta na naszej giełdzie w dłuższej perspektywie. Zanim przystąpię do wyników, muszę najpierw przyjąć jedno założenie. Otóż chociaż standardowo przyjmuje się, że H jest istotne wtedy gdy H jest większe od E(H) co najmniej o (1/N)^0,5 , gdzie N to liczba obserwacji, to jednak wielokrotnie założenie to nie zgadza się z tym co powinno być. Weźmy taki przykład błądzenia przypadkowego:
Dla tego przykładu H = 0.567. Jest tutaj sporo obserwacji (N = 10000). W takim przypadku E(H) = 0.546. (1/10000)^0,5 = 0,01. Ponieważ H-E(H)=0.021, należałoby uznać, że proces jest persystentny, co byłoby nieprawdą. Faktycznie można byłoby jedynie powiedzieć, że nie ma podstaw do odrzucenia hipotezy o persystencji. Tak czy owak wpadlibyśmy w pułapkę. Z drugiej strony dokładniej analizując ten przypadek, szybko wychodzi na jaw, że ów "błąd" powstaje dla największych podziałów n (nie mylić z N), a dla mniejszych jest "w porządku". Nie bedę tutaj się znęcał nad czytelnikiem i wyjaśniał różnicy pomiędzy N a n, bo należałoby w zasadzie wyjaśnić analizę R/S. Tego typu błędy mogą również wynikać z występowania tzw. krótkoterminowej pamięci Markowa. Pamięć ta uczestniczy w błądzeniu przypadkowym. Pamiętamy iluzoryczne trendy? Tam właśnie ta pamięć występowała. Ale pamięć ta jest przypadkowa, pomimo, że może się nie wydawać taka. Analiza R/S wychwytuje tę pamięć i zalicza do pamięci długoterminowej. Zatem część pamięci długoterminowej jest przypadkowa. Współczynnik autokorelacji rzędu pierwszego będzie miał wartość lekko dodatnią. Jak sobie radzą z tym statystycy? Odejmują od każdej stopy zwrotu w t-tym okresie tę właśnie stopę pomnożoną przez współczynnik autokorelacji liniowej rzędu pierwszego (tj korelacji pomiędzy okresem t-1 a t).
Ja mam wątpliwości co do takiej metody. Przecież długookresowe zależności w pewnym stopniu wynikają z tego co się działo przed chwilą. Dlaczego więc wycinać tę pamięć? Z drugiej strony można odpowiedzieć w ten sposób, że chodzi o odfiltrowanie badania długiej pamięci od krótkiej pamięci. W badaniu tej ostatniej wystarczyłoby zweryfikować istotność współczynnika autokorelacji liniowej.
Rzeczywiście, gdy przeanalizujemy niektóre indeksy, okazuje się, że współczynnik autokorelacji liniowej rzędu pierwszego jest istotny. Przede wszystkim daje się to zauważyć dla WIG, natomiast dla WIG20 jest nieistotny. Wynika z tego, że raczej powinno się go odejmować.
Ja przyjmuję inne rozwiązanie. Po pierwsze uznam, że dla dłuższych N, np. 3 lat (od 2007), H musi być większe od E(H) o co najmniej dwa odchylenia standardowe, tj. 2*(1/N)^0,5. Po drugie będę krytycznie spoglądał na samą wartość H, jeżeli będzie na wykresie widać, że się gwałtownie zmienia. Takie gwałtowne zmiany H są nieprzewidywalne i mogą dawać złudzenie długiej pamięci.
1. ROK 2008-2010:
Początek kwietnia 2008 - koniec kwietnia 2010: (1/N)^0,5 = 0.0445
WIG: H = 0.6145, E(H) = 0.5696, H - E(H) = 0.0449 > 0.445. A więc wydaje się słabo persystentny. W takiej sytuacji powinniśmy wziąć nieco przesunąć zakres, aby się upewnić. W okresie 14.04.2008 - 14.05.2010 otrzymujemy:
H = 0.597, E(H) = 0.5695, H - E(H) = 0.027 < 0.0445. A zatem jednak brak persystnecji. Nie możemy się skupiać na poprzednich wynikach, jeśli nie są stabilne po przesunięciu w czasie.
WIG20: H = 0.560746114814989, E(H) = 0.569586363783655, H - E(H) = -0.00884024896866575. Brak persystencji.
Dalej będę pisał skrótowo.
KGHM: (sqrt(1/N) = 0.0456)
0.588, 0.575, 0.013 < 0.0456. Brak persystencji.
LTS: (sqrt(1/N) = 0.041667
0.653, 0.568, 0.085 > 0.041667. Kurs jest wyraźnie persystentny, gdyż pokonuje odchylenie standardowe dwukrotnie.
Można sprawdzić czy tak silny wynik jest stabilny. Okazuje się, że tak: gdy wziąłem zakres 27.04.2008-27.04.2010; (sqrt(1/N) = 0.0456, dostałem:
0.68, 0.57465, 0.106 > 0.0456.
2. ROK 2007-2010
Początek kwietnia 2007 - koniec kwietnia 2010: 2*(1/N)^0,5 = 0.0728
WIG:
0.60555, 0.5645, 0.041 < 0.0728. Nadal brak persystencji. Dla upewnienia się sprawdziłem dla innych okresów (od marca, potem od maja 2007) i nie ma wątpliwości: cała bessa i hossa do dziś ma przebieg czysto losowy na poziomie zmian dziennych.
WIG20: 2*(1/N)^0,5 = 0.07454
0.5594, 0.569, -0.0099
KGH: 2*(1/N)^0,5 = 0.07454
0.6055, 0.569, 0.0363 < 0.075. Brak persystencji.
LTS: 2*(1/N)^0,5 = 0.07454
0.6179, 0.569, 0.0486 < 0.07454. Brak persystencji. Mimo to, gdyby założyć, że wystarczy tak jak dla roku 2008 jedno odchylenie standardowe, kurs można byłoby uznać za persystentny. Ale ciągle miejmy na względzie tamto błądzenie przypadkowe.
Porównując wykresy obu spółek:
stwierdzamy, że nie jest możliwe wzrokowe ocenienie że kurs LTS jest bardziej uporczywy, a KGH nie. Wydaje się nawet, że jest odwrotnie.
3. ROK 2006 - 2010:
WIG od kwietnia (0.063):
0.6345, 0.561, 0.073 > 0.063. Kurs wreszcie staje się persystentny.
Sprawdziłem jeszcze dla innego zakresu - od maja. Wynik? Prawie się nie zmienił. H zaczyna być stabilne.
WIG20 (0.063):
0.573, 0.561, 0.0118 < 0.063. Brak persystencji.
KGH (0.063):
0.5889, 0.561, 0.028 < 0.063, Brak persystencji.
LTS (0.063):
0.64697, 0.5612, 0.086 > 0.063. Jest persystencja.
Można powiedzieć, że potwierdza się to, co wcześniej widzieliśmy. Lotos już wcześniej miał "oznaki" uporczywości, od 2006 r. nie ma wątpliwości co do tego.
4. ROK 2005 - 2010 (0.056):
WIG:
0.617799041308435, 0.558995330030493, 0.0588037112779417 > 0.056. Jest persystencja.
WIG20:
0.55321208985619, 0.562780058095387, -0.00956796823919659 < 0.056. Brak persystencji.
KGH:
0.604648625570105, 0.562780058095387, 0.041868567474718 < 0.056. Brak persystencji.
Sytuacja się trochę "poprawia". Gdy wziąłem zakres od maja 2005, kurs był na styku persystencji. Jednak wyglądało to bardzo podobnie, jak tamto błądzenie przypadkowe - gwałtowne zmiany H przy większych n.
LTS:
Zaczął być notowany od czerwca 2005. Kurs jest silnie persystentny, sytuacja niewiele się zmienia od 2006 (H = 0.635348813576748).
5. 2000 - 2010
Od początku kwietnia 2000 do końca kwietnia 2010 (0.03984):
WIG:
0.61226607977128, 0.55601710790948, 0.0562489718617999 > 0.03984. Jest persystencja.
WIG20:
0.570836067255322, 0.55601710790948, 0.0148189593458419 < 0.03984. Brak persystencji.
Na początku to było dla mnie zaskoczenie. 10 lat i żadnej persystencji? Przejrzałem raz jeszcze badania K. Jajugi sprzed ponad 10 lat. Zakres badań objął krótki okres czasu, bo 20.10.1994 do 6.05.1997 r. Obliczył i stwierdził, że WIG20 posiada długą pamięć: H = 0.6268, E(H) = 0.5834, N = 630, sqrt(1/N) = 0.0398. Można by stwierdzić, że różnica H - E(H) 0.0434 jest wystarczająca. Gdyby przyjąć za warunek przekroczenie dwóch odchyleń, już by tak nie było.
Ponadto powtórzyłem badanie Jajugi. Z początku wynik wydał się znacznie inny, bo w całym analizowanym okresie H = 0.569. Ale badacze nie patrzą na uśrednione H z całego okresu, bo w pewnym momencie następuje zanik pamięci. Od tego momentu H zaczyna spadać (lub rosnąć gdy występuje antypersystencja). Uwzględniając ten efekt, H wyniósł tyle samo co u Jajugi.
Problem polega na tym, że analizując lata 2000-2010, 2005-2010 i kolejne, nie dostrzegam występowania efektu kontrakcji.
KGH:
0.607775971229617, 0.55601710790948, 0.0517588633201371 > 0.03984. Jest persystencja.
Powtórzyłem badanie dla zakresu od czerwca 2000 r. Nie ma wątpliwości, że KGHM posiada długą pamięć.
Ponieważ WIG20 wydaje się czysto losowy, ciekawy byłem jak spółki o największej kapitalizacji wyglądają dla danego okresu.
PEKAO:
0.522237527408583. Ruletka.
TPSA:
0.504609312119412. Ruletka do kwadratu.
PKO (od listopada 2004):
0.535202730879272. Brak persystencji.
PKN:
0.541530225478429. Brak persystencji.
BZWBK (od czerwca 2001):
0.571663181584447. Brak persystencji.
Na koniec sprawdziłem Asseco Poland i Bioton.
ACP:
0.534018739738203, 0.55601710790948, -0.0219983681712768. Brak persystencji.
BIO (od kwietnia 2005):
0.580544284172451, 0.562780058095387, 0.0177642260770645 < 2*0.02817. Brak persystencji.
A zatem to czego można było się spodziewać. Być może LTS i KGHM są jednym z uporczywych wyjątków w naszej wielkiej 20-ce.
Skorośmy już tak daleko zaszli spróbujmy zbadać persystencję DJIA dla dziennych stóp zwrotu dla okresu od kwietnia 2000 do końca kwietnia 2010.
DJIA:
0.549616331489658, 0.55601710790948, -0.00640077641982195 < 0.03984. Brak persystencji...
Żeby jeszcze mieć pewność, że nie gubię pamięci, zrobiłem analizę R/S dla mniejszego okresu, od początku 2006. Wynik się praktycznie nie zmienił. H = 0.5497, E(H) = 0.5645.
A lata 90-te? Taki boom, to wszyscy myślą, że na pewno tam musiała być pamięć. Niestety. W całym okresie lat 90-tych (styczeń 1990-kwiecień 2000) H = 0,5. Równo.
To może lata 80-te? Też nie były złe. Także nie. H = 0.549 przy E(H) = 0.556.
................................................................................
Czy kolejny mit upada? WIG20 razem z DJIA okazują się zwykłym błądzeniem przypadkowym. Być może wykazują generalnie efektywność w sensie statystycznym. Wnioski nie są jednak aż tak ponure, gdyż można odnaleźć spółki bardziej persystentne. Z pewnością w długim okresie są nimi KGHM i Lotos. Skoro WIG jest w długim terminie persystentny, a jednocześnie kursy największych spółek poruszają się losowo, to możemy wyciągnąć wniosek, że jest sporo spółek mniejszych, których kursy posiadają długą pamięć.
................................................................................
W końcu, wnioski drastycznie się zmieniają, gdy analizujemy dane miesięczne. Wpis nie dotyczy wprawdzie takich badań, lecz w skrócie powiem co wychodzi.
Począwszy od 1933 r. do mniej więcej dziś dla S&P500 dostajemy:
0.786722462053744, 0.604257003706961, 0.182465458346783 > 0.0658. Czyli H empiryczne pokonuje niemal 6 odchyleń standardowych (2*0.0329 = 0.0658). Przedstawiony wynik uwzględnia już zanikającą pamięć, która w tym przypadku wynosi średnio 42 miesiące (u Petersa było to 48 miesięcy).
Ciekawe jest to, że niemal identyczny wynik otrzymałem, gdy wziąłem dane od 1881 r., zaś średnia pamięć wyniosła również 42 miesiące. Świadczy to o nieprzypadkowym okresie pamięci. Natomiast dla danych od 1980 r. dostałem H = 0.697, który również pokonuje dwukrotnie odchylenie standardowe. Tutaj cykliczność nie uwidacznia się zbytnio, choć największe H występuje w przedziale od 20 do 72 miesięcy, a więc średnio faktycznie 46 miesięcy.
Przyjrzymy się obecnie wykładnikowi Hursta na naszej giełdzie w dłuższej perspektywie. Zanim przystąpię do wyników, muszę najpierw przyjąć jedno założenie. Otóż chociaż standardowo przyjmuje się, że H jest istotne wtedy gdy H jest większe od E(H) co najmniej o (1/N)^0,5 , gdzie N to liczba obserwacji, to jednak wielokrotnie założenie to nie zgadza się z tym co powinno być. Weźmy taki przykład błądzenia przypadkowego:
Dla tego przykładu H = 0.567. Jest tutaj sporo obserwacji (N = 10000). W takim przypadku E(H) = 0.546. (1/10000)^0,5 = 0,01. Ponieważ H-E(H)=0.021, należałoby uznać, że proces jest persystentny, co byłoby nieprawdą. Faktycznie można byłoby jedynie powiedzieć, że nie ma podstaw do odrzucenia hipotezy o persystencji. Tak czy owak wpadlibyśmy w pułapkę. Z drugiej strony dokładniej analizując ten przypadek, szybko wychodzi na jaw, że ów "błąd" powstaje dla największych podziałów n (nie mylić z N), a dla mniejszych jest "w porządku". Nie bedę tutaj się znęcał nad czytelnikiem i wyjaśniał różnicy pomiędzy N a n, bo należałoby w zasadzie wyjaśnić analizę R/S. Tego typu błędy mogą również wynikać z występowania tzw. krótkoterminowej pamięci Markowa. Pamięć ta uczestniczy w błądzeniu przypadkowym. Pamiętamy iluzoryczne trendy? Tam właśnie ta pamięć występowała. Ale pamięć ta jest przypadkowa, pomimo, że może się nie wydawać taka. Analiza R/S wychwytuje tę pamięć i zalicza do pamięci długoterminowej. Zatem część pamięci długoterminowej jest przypadkowa. Współczynnik autokorelacji rzędu pierwszego będzie miał wartość lekko dodatnią. Jak sobie radzą z tym statystycy? Odejmują od każdej stopy zwrotu w t-tym okresie tę właśnie stopę pomnożoną przez współczynnik autokorelacji liniowej rzędu pierwszego (tj korelacji pomiędzy okresem t-1 a t).
Ja mam wątpliwości co do takiej metody. Przecież długookresowe zależności w pewnym stopniu wynikają z tego co się działo przed chwilą. Dlaczego więc wycinać tę pamięć? Z drugiej strony można odpowiedzieć w ten sposób, że chodzi o odfiltrowanie badania długiej pamięci od krótkiej pamięci. W badaniu tej ostatniej wystarczyłoby zweryfikować istotność współczynnika autokorelacji liniowej.
Rzeczywiście, gdy przeanalizujemy niektóre indeksy, okazuje się, że współczynnik autokorelacji liniowej rzędu pierwszego jest istotny. Przede wszystkim daje się to zauważyć dla WIG, natomiast dla WIG20 jest nieistotny. Wynika z tego, że raczej powinno się go odejmować.
Ja przyjmuję inne rozwiązanie. Po pierwsze uznam, że dla dłuższych N, np. 3 lat (od 2007), H musi być większe od E(H) o co najmniej dwa odchylenia standardowe, tj. 2*(1/N)^0,5. Po drugie będę krytycznie spoglądał na samą wartość H, jeżeli będzie na wykresie widać, że się gwałtownie zmienia. Takie gwałtowne zmiany H są nieprzewidywalne i mogą dawać złudzenie długiej pamięci.
1. ROK 2008-2010:
Początek kwietnia 2008 - koniec kwietnia 2010: (1/N)^0,5 = 0.0445
WIG: H = 0.6145, E(H) = 0.5696, H - E(H) = 0.0449 > 0.445. A więc wydaje się słabo persystentny. W takiej sytuacji powinniśmy wziąć nieco przesunąć zakres, aby się upewnić. W okresie 14.04.2008 - 14.05.2010 otrzymujemy:
H = 0.597, E(H) = 0.5695, H - E(H) = 0.027 < 0.0445. A zatem jednak brak persystnecji. Nie możemy się skupiać na poprzednich wynikach, jeśli nie są stabilne po przesunięciu w czasie.
WIG20: H = 0.560746114814989, E(H) = 0.569586363783655, H - E(H) = -0.00884024896866575. Brak persystencji.
Dalej będę pisał skrótowo.
KGHM: (sqrt(1/N) = 0.0456)
0.588, 0.575, 0.013 < 0.0456. Brak persystencji.
LTS: (sqrt(1/N) = 0.041667
0.653, 0.568, 0.085 > 0.041667. Kurs jest wyraźnie persystentny, gdyż pokonuje odchylenie standardowe dwukrotnie.
Można sprawdzić czy tak silny wynik jest stabilny. Okazuje się, że tak: gdy wziąłem zakres 27.04.2008-27.04.2010; (sqrt(1/N) = 0.0456, dostałem:
0.68, 0.57465, 0.106 > 0.0456.
2. ROK 2007-2010
Początek kwietnia 2007 - koniec kwietnia 2010: 2*(1/N)^0,5 = 0.0728
WIG:
0.60555, 0.5645, 0.041 < 0.0728. Nadal brak persystencji. Dla upewnienia się sprawdziłem dla innych okresów (od marca, potem od maja 2007) i nie ma wątpliwości: cała bessa i hossa do dziś ma przebieg czysto losowy na poziomie zmian dziennych.
WIG20: 2*(1/N)^0,5 = 0.07454
0.5594, 0.569, -0.0099
KGH: 2*(1/N)^0,5 = 0.07454
0.6055, 0.569, 0.0363 < 0.075. Brak persystencji.
LTS: 2*(1/N)^0,5 = 0.07454
0.6179, 0.569, 0.0486 < 0.07454. Brak persystencji. Mimo to, gdyby założyć, że wystarczy tak jak dla roku 2008 jedno odchylenie standardowe, kurs można byłoby uznać za persystentny. Ale ciągle miejmy na względzie tamto błądzenie przypadkowe.
Porównując wykresy obu spółek:
stwierdzamy, że nie jest możliwe wzrokowe ocenienie że kurs LTS jest bardziej uporczywy, a KGH nie. Wydaje się nawet, że jest odwrotnie.
3. ROK 2006 - 2010:
WIG od kwietnia (0.063):
0.6345, 0.561, 0.073 > 0.063. Kurs wreszcie staje się persystentny.
Sprawdziłem jeszcze dla innego zakresu - od maja. Wynik? Prawie się nie zmienił. H zaczyna być stabilne.
WIG20 (0.063):
0.573, 0.561, 0.0118 < 0.063. Brak persystencji.
KGH (0.063):
0.5889, 0.561, 0.028 < 0.063, Brak persystencji.
LTS (0.063):
0.64697, 0.5612, 0.086 > 0.063. Jest persystencja.
Można powiedzieć, że potwierdza się to, co wcześniej widzieliśmy. Lotos już wcześniej miał "oznaki" uporczywości, od 2006 r. nie ma wątpliwości co do tego.
4. ROK 2005 - 2010 (0.056):
WIG:
0.617799041308435, 0.558995330030493, 0.0588037112779417 > 0.056. Jest persystencja.
WIG20:
0.55321208985619, 0.562780058095387, -0.00956796823919659 < 0.056. Brak persystencji.
KGH:
0.604648625570105, 0.562780058095387, 0.041868567474718 < 0.056. Brak persystencji.
Sytuacja się trochę "poprawia". Gdy wziąłem zakres od maja 2005, kurs był na styku persystencji. Jednak wyglądało to bardzo podobnie, jak tamto błądzenie przypadkowe - gwałtowne zmiany H przy większych n.
LTS:
Zaczął być notowany od czerwca 2005. Kurs jest silnie persystentny, sytuacja niewiele się zmienia od 2006 (H = 0.635348813576748).
5. 2000 - 2010
Od początku kwietnia 2000 do końca kwietnia 2010 (0.03984):
WIG:
0.61226607977128, 0.55601710790948, 0.0562489718617999 > 0.03984. Jest persystencja.
WIG20:
0.570836067255322, 0.55601710790948, 0.0148189593458419 < 0.03984. Brak persystencji.
Na początku to było dla mnie zaskoczenie. 10 lat i żadnej persystencji? Przejrzałem raz jeszcze badania K. Jajugi sprzed ponad 10 lat. Zakres badań objął krótki okres czasu, bo 20.10.1994 do 6.05.1997 r. Obliczył i stwierdził, że WIG20 posiada długą pamięć: H = 0.6268, E(H) = 0.5834, N = 630, sqrt(1/N) = 0.0398. Można by stwierdzić, że różnica H - E(H) 0.0434 jest wystarczająca. Gdyby przyjąć za warunek przekroczenie dwóch odchyleń, już by tak nie było.
Ponadto powtórzyłem badanie Jajugi. Z początku wynik wydał się znacznie inny, bo w całym analizowanym okresie H = 0.569. Ale badacze nie patrzą na uśrednione H z całego okresu, bo w pewnym momencie następuje zanik pamięci. Od tego momentu H zaczyna spadać (lub rosnąć gdy występuje antypersystencja). Uwzględniając ten efekt, H wyniósł tyle samo co u Jajugi.
Problem polega na tym, że analizując lata 2000-2010, 2005-2010 i kolejne, nie dostrzegam występowania efektu kontrakcji.
KGH:
0.607775971229617, 0.55601710790948, 0.0517588633201371 > 0.03984. Jest persystencja.
Powtórzyłem badanie dla zakresu od czerwca 2000 r. Nie ma wątpliwości, że KGHM posiada długą pamięć.
Ponieważ WIG20 wydaje się czysto losowy, ciekawy byłem jak spółki o największej kapitalizacji wyglądają dla danego okresu.
PEKAO:
0.522237527408583. Ruletka.
TPSA:
0.504609312119412. Ruletka do kwadratu.
PKO (od listopada 2004):
0.535202730879272. Brak persystencji.
PKN:
0.541530225478429. Brak persystencji.
BZWBK (od czerwca 2001):
0.571663181584447. Brak persystencji.
Na koniec sprawdziłem Asseco Poland i Bioton.
ACP:
0.534018739738203, 0.55601710790948, -0.0219983681712768. Brak persystencji.
BIO (od kwietnia 2005):
0.580544284172451, 0.562780058095387, 0.0177642260770645 < 2*0.02817. Brak persystencji.
A zatem to czego można było się spodziewać. Być może LTS i KGHM są jednym z uporczywych wyjątków w naszej wielkiej 20-ce.
Skorośmy już tak daleko zaszli spróbujmy zbadać persystencję DJIA dla dziennych stóp zwrotu dla okresu od kwietnia 2000 do końca kwietnia 2010.
DJIA:
0.549616331489658, 0.55601710790948, -0.00640077641982195 < 0.03984. Brak persystencji...
Żeby jeszcze mieć pewność, że nie gubię pamięci, zrobiłem analizę R/S dla mniejszego okresu, od początku 2006. Wynik się praktycznie nie zmienił. H = 0.5497, E(H) = 0.5645.
A lata 90-te? Taki boom, to wszyscy myślą, że na pewno tam musiała być pamięć. Niestety. W całym okresie lat 90-tych (styczeń 1990-kwiecień 2000) H = 0,5. Równo.
To może lata 80-te? Też nie były złe. Także nie. H = 0.549 przy E(H) = 0.556.
................................................................................
Czy kolejny mit upada? WIG20 razem z DJIA okazują się zwykłym błądzeniem przypadkowym. Być może wykazują generalnie efektywność w sensie statystycznym. Wnioski nie są jednak aż tak ponure, gdyż można odnaleźć spółki bardziej persystentne. Z pewnością w długim okresie są nimi KGHM i Lotos. Skoro WIG jest w długim terminie persystentny, a jednocześnie kursy największych spółek poruszają się losowo, to możemy wyciągnąć wniosek, że jest sporo spółek mniejszych, których kursy posiadają długą pamięć.
................................................................................
W końcu, wnioski drastycznie się zmieniają, gdy analizujemy dane miesięczne. Wpis nie dotyczy wprawdzie takich badań, lecz w skrócie powiem co wychodzi.
Począwszy od 1933 r. do mniej więcej dziś dla S&P500 dostajemy:
0.786722462053744, 0.604257003706961, 0.182465458346783 > 0.0658. Czyli H empiryczne pokonuje niemal 6 odchyleń standardowych (2*0.0329 = 0.0658). Przedstawiony wynik uwzględnia już zanikającą pamięć, która w tym przypadku wynosi średnio 42 miesiące (u Petersa było to 48 miesięcy).
Ciekawe jest to, że niemal identyczny wynik otrzymałem, gdy wziąłem dane od 1881 r., zaś średnia pamięć wyniosła również 42 miesiące. Świadczy to o nieprzypadkowym okresie pamięci. Natomiast dla danych od 1980 r. dostałem H = 0.697, który również pokonuje dwukrotnie odchylenie standardowe. Tutaj cykliczność nie uwidacznia się zbytnio, choć największe H występuje w przedziale od 20 do 72 miesięcy, a więc średnio faktycznie 46 miesięcy.
Labels:
teoria chaosu
Subskrybuj:
Posty (Atom)