poniedziałek, 8 czerwca 2009

Czy na giełdzie panuje chaos? W kontekście wykładników Lapunowa

W poście "Wykładnik Lapunowa jako stopa procentowa nieprzewidalności" (post uległ modyfikacji) wyprowadziłem wzór na wykładnik Lapunowa, a także starałem się wyjaśnić jego istotę. Poruszyłem również problem ograniczoności przestrzeni poruszania się orbit.

Okazuje się, że w chaotycznych układach dynamicznych istnieją orbity okresowe, czyli powtarzające swój ruch i jest ich nieskończenie wiele. Ta nieskończoność oznacza, że okresowość orbit zmienia się, czyli orbity stają się niestabilne. Dla dowolnie różnych warunków początkowych, powstają oczywiście inne orbity. Na przykład w pracy "Analiza i przetwarzanie sygnałów chaotycznych" Z. Galiasa dowodzi się istnienia nieskończenie wielu rozwiązań okresowych w ciągłych układach dynamicznych.

Orbity okresowe powstają dlatego, że trajektorie są ograniczone pewnym obszarem przestrzeni fazowej (muszą kiedyś zawrócić), co wynika z założenia, że mamy do czynienia z układem dyssypatywnym, rozpraszającym energię. Jeśli układy nie są dyssypatywne, trajektorie mogą się rozpraszać do nieskończoności.

Notka: Prigogine wykazał, że procesy dyssypacji mogą zachodzić tylko w układach otwartych, a więc przy nieustannej wymianie masy i energii z otoczeniem. - Por. M.K. Kalinowski w artykule: "Na tropach życia, czyli jak przebiegała ewolucja materii we Wszechświecie", str. 12-13. Kalinowski stwierdza: Wydaje się, że wszystkie układy biologiczne spełniają te warunki; można je zatem traktować jako struktury dyssypatywne, tworzące się na Ziemi w ciągłym strumieniu energii słonecznej.

Niedawno wpadłem na ciekawy artykuł, który nie tylko zgrabnie tłumaczy niektóre zagadnienia teorii chaosu, ale także odnosi ją do rynku kapitałowego: "Identyfikacja chaosu deterministycznego w polskich szeregach finansowych" Jacka Kwiatkowskiego oraz Witolda Orzeszka. Autorzy sprawdzają hipotezę czy na naszej giełdzie panuje chaos. Polecam ten artykuł zainteresowanym, można go ściągnąć z internetu. Sądzę, że przeczytanie tej pracy wraz z "Teorią Chaosu a rynki kapitałowe" E.E. Petersa (która niektóre kwestie pomija) może dać solidne pojęcie o teorii chaosu.

Jest sporo metod badających występowanie chaosu. Chciałbym zademonstrować metodę wykorzystującą wykładniki Lapunowa.

Jak pamiętamy, wzór na błąd końcowy trajektorii w układzie dynamicznym wynosi
błąd początkowy*exp(L*n),
gdzie n to liczba okresów lub iteracji, a L - wykładnik Lapunowa.

Zlogarytmujmy to wyrażenie obustronnie i przekształćmy:

ln(błąd końcowy) = ln(błąd początkowy*exp(L*n))
ln(błąd końcowy) = ln(błąd początkowy) + ln(exp(L*n))
ln(błąd końcowy) = ln(błąd początkowy) + L*n

Dostajemy więc funkcję regresji liniowej, w której n jest zmienną niezależną, a L jest nachyleniem funkcji (postać funkcji y=a+bx). Jest to bardzo ważna informacja. Jeśli znamy błąd końcowy dla t-tej iteracji, to po dokonaniu kilku iteracji - kiedy to błąd końcowy rośnie - automatycznie poznamy wartość L.

Powstaje więc pytanie, jak znaleźć błąd końcowy przy obliczaniu trajektorii kursu, nie znając przecież równania ruchu.

Kiedy mówimy, że dwa dowolnie bliskie punkty początkowe "rozjeżdżają się" wykładniczo w przestrzeni fazowej, to musimy dokładnie zrozumieć czym jest przestrzeń fazowa.

Z Wikipedii:

Przestrzeń fazowa – w matematyce i fizyce, przestrzeń wszystkich możliwych stanów w jakich może znajdować się badany układ. Każdy stan układu jest jednym punktem tej przestrzeni.
(...)
Przestrzeń fazowa jest zwykle wielowymiarowa i każdy stopień swobody układu jest reprezentowany jako jej osobny wymiar. Kombinacja parametrów układu w danej chwili odpowiada więc położeniu punktu w tej przestrzeni. Jeśli ewolucja układu jest w pełni zdeterminowana przez te parametry, można wyznaczyć w przestrzeni trajektorię złożoną z kolejnych stanów w jakich będzie się znajdował układ. Kształty tych trajektorii pozwalają dokładnie opisywać różne własności układu.

Dla prostych układów, takich jak cząstka poruszająca się w jednym kierunku, przestrzeń fazowa może mieć mało wymiarów, np. dwa – położenie i prędkość. W ogólności wymiar przestrzeni fazowej może być bardzo duży.


Tak więc, jeśli osobnymi wymiarami są położenie i prędkość, to trzeba zauważyć, że zmienne niezależne opisujące dany wymiar są ze sobą pośrednio związane: prędkość zależy od przebytej przez ciało drogi, a droga od położenia.

Gdy badamy szeregi czasowe kursów akcji, to zmienna w postaci kursu stanowi analogię charakterystyki ruchu w układzie fizycznym; tak jak fundamentem do opisania ruchu ciała jest znajomość prędkości i położenia, tak fundamentem do opisania fluktuacji kursowych są kursy akcji w kolejnych jednostkach czasu. Zamiast mówić o jednej zmiennej w postaci ceny akcji, możemy powiedzieć o wielu zmiennych w postaci ceny akcji w kolejnych okresach. Każdy kolejny t-ty okres rodzi kolejny t-ty wymiar, czyli kolejną zmienną. Jednocześnie wszystkie zmienne zależą od siebie, każdy kurs wpływa na następny. Każda dalsza zmienna cenowa jest pośrednio zależna od dużo wcześniejszych zmiennych.

Z powyższego wynika, że zastępujemy zmienną przestrzenną zmienną czasową. Skoro tak, to dwa dowolnie bliskie czasowo punkty będą się rozchodzić wykładniczo w przestrzeni fazowej.

Bierzemy więc dany kurs okresu 1 i patrzymy jak szereg czasowy ewoluuje w kolejnych okresach (1,2,...T). Następnie bierzemy kurs z okresu 2 i znów patrzymy, jak szereg ewoluuje (2,...T+1). Powtarzamy ten proces n-1 razy. Czyli

(1,2,...T)
(2,...T+1)
(3,...T+2)
...
(n...(T+n-1)).

W ten sposób otrzymujemy n "nadokresów", co znaczy, że otrzymujemy n-wymiarowy szereg czasowy. Dzięki znajomości elementów każdego wymiaru, możemy utworzyć trajektorię szeregu. 1-wymiarowy szereg byłby złożony z (1,2,...T) elementów. Obserwowalibyśmy ewolucję kursu w T okresach. 2-wymiarowy szereg byłby złożony z elementów odpowiednio dla każdego wymiaru (1,2,...T) i (2,...T+1). Ewolucja odbywałaby się również w T okresach, ponieważ każdemu elementowi pierwszego wymiaru możemy przypisać element z drugiego wymiaru. W ogólności otrzymujemy więc n-wymiarowy kurs akcji w T okresach, czyli trajektorii o T iteracjach.

Powstaje praktyczne pytanie, ile należy uwzględnić wymiarów, czyli ile dokonać czasowych przesunięć. Pamiętamy, że wszystkie trajektorie danego dyssypatywnego układu dynamicznego, niezależnie od warunków początkowych, dążą do pewnego zbioru ograniczonego, czyli atraktora (znajdującego się w przestrzeni fazowej). Jeśli więc atraktor jest strukturą n-wymiarową, to trajektorie muszą być n-wymiarowe. Jeśli zatem zaczniemy wprowadzać nowe wymiary, a atraktor przy pewnym wymiarze przestanie się zmieniać, to znaczy, że trajektoria nie dociera do kolejnych wymiarów. Jest to tzw. twierdzenie Takensa o zanurzaniu. K. Jajuga w pracy "Teoria chaosu w analizie finansowych szeregów czasowych - aspekty teoretyczne i badania empiryczne" pisze:

Określenie wymiaru atraktora odbywa się przez zwiększanie wymiaru szeregu danych, zwanego wymiarem zanurzenia oraz określenie dla każdego z otrzymywanych szeregów danych wymiaru korelacyjnego. Gdy przy kolejnym zwiększeniu wymiaru danych wymiar korelacyjny nie zwiększa się, oznacza to, że jest to właśnie poszukiwany wymiar.

Wymiar nazywany jest korelacyjnym, gdyż zmienne, jak pisałem, są skorelowane.

Edgar E. Peters w swojej znanej książce stwierdza:

liczba wymiarów atraktora nie zmienia się tak długo, jak długo umieszczamy go przestrzeni wyższej niż on sam. Płaszczyzna wytyczona w trójwymiarowej przestrzeni w dalszym ciągu ma dwa wymiary. (...) W prawdziwym błądzeniu przypadkowym brak korelacji między punktami, w związku z czym wypełniają one przestrzeń, w której zostają umieszczone wskutek przypadkowych ruchów na wszystkie strony (...) Gaz umieszczony w większej przestrzeni rozprzestrzenia się się do chwili, aż wypełni całą dostępną objętość.
(str. 152)

W tym fragmencie podkreślono różnicę jaką można zaobserwować pomiędzy procesem chaotycznym a losowym.

Pierwszy sposób, jaki się nasuwa przy weryfikacji hipotezy istnienia chaosu, polega na sprawdzeniu czy trajektorie zdążają do n-wymiarowego atraktora na podstawie zanurzania ich w kolejnych wymiarach. W tym celu oblicza się wymiar korelacyjny. K. Jajuga w cytowanej pracy dokonuje tego dla giełdy warszawskiej, jednak dla małej częstości danych i dla bardzo młodej giełdy (20.10.1994-6.05.1997). Wyniki są takie, że "przy analizie rezultatów wymiaru korelacyjnego widać brak wyraźnej zbieżności wymiaru korelacyjnego do jakiejkolwiek liczby przy zwiększaniu wymiaru zanurzenia."

Wróćmy jednak do początkowego zagadnienia, a mianowicie do obliczenia wykładnika Lapunowa. Zauważmy, że gdy rozwinęliśmy swoją analizę na n wymiarów, musimy uwzględnić ten fakt przy obliczaniu L. Mianowicie, dla każdego wymiaru istnieje osobny wykładnik Lapunowa. Dwie trajektorie mogą się rozbiegać lub zbiegać z różnych punktów widzenia - różnych wymiarów.

Okazuje się, że najwyższy wykładnik świadczy o występowaniu lub niewystępowaniu chaosu. Jeśli jest on dodatni, atraktor staje się chaotyczny. Problem polega na tym, że nie wiemy w którym wymiarze szukać najwyższego wykładnika. Powstał tzw. algorytm Wolfa, który umożliwia obliczenie tzw. lokalnego wykładnika Lapunowa. Nie będziemy jednak tego rozważać.

Weźmy za to średnią z odległości dwóch różnych stanów (punktów trajektorii) w n wymiarach i zobaczmy jak ta odległość ewoluuje. Jak już wiemy, po zlogarytmowaniu, powinniśmy dostać funkcję liniową, zależną od kolejnych iteracji. W dalszych iteracjach odległość między stanami powinna się ustabilizować, gdyż pozostają one w atraktorze (funkcja liniowa pozostaje, tylko zmienia się jej nachylenie). Oto rysunek reprezentujący logarytm średnich odległości trajektorii dla tzw. odwzorowania logistycznego wzięty z pracy Kwiatkowskiego i Orzeszka:



Z rysunku można wysnuć, że odwzorowanie logistyczne jest układem chaotycznym.

Jeśli okazałoby się, że układ jest czysto losowy, nachylenie funkcji nie będzie stałe (funkcja nie będzie liniowa), czyli L będzie się zmieniać w kolejnych iteracjach i stanie się zmienną losową podlegającą rozkładowi normalnemu. Ponieważ, gdy zwiększamy wymiar (ilość) czasu, zmienna będzie posiadać większy zasięg "ruchu", rozkład normalny ulega dyfuzji w czasie - wraz z nową jednostką czasu, wariancja zmiennej L rośnie liniowo w czasie. Liniowy wzrost wynika z tego, że średnio rzecz biorąc w każdym okresie procesu losowego o niezależnych zmiennych wariancja powinna być identyczna. Czyli suma dwóch okresów powinna dać sumę dwóch wariancji w tych okresach, suma n okresów -> sumę n wariancji. Sumę wariancji w n okresach można zapisać jako n*wariancja. Literka n jest stałym nachyleniem funkcji liniowej, a wariancja jej zmienną.

Z powyższego wynika, że odchylenie standardowe - pierwiastek z wariancji - rośnie wraz z pierwiastkiem z czasu. Jednakże pamiętamy, że skupiamy się na logarytmie odchyleń, to znaczy obliczamy logarytm błędu końcowego. Z kolei łatwo się przekonać (na przykład korzystając z arkusza kalkulacyjnego), że wykres logarytmu z n iteracji wygląda identycznie jak logarytm pierwiastka z n iteracji, lecz ten drugi ma dwukrotnie zmniejszoną skalę. Wynika to z własności logarytmów:
log(n^0,5) = 0,5*log(n). Oto niezwykłe możliwości tych tworów matematycznych.

Co to oznacza? Możemy stworzyć wykres logarytmu odchylenia standardowego reprezentującego funkcję logarytmu kolejnych iteracji. Jeśli obserwacje potwierdzą, że wraz z każdą iteracją logarytm błędu końcowego jest faktycznie funkcją logarytmiczną (a pamiętamy, że dla układu dynamicznego logarytm błędu końcowego jest funkcją liniową), to mamy "pewność", że L jest zmienną losową, czyli nasz układ jest błądzeniem przypadkowym.

Kwiatkowski i Orzeszko badali występowanie chaosu w indeksie WIG w okresie od lipca 1994 do 15 stycznia 2001, składającym się 1618 obserwacji. Nie są to więc najnowsze dane. Oto graficzny wynik analizy i jego opis:



Autorzy również poddają badaniu średni kurs dolara NBP. Pominę już ten rysunek, bo jest podobny.

Oto wnioski autorów:

Analizując rysunki 5 i 6 można stwierdzić, że zarówno dla kursu WIG, jak i dla dziennego, średniego kursu dolara NBP występuje brak wyraźnej zależności liniowej między logarytmem średnich odległości sąsiednich stanów a liczbą iteracji. Współrzędne punktów układają się wzdłuż krzywej logarytmicznej przecząc tym samym hipotezie, że badane zjawiska są generowane przez chaotyczne układy dynamiczne.

Wnioski identyczne jak K. Jajugi.

Czy powyższe oznacza brak chaosu? Nie. Po pierwsze ja z rysunku nie widzę czy po kilku iteracjach funkcja staje się liniowa czy faktycznie jest logarytmiczna. Ale załóżmy, że autorzy dobrze zinterpretowali wyniki (które nie opierają na rysunkach, lecz na liczbach). Po drugie należy zadać pytanie czy liczba danych jest wystarczająca. Wiąże się z tym problem wymiaru zanurzenia. Wymiar zanurzenia w przedstawionych badaniach wyniósł 2 i 5. Skąd wiadomo czy giełda nie jest układem o 10, 20 czy 100 wymiarach? Żeby to jednak sprawdzić, należy mieć dużo większą próbkę, gdyż kolejne wymiary wynikają z szeregów czasowych.

Jednak wydaje się, że tak wielkie wymiary raczej nie występują. Wymiar korelacyjny jest dobrym przybliżeniem wymiaru fraktalnego. Wymiary fraktalne, czyli ułamkowe, stanowią przejście pomiędzy wymiarami całkowitymi. Dla wymiaru 0 < D < 1 dostajemy coś pomiędzy punktem a prostą. Dla 1 < D < 2 dostajemy coś pomiędzy prostą a płaszczyzną. Chodzi o to, że gdy zaczniemy powiększać dany obszar okaże się, że nie zastaniemy w pierwszym przypadku linii ciągłej, tylko zbiór małych odcinków; ani w drugim płaszczyzny, tylko zbiór poprzedzielanych płaszczyzn (np. prostokątów). Te po powiększeniu znów okazują się zbiorem fragmentów mniejszych obszarów.

Peters obliczył na podstawie danych od stycznia 1950 do lipca 1989 między innymi wymiar fraktalny indeksu S&P500 (D=2,33), od 1959 do 1990 MSCI Japonii (D=3,05), MSCI Niemiec (D=2,41) i SCI Wielkiej Brytanii (D=2,41). Oznacza to, że możliwe jest modelowanie dynamiki rynku USA za pomocą 3 zmiennych, Japonii za pomocą 4 zmiennych, a Niemiec 3 zmiennych. Peters stwierdza, że badane rynki są systemami o małej liczbie wymiarów, co "stwarza obiecującą perspektywę dla dalszych badań: są to systemy dające się rozwiązywać i można mieć nadzieję, że w niedalekiej przyszłości uda się nam te rozwiązania znaleźć" (str. 166).

Już z powyższego akapitu można wysnuć, że skoro wymiar fraktalny przestrzeni fazowej został wyznaczony, a ten stanowi przybliżenie wymiaru korelacyjnego, wymiar korelacyjny mówi o liczbie stopni swobody układu (czyli "niezależnych" zmiennych), to razem to oznacza, że atraktor istnieje.
Giełda amerykańska, japońska, niemiecka i brytyjska były w okresie badawczym systemami dynamicznymi zadanymi tylko kilkoma zmiennymi.


Z tego też wynika, że wykładnik Lapunowa (jako nachylenie funkcji liniowej) powinien dążyć do pewnej stałej. Tak rzeczywiście jest dla wymienionych rynków. Obliczenia Petersa wskazują, że największy wykładnik Lapunowa L1 S&P500 dąży do 0,0241. Oznacza to, że znając stopę zwrotu po 1 okresie, tracimy zdolność do prognozowania po okresie równym 1/0,0241, czyli po niecałych 42 okresach.

Peters nie wyjaśnia zbyt dobrze, skąd bierze się taka relacja. Zapewne chodzi o to, że liczba 1 oznacza 100%, czyli błąd całkowity - całkowitą nieprzewidywalność. Ile trzeba przemnożyć przez 2,41%, czyli średni błąd, aby dostać błąd kompletny 100%? Właśnie przez 100/2,41 = 41,5. Peters bierze za okres 1 miesiąc, co powoduje, że w USA tracimy zdolność do prognozowania po ok. 4 latach. Czyli tyle, ile często trwa dany cykl (występuje długoterminowa pamięć). Dla Wielkiej Brytanii L1 = 0,028 (pamięć 36 miesięcy), Japonii L1 = 0,0228 (44 miesiące). Systemy te w okresie badawczym były więc chaotyczne (chaos występuje, gdy L>0). Dla rynku niemieckiego danych okazuje się za mało.

Choć danych w polskich szeregach finansowych, w porównaniu z USA, jest mało, dobrze byłoby odnaleźć aktualne wyniki badań występowania chaosu na GPW.

Na dziś można powiedzieć, że polski rynek kapitałowy jest chaotyczny, co wynika z analiz N. Siemieniuka w pracy "Fraktalne właściwości polskiego rynku kapitałowego", Wydawnictwo Uniwersytetu w Białymstoku, Białystok 2001, s. 163. Autor ze względu na dużo mniejszą liczbę danych w porównaniu z zagranicznymi giełdami, brał za okres 1 tydzień. Największy wykładnik Lapunowa został oszacowany na poziomie 0,0046/tydzień. Czyli rynek tracił pamięć po 218 tygodniach, czyli 55 miesiącach.

Brak komentarzy:

Prześlij komentarz