poniedziałek, 22 sierpnia 2011

Przeklęta statystyka... zyski a PKB

Liczbom nie wolno ufać. A testom statyst. to już w ogóle. Test korelacji stopa zmian zysku SP 500 a stopa zmian PKB USA najpierw wskazywał, że dla lat 1929-2009 korelacja liniowa wynosi 0,24 i jest istotna. Potem jednak zrobiłem jeszcze raz ten test i się okazało, że wynosi tylko 0,09 i nieistotna. Ale jak to możliwe, że taka różnica powstała? Gdzie błąd zrobiłem? ... No i już wiem. Pierwszy raz test obejmował o jedną obserwację mniej - bez roku 2009. Za drugim razem starałem się dokładniej przeprowadzić test i uwzględniłem 2009. Okazało się, że jedna obserwacja wszystko zmieniła. Dlaczego? To był jeszcze kryzys. W styczniu 2009 roczny zysk wyniósł 13,06. W styczniu 2010 skoczył już do 56,6. To oznaczało stopę wzrostu 333%. Zresztą widać było na załączonym rysunku ostatnie potężne odchylenie (czerwone - stopy zmian zysku, zielone - stopy zmian PKB):



Ta jedna obserwacja zaburzyła cały obraz i zaciemniła korelację. Bez niej macierz korelacji wygląda następująco:



I teraz korelacja wynosi faktycznie 0,24 (i jest istotna). Zresztą nawet wykres stóp obu zmiennych pokazuje pewną zależność, której chyba nie chciałem wcześniej widzieć (tak uwierzyłem liczbom). Regresja liniowa przedstawia się następująco:

-----------------------------------------------------------------------------
Standard T
Parameter / Estimate / Error / Statistic / P-Value
-----------------------------------------------------------------------------
Constant / -0,00353177 / 0,0268156 / -0,131706 / 0,8956
Zmiana% GDP / 0,887495 / 0,405884 / 2,18657 / 0,0318
-----------------------------------------------------------------------------

Bardziej prawidłowy jest jednak model GARCH (dla t-Studenta):

Variable / Coefficient / St. Error / t-statistic / Sign.
1 Constant / 0.0083799675 / 0.021785467 / 0.3846586124 / [0.7016]
2 Zmiana% GDP /0.7179373154 / 0.3551595659 / 2.0214500309 / [0.0468]
3 %arch_const / 0.0017132208 / 0.0011404797 / 1.5021932245 / [0.1373]
4 %garch1 / 0.8917281024 / 0.0581302536 / 15.340172237 / [0.0000]


Wynika z tego, że

E(Stopa zmian zysku SP 500) = 0.72*stopa zmian PKB

Parametr = 0,72 dowodzi, że powyższy model kiepsko wyjaśnia zmienność zysku SP500. W końcu gdy popatrzymy na wykres, to zysk silniej zmienia się niż PKB. Rzeczywiście - współczynnik determinacji to zaledwie 5,47%. Na zysk wpływają więc inne zmienne, których warto byłoby poszukać.

Ponieważ teraz zmienne są od siebie zależne, to nie można konstruować regresji wielorakiej tak jak w poprzednim wpisie ze zmienną objaśnianą jako stopa zwrotu SP 500 i zmiennymi objaśniającymi jako zmiany zysku i PKB (i wygląda na to, że tamta była nieprawdziwa). Oczywiście da się to rozwiązać, ale teraz nie jest to najważniejsze.

Z drugiej strony tym wynikom też nie należy zbyt ufać. Od roku 1933 do 2008 korelacja staje się znów nieistotna.

Podsumowując, trzeba zachować dystans do statystyki. Wygląda na to, że jednak giełda nie jest aż tak nieracjonalna jak sądziłem. Wprawdzie korelacja pomiędzy zmianą PKB a zmianą zysku SP 500 nie jest wielka, ale jednak istnieje, jeśli tylko odjąć dane odstające (co jednak ciągle jest moim zdaniem kontrowersyjne). Wynikałoby z tego, że jeśli rok 2011 upłynie pod znakiem niskiego wzrostu PKB możemy liczyć także w tym roku na niższe wzrosty zysków giełdowych firm. Oby nie był to spadek PKB.

Ale nowy problem się pojawił: gdyby korelację zacząć od 1933 r. to znów staje się nieistotna. Statystyka nie daje więc jednoznacznej odpowiedzi czy istnieje korelacja liniowa. Wygląda na to, że trzeba będzie poszukać bardziej złożonych związków lub faktycznie takowego nie ma.

piątek, 19 sierpnia 2011

Czyżby giełda była nieracjonalna?

Roczne stopy zwrotu z amerykańskiego indeksu SP 500 są silnie dodatnio skorelowane z rocznymi procentowymi zmianami PKB USA. Logiczne jest, że aby taka korelacja była racjonalna, zmiany zysków giełdowych firm muszą być dodatnio skorelowane ze zmianami PKB. W poprzednim wpisie stwierdziłem:

Ściślej, w latach 1929-2009 korelacja rocznych zmian zysku i PKB wyniosła 0,2349. Dla lat 1933-2009 spada ona jednak do 0,166 i staje się nieistotna statystycznie.

Jednak ponieważ powstała taka niejednoznaczność, zbadałem te relacje dokładniej dla lat 1929-2009. Ponadto, wierząc, że ta dodatnia korelacja jednak istnieje, miałem zadanie stworzyć regresję liniową z tych zmiennych. Jakie doszło do mnie zdziwienie, gdy się okazało, że tej korelacji nie ma!

Nie ma żadnej istotnej korelacji pomiędzy rocznymi zmianami zysku firm z indeksu SP 500, a rocznymi zmianami amerykańskiego PKB. (1929-2009). Korelacja wynosi 0,09 - nieistotna stat. Oto macierz tej korelacji:



Gdyby istniała dodatnia korelacja, powinniśmy dostać relację w formie liniowej funkcji rosnącej. (Dla ujemnej malejącą).

Poniżej ich wykresy w l. 1929-2009 (zielone - zmiany PKB, czerwone - zmiany zysku):



Z kolei tak wygląda korelacja pomiędzy rocznymi stopami zwrotu indeksu SP 500 a rocznymi stopami zmian PKB USA (ten sam zakres danych):



Jest silna - wynosi 0,47.

A tak kształtowały się stopy zwrotu z SP 500 (czerwone) i zmiany PKB (zielone)



Skoro jednak korelacja pomiędzy zmianami zysku SP 500 a zmianami PKB nie występuje, a jednocześnie korelacja zmiany SP 500 - zmiany PKB występuje, to czy w ogóle występuje korelacja zmiany SP 500 - zmiany zysku SP 500? W poprzednim wpisie stwierdziłem, że ta korelacja istnieje, choć nieduża. Jeszcze raz zbadałem dla lat 1929-2009. Faktycznie istnieje, dostałem wartość 0,25. Ale takiej macierzy korelacji się nie spodziewałem:



Okazuje się, że korelacja 0,25 to niemal złudzenie, gdyż powoduje ją głównie jeden element mocno odstający. Co więcej, dla lat 1933-2009 korelacja ta już staje się teoretycznie nieistotna.

Na poniższym rysunku obserwujemy zależność obu zmiennych w l. 1929-2009, czyli stopy zwrotu SP 500 (czerwone) oraz zmiany zysków SP 500 (zielone)



Model regresji liniowej wskazuje jednak, że istnieje istotna relacja:

Stopa zwrotu SP 500 = 0,026633 + 0,10976*Stopa zmian zysku SP 500

Przy czym stała jest nieistotna, zaś standard error (odchylenie standardowe) dla parametru stopy zmian zysku SP 500 wynosi 0,048. Ponadto

R^2 = 6,119%
R^2 (adjusted for d.f.) = 4,93%

Zdecydowanie zbyt niskie R^2 potwierdza poniższy obrazek, gdzie widać, że owa relacja to niemalże złudzenie (to samo co wyżej tylko powiększone)



Dla porównania, regresja liniowa stóp zwrotu SP 500 i zmian PKB przedstawia się następująco:

Stopa zwrotu SP 500 = -0,0148286 + 1,53355*Stopa zmian US GDP

Przy czym stała jest nieistotna, zaś standard error (odchylenie standardowe) dla parametru stopy zmian zysku US GDP wynosi 0,324. Ponadto

R^2 = 22,12%
R^2 (adjusted for d.f.) = 21,14%



Jest jeden plus tego, że zmiany zysku SP 500 i zmiany PKB są nieskorelowane. Mianowicie można próbować stworzyć regresję wieloraką, która właśnie wymaga, aby zmienne objaśniające były od siebie wzajemnie niezależne. Regresja wieloraka umożliwia połączyć pojedyncze regresje w jeden spójny model. Zmienną objaśnianą oczywiście byłyby stopy zwrotu SP 500. Otrzymana funkcja regresji to

Stopa zwrotu SP 500 = -0,018827 + 0,0910764*Stopa zmian zysku SP 500 +
1,47109*Stopa zmian US GDP


Pełna statystyka tego modelu jest poniżej

-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT -0,018827 0,0209038 -0,90065 0,3705
Zmiany% zysku SP500 0,0910764 0,0433199 2,10242 0,0387
Zmiany% US GDP 1,47109 0,318334 4,6212 0,0000
-----------------------------------------------------------------------------

R^2 = 26,3%
R^2 (adjusted for d.f.) = 24,4%
SE = 0,164
MAE = 0,122
Durbin-Watson statistic = 1,69738 (P=0,0729)
ARCH(1) in the error: Chi^2(1) = 9.502633 [0.0021]

Jak widać efekt ARCH(1) jest istotny, zatem powinniśmy użyć modelu ARCH lub GARCH.
Dla rozkładu Gaussa (normalność nie została odrzucona w teście) oto co dostałem

Stopa zwrotu SP 500 = -0.0236 + 0.0844*Stopa zmian zysku SP 500 +
1.903*Stopa zmian US GDP


Variable / Coefficient / St. Error / t-statistic / Sign.
1 Constant / -0.0195765692 / 0.0161692291 / -1.2107299063 / [0.2299]
2 Zmiany% zysku SP500 / 0.0840991811 / 0.0464795795 / 1.8093791295 / [0.0745]
3 Zmiany% US GDP / 1.8874096009 / 0.2669705282 / 7.0697301818 / [0.0000]
4 %arch_const / 0.0228298854 / 0.0078681976 / 2.9015394007 / [0.0049]
5 %arch1 / 0.412844619 / 0.1955934408 / 2.1107283426 / [0.0382]
6 %garch1 / -0.2899308775 / 0.2162188358 / -1.3409140623 / [0.1841]


R^2 = 24.270465148%
S.E. = 0.1662718341

Model nie uległ poprawie.

Jakie więc wnioski? Czy giełda zachowuje się nieracjonalnie skoro zyski firm są kompletnie nieskorelowane ze zmianami PKB, a jednocześnie giełda reaguje silnie na zmiany PKB? Obecnie wniosek powstaje następujący. Giełda reaguje zbyt nerwowo na zmiany PKB i potwierdza do pewnego stopnia swoją nieracjonalność. Aby w pełni się z tym zgodzić powinniśmy jeszcze sprawdzić co się dzieje w poszczególnych kwartałach: czy kwartalne zmiany PKB i zysków są trochę skorelowane? Zwrócę też uwagę, że wszystkie zmienne, którymi operowałem w tym wpisie: indeks SP 500, zysk SP 500 oraz PKB USA były wyrażone w wielkościach realnych i brane ze strony: http://www.multpl.com/us-gdp-inflation-adjusted/ . Nie jest wykluczone, że istotne różnice pojawiłyby się przy wartościach nominalnych. Na razie należy skonkludować, że giełda jest po pierwsze nadreaktywna na otoczenie, po drugie prawie w ogóle nie reaguje na roczne zmiany własnego zysku. Krótko mówiąc jest za bardzo spekulacyjna, a za mało "inwestycyjna".

Ale właściwie czy może być to zaskakujący wniosek? Nasza polska giełda robi właściwie to samo, tylko jeszcze gorzej, bo bezmyślnie powtarza każdy ruch giełdy z Ameryki.

.......................................................................

Dodane 22.08.2011:

Jeszcze raz zrobiłem testy, które opisałem w następnym poście. Okazuje się, że w rzeczywistości to statystyka trochę kłamie, a giełda nie okazuje się wcale tak bardzo nieracjonalna (korelacja zmiany zysku - zmiany PKB istnieje). Nadal jednak związek wydaje się być zbyt chwiejny.