poniedziałek, 5 września 2016

Szybkie porównywanie statystyk w Wolphram Alpha

Jeśli nie mamy za bardzo czasu na głębsze analizy makroekonomiczne, ale chcielibyśmy uzyskać szybko wskaźniki porównawcze, możemy posłużyć się narzędziem Wolphram Alpha (WA). WA służy głównie do rozwiązywania różnych, często skomplikowanych problemów matematycznych, ale jego użyteczność na tym się nie kończy. Powiedzmy, że najpierw chcę sprawdzić jak się zachowuje wzrost PKB w Polsce. Wpisuję np. "gdp growth poland" i wciskam Enter:



Dalej, np. chcę porównać wzrost PKB w Polsce ze wzrostem PKB w USA. Wpisuję w wyszukiwarce WA np. "poland gdp growth vs usa gdp growth":




Wpiszmy "Poland unempoyment rate vs GDP growth rate":



Jeśli chodzi o dane ekonomiczne, WA nie jest jakimś wybitnym narzędziem, bo wielu bardziej szczegółowych rzeczy nie znajdziemy (np. gdy chciałem znaleźć porównanie danych kwartalnych, to nie dostałem tego co chciałem). Najlepsze statystyki dostaniemy, gdy porównamy pewne ogólne cechy, np. wpiszemy "Poland vs Germany":






Niektóre statystyki pominąłem.
Nawiasem mówiąc, biorąc pod uwagę tzw. Kryzys Migracyjny , tj. ciągły napływ uchodźców np. do Niemiec, dość interesujące, że w Niemczech aż 91% populacji to ciągle Niemcy, a więc niewiele mniej niż Polaków w Polsce (96%) - dane są z 2014 r. Dalej, patrząc na religię, o ile Polska to niemal w 100% kraj katolicki, o tyle Niemcy są w dużej mierze ateistami, stąd tylko 76% uważa się za chrześcijan, natomiast islam stanowi tylko 4,5%. Język natomiast już w ogóle tak jak w Polsce jest niemal w 100% "rdzenny".

WA można także wykorzystać do wielu analiz statystycznych. Np. wpisanie "z-test for population mean", dostarczy szczegółowej analizy statystyki z. Wybieramy dane do testu, np.


I otrzymujemy takie informacje:



co oznacza, że (zakładając rozkład normalny) jeśli liczba obserwacji = 100, a średnia z próbki wynosi 0,2 i odchylenie standardowe = 1, to hipoteza sprawdzająca czy średnia z populacji wynosi 0, zostanie odrzucona na poziomie istotności 5%, ponieważ p-value = 4,55% < 5%.

Następnie, łatwo sprawdzić regresję liniową, którą można prosto ułożyć stosując np zapis: linear fit {34, 20},{40, 23},{48, 22},{52, 29},{57, 27.5}, {62, 31}



WA podaje wiele innych przykładów funkcji statystycznych (np. przedział ufności dla średniej i odchylenia standardowego) i ekonometrycznych (np. "exponential fit" czy "log fit").

Na koniec, jako ciekawostkę, dodam, że jest też możliwość użycia CAPM:

niedziela, 28 sierpnia 2016

Mediana, średnia arytmetyczna, geometryczna i skośność

Warto sobie uświadomić, kiedy mediana (Me) przyjmuje wartość średniej arytmetycznej (A), a kiedy geometrycznej (G). Jak wiadomo w rozkładzie normalnym Me = A. Nieco mniej znany jest fakt, że w rozkładzie log-normalnym Me jest równa G. W artykule Czy mediana jest lepsza od średniej? twierdziłem, że dla rozkładu nie-normalnego Me jest lepszym estymatorem niż A dla krótkoterminowej stopy zwrotu. To prowadzi jednak do paradoksu: jeżeli miałoby to dotyczyć rozkładu log-normalnego, to znaczyłoby to, że Me, która jest wtedy równa G, powinna zastąpić A, a przecież właśnie A dostarcza informacji krótkoterminowych. Ten paradoks wynika po prostu ze ścierania się ze sobą dwóch różnych koncepcji: nieobciążoności i efektywności estymatora. Jeżeli bardziej zależy nam na wartości oczekiwanej, to wybieramy nieobciążoność, jeżeli bardziej zależy nam na jak najmniejszym ryzyku, wybieramy efektywność. Dla krótkoterminowej stopy wartość oczekiwana = A, dla długoterminowej stopy wartość oczekiwana = G  (por. art. z W poszukiwaniu nieznanej wartości oczekiwanej - część 2).
Załóżmy, że A i G pozostają stałe, a Me będzie zmienną. Wtedy w zależności od rozkładu Me będzie skakała z poziomu A w rozkładzie normalnym do G w rozkładzie log-normalnym. Wiemy, że dla zmiennej losowej zawsze A > G. Oczywiste więc, że przechodząc od rozkładu normalnego do log-normalnego mediana będzie się zmniejszać.

Możemy znaleźć ogólną przybliżoną  relację pomiędzy tymi 3-ma miarami i sprawdzić jak zachowuje się Me. Przypomnę wzór na G, który wyprowadziłem w art. O relacji między arytmetyczną a geometryczną stopą zwrotu:



gdzie:
V - wariancja
Sk - skośność, czyli 3-moment centralny podzielony przez wariancję do 3/2
K - kurtoza, czyli 4-moment centralny podzielony przez wariancję do kwadratu.

Jednocześnie wiadomo, że współczynnik skośności Sk jest często wyrażany za pomocą wzoru* [np. 1, 2]:


Wobec czego G1 przyjmuje postać:




Załóżmy teraz, że A jest stała, a Me i G są zmienne. Gdy rozkład jest normalny, to Me = A. Gdy pojawia się skośność dodatnia, Me zaczyna spadać, aby skośność mogła rosnąć. Ale jednocześnie rośnie wtedy G1 (bo licznik rośnie). Skoro wiemy, że G1< A, to wnioskujemy, że w pewnym punkcie G1 zrówna się z Me. W tym punkcie rozkład staje się log-normalny.
Filozoficznie możemy rozumować, że skoro z jednej strony mediana jest odporna na wstrząsy, z drugiej długokresowe tempo zmian staje się medianą, to inwestycja długoterminowa jest bardziej odporna na wstrząsy.


* Inny często używany wzór to (zob. np. [3]):









Literatura:
[1] MacGillivray, H. L., Skewness and Asymmetry: Measures and Orderings, Sep. 1986,
[2] Arnold B. C. A., Groeneveld, R. A., Measuring Skewness with Respect to the Mode, Feb. 1995,
[3] Eisenhauer, J. G., Symmetric or Skewed?, Jan. 2002.