sobota, 28 kwietnia 2018

Jak prawidłowo obliczać procenty składane dla niepewnych aktywów?

Różni analitycy kuszą ludzi inwestowaniem na giełdzie, przedstawiając im zasadę działania procentu składanego. Najnowszy wpis z tej serii pojawił się dziś na blogu https://pokonacgielde.blogspot.com/2018/04/efekty-procentu-skadanego-w-dugim.html. W tym przypadku autor dodatkowo błędnie przypisuje siłę inflacji do napędzania giełdy. W artykule Czy inflacja jest dobra dla akcji?  podałem dowody empiryczne, że stopy zwrotu są ujemnie skorelowane z inflacją. Ale to akurat osobny temat.

Zastanawialiście się kiedyś czy do procentu składanego wyznaczającego przyszły zysk brać średnią arytmetyczną czy geometryczną? Intuicyjnie wydaje się, że geometryczna jest poprawniejsza. Nie jest to do końca prawda. Gdyby oczekiwana stopa zwrotu była znana (a stopy zwrotu niezależne od siebie), to powinniśmy stosować średnią arytmetyczną. Gdy mamy do czynienia z lokatami, to średnia arytmetyczna staje się równa średniej geometrycznej i dlatego obydwa podejścia są tożsame. Sytuacja się zmienia na instrumentach ryzykownych. W tym przypadku oczekiwana stopa zwrotu może być znana albo nieznana. Jeśli jest znana, to, jak wyżej napisałem, stosujemy średnią arytmetyczną. Jeśli jest nieznana - jak to ma miejsce najczęściej na rynkach - sytuacja się komplikuje. W uproszczeniu, gdy mamy do czynienia z niepewnością, porada jest następująca:
* jeśli interesuje nas krótki okres czasu, to nadal stosujemy średnią arytmetyczną,
* jeśli interesuje nas średni okres czasu, to stosujemy średnią ważoną ze średniej arytmetycznej i geometrycznej,
* jeśli interesuje nas długi okres czasu, to stosujemy średnią geometryczną,
* jeśli interesuje nas bardzo długi okres czasu, tak długi, że przekracza długość próby historycznej, to stosujemy "ukaraną średnią geometryczną" z powodu niepewności co do przyszłości.

Przypomnę, że w artykule W poszukiwaniu nieznanej wartości oczekiwanej - część 1 przeprowadziłem cały dowód (na podstawie rozumowania Blume'a), że w przypadku, gdy nie znamy krótkookresowej oczekiwanej stopy zwrotu, długookresowa oczekiwana stopa zwrotu brutto (tj. zwykła, netto, po powiększeniu o 1) w przybliżeniu będzie dana wzorem:

(1)

gdzie:
T - okres przeszłości; liczba obserwacji do próby
N - okres przyszłości
A - średnia arytmetyczna stopa brutto (liczona dla danych z okresu T). Zapisalibyśmy ją A = 1 + a, gdzie a to średnia arytmetyczna netto, czyli zwykła średnia średnia arytmetyczna.
G - średnia geometryczna stopa brutto (liczona dla danych z okresu T). Zapisalibyśmy ją G = 1 + g, gdzie g to średnia geometryczna netto, czyli zwykła średnia średnia geometryczna.


Przykład: PEKAO SA (PEO).
Okres: od końca 2007 do końca 2017 r., czyli T = 10. Dane roczne ze stooq.pl, który uwzględnia dywidendy, tzn. stopy zwrotu są powiększone o dywidendy brutto. Uzyskane parametry to:
a = 1,08%
A = 1,0108
g = -0,68%
G = 1-0,0068 = 0,9932

* Jeżeli interesuje nas krótki okres, to N = 1 i wtedy wzór (1) sprowadza się do M = A. Czyli rzeczywiście dostajemy średnią arytmetyczną, tj. m = a = 1,08% rocznie.

* Jeżeli interesuje nas średni okres, np. N = 5, wtedy wzór (1) daje M^5 = 1,0157, czyli roczna oczekiwana stopa netto wynosi m = 1,0157^(1/5) - 1 = 0,3% średniorocznie.

* Jeżeli interesuje nas długi okres, np. N = 10 i wtedy wzór (1) sprowadza się do M = G. Czyli rzeczywiście dostajemy średnią geometryczną, tj. m = g = -0,68% rocznie.

* Jeżeli interesuje nas bardzo długi okres, np. N = 20, wtedy wzór (1) daje M^20 = 0,46, czyli roczna oczekiwana stopa netto wynosi m = 0,46^(1/20) - 1 = -3,8% średniorocznie.

Ogólnie biorąc N > T powoduje, że stopa zwrotu jest coraz mniejsza w sposób sztuczny, bo zostaje ukarana za to, że chcemy szacować przyszłość, nie mając wystarczającej liczby danych. Dlatego zalecałbym, aby maksymalnie N = T. Co de facto oznacza, że dla długich okresów czasu stosujemy rzeczywiście średnią geometryczną.

Gdyby występowało ryzyko inwestycji, ale ogólnie roczna oczekiwana stopa zwrotu byłaby znana, to wzór (1) sprowadziłby się do M = A.
(Łatwo zauważymy, że tak będzie, gdy spojrzymy na formułę nr (4) z artykułu, gdzie wyprowadzałem ten wzór - losowy czynnik e(t) wyniesie 0, więc M musi sprowadzić się do średniej arytmetycznej).

I teraz powrócę do tego wpisu bloga, gdzie autor propaguje rachunek procentu składanego. Autorowi wyszła roczna oczekiwana stopa zwrotu PEO równa 6,7% w przeciągu 30 kolejnych lat. Ogólnie teraz widać, gdzie popełnia on błąd (zakłada, że prawdziwa oczekiwana stopa M jest znana) ale zwrócę uwagę na dodatkowy aspekt. Otóż popełnił teoretyczny błąd polegający na włączeniu inflacji do geometrycznej stopy zwrotu. Stopa inflacji to średni wzrost cen z roku na rok. Czyli z punktu widzenia wzoru (1) jest to wzrost 1 rok naprzód. Jeśli podstawimy N = 1, to dostaniemy M = A. Oznacza to, że stopa inflacji wyraża średnią arytmetyczną stopę wzrostu. Ale w takim razie, aby obliczyć M dla PEO autor nie mógł szacować 30 lat naprzód, tj. nie mógł użyć N = 30, a tylko 1. Przypominam, że użycie średniej arytmetycznej jako składanej oczekiwanej stopy zwrotu jest możliwe tylko w trzech sytuacjach:
- oczekiwana stopa zwrotu jest znana,
- N = 1
- T jest bardzo duże, a N niewielkie w stosunku do T. Np. jeśli T = 1000, a N = 10, to z (1) wynika, że M będzie praktycznie równe A.

Nawet jeśli przyjmiemy, że oczekiwana stopa inflacji jest znana (ok. 2%) i wówczas moglibyśmy obliczyć długookresową oczekiwaną stopę inflacji za pomocą średniej arytmetycznej, to już oczekiwana stopa zwrotu z akcji jest nieznana, więc nie możemy połączyć tych dwóch stóp ze sobą. To są po prostu dwie różne kategorie.

Z drugiej strony ktoś zapyta tak, dlaczego nie można uwzględnić inflacji, przecież jeśli przyjmiemy równowagową wersję stopy zwrotu, tj. CAPM, to właśnie powinniśmy ująć inflację, która zawiera się w stopie wolnej od ryzyka, a ta z kolei siedzi w CAPM. To prawda, możemy przyjąć dwa modele jednocześnie: formułę (1) oraz CAPM. One się nie kłócą. Tylko że aby się one ze sobą zgadzały, to CAPM musi także stanowić nieznaną oczekiwaną stopę zwrotu, a skoro powiedzieliśmy, że inflacja siedzi w CAPM, to ta inflacja musi zostać przekształcona w nieznaną oczekiwaną inflację. Ponieważ nieznaną wartość oczekiwaną wyraża wzór (1), to znaczy, że inflacja także musi jemu podlegać. W sumie musimy posiadać dwa rodzaje stóp inflacji: krótkookresową - arytmetyczną oraz długoookresową - geometryczną. Obie byłyby potrzebne do użycia modelu (1). W tym sensie CAPM zostaje podzielony na dwie części: krótkookresową i długookresową. Część krótkookresowa dotyczy średniej arytmetycznej, a długookresowa - geometrycznej.

Nie zawsze da się prosto wyliczyć średnią geometryczną. Normalnie, gdy mamy same stopy, jak w przypadku inflacji, to dodajemy do każdej wartości 1, aby uzyskać stopy brutto, a następnie używamy np. formuły Excela na średnią geometryczną. Sprawa się komplikuje w przypadku zysków, które nie rzadko stają się ujemne. Wtedy nie możemy obliczyć średniej geometrycznej w taki sposób.  Zamiast tego możemy wykorzystać przybliżenie na geometryczną stopę zwrotu, które tutaj wyprowadziłem (nie mylić oznaczeń: w tamtym A to tutaj a). Wzór (1) będzie poprawny dla rozkładu normalnego, toteż ze 4-ch wyprowadzonych przybliżeń, G2 powinien być najlepszy. Przy założeniu normalności rozkładu:

(2)


gdzie V - wariancja.
Częściej interesuje nas odchylenie standardowe, stąd (2) zapiszemy:

(3)


gdzie S - odchylenie standardowe z próby.

Aby wstawić tę formułę do (1), zapiszemy:

(4)


Wstawimy (4) do (1):

(5)


W ostatnich 10 latach (T = 10) średnia inflacja (a) wyniosła 2,02%, tj. A = 1,0202, a odchylenie standardowe (S), 2,03% (Bank Światowy). Podstawmy te dane dla różnych N, aby uzyskać wgląd w oczekiwania na temat inflacji:
* dla N = 1, m = 2,02% = średnia arytmetyczna inflacji,
* dla N = 5, m = 2,01%,
*dla N = 10, m = 2% -> jest to przybliżona średnia geometryczna inflacja,
*dla N = 20, m = 1,98%
*dla N = 30, m = 1,95%.

Jedynie krótkookresowy wzrost, dla N = 1, pozwala na zastosowanie zwykłej średniej stopy inflacji. Dla dłuższych okresów, musi ona zostać odpowiednio pomniejszona. W tym przypadku akurat różnica nie jest duża, ciągle to ok. 2%. Jednak w ogólnym przypadku, gdybyśmy chcieli dodać wzrost zysków, proste łączenie arytmetycznego z geometrycznym tempem wzrostu, okazuje się błędne.

piątek, 27 kwietnia 2018

Dowód, że wynagrodzenie netto to ok. 70% wynagrodzenia brutto (ciekawostka)

W ramach ciekawostki pokażę, że wynagrodzenie netto to rzeczywiście ok. 70% wynagrodzenia brutto. Chociaż powszechną praktyką jest szacowanie pensji netto na tym poziomie, to jednak z żadnych znanych mi materiałów nie wyczytamy, że jest to prawidłowe podejście. Powiedzmy, że wynagrodzenie brutto pracownika wynosi 4500 zł. Wg kalkulatora Gofin ( https://kalkulatory.gofin.pl/Kalkulator-wynagrodzen,12.html ) wynagrodzenie netto wyniesie wówczas 3201,58 zł. Kalkulator ten przeprowadza następującą analizę:


Na rysunku pogrubione są 3 rodzaje "kosztów": składki na ubezpieczenia społeczne, składka na ubezpieczenie zdrowotne i zaliczka na podatek dochodowy. Aby uzyskać wynagrodzenie netto, odejmujemy te 3 rodzaje obciążeń:

WN = WB - US - UZ - ZP

gdzie:
WN - wynagrodzenie netto,
WB - wynagrodzenie brutto,
US - składka na ubezpieczenie społeczne. Zgodnie z obowiązującymi obecnie przepisami: US = 13,71%*WB
UZ - składka na ubezpieczenie zdrowotne. UZ = 9%*(WB - US) = 9%*WB*(1 - 13,71%) = 9%*86,29%*WB = 7,77%*WB.
ZP - zaliczka na podatek dochodowy. Ogólnie ZP = PD - UP - OUZ.

gdzie:
PD - podatek dochodowy od osób fizycznych. PD = s*(WB - US - KP),
gdzie
s - stawka podatkowa. Obecnie s = 18%,
KP - koszty uzyskania przychodów. Obecnie miesięczne KP = 111,25 zł.

UP - ulga podatkowa. Obecnie miesięczna UP = 46,33 zł.
OUZ - składka na ubezpieczenie zdrowotne podlegająca odliczeniu od podatku. Zgodnie z przepisami OUZ = 7,75%*(WB - US) = 7,75%*WB*(1 - 13,71%) = 7,75%*86,29%*WB = 6,69%*WB.
Jednakże powyższe formuły na ZP i PD nie są precyzyjne. ZP oraz podstawa opodatkowania (WB - US - KP) muszą być zaokrąglone do liczby całkowitej. Czyli w formułach Excela, zapisalibyśmy
ZP = Zaokr(PD - UP - OUZ; 0). Tj. obecnie ZP = Zaokr(PD - 46,33 - 6,69%*WB; 0),
PD = s*Zaokr(WB - US - KP; 0). Obecnie PD = 18%*Zaokr(WB - 13,71%*WB - 111,25; 0) = 18%*Zaokr(WB*(1 - 13,71%) - 111,25; 0) = 18%*Zaokr(WB*86,29% - 111,25; 0).

Czyli:
WN = WB - US - UZ - ZP = WB - 13,71%*WB - 7,77%*WB - ZP = WB*(1 - 13,71% - 7,77%) - ZP = 78,52%*WB - ZP.

Mamy więc dwie części składające się na WN: 78,52% WB oraz ZP.

Ponieważ, jak wyżej wskazałem, ZP powinno być zaokrąglane, to podzielę teraz materiał na dwie części: dokładną (bez przybliżeń) oraz z przybliżeniami.

A) Dokładna:
Na podstawie powyższych wzorów, można zapisać:
ZP = Zaokr(18%*Zaokr(WB*86,29% - 111,25; 0) - 46,33 - 6,69%*WB); 0)

Stąd:
WN = 78,52%*WB - Zaokr(18%*Zaokr(WB*86,29% - 111,25; 0) - 46,33 - 6,69%*WB; 0)

Możemy w Excelu wstawić tę formułę i zastąpić WB = 4500. Powinniśmy otrzymać WN = 3201,4 zł. W stosunku do prawidłowego wyniku 3201,58 zł, jest 18 gr różnicy, co wynika z zaokrągleń na danych. Przedstawione przekształcenia nie uwzględniają koniecznych zaokrągleń do drugiego miejsca po przecinku przy obliczaniu procentu dla każdego elementu.

B) Z przybliżeniami:
Teraz usuńmy zaokrąglenia dla ZP:

ZP = 18%*(WB*86,29% - 111,25) - 46,33 - 6,69%*WB = WB*18%*86,29% - 18%*111,25 - 46,33 - 6,69%*WB = WB(15,53% - 6,69%) - 18%*111,25 - 46,33 = 8,84%*WB - 18%*111,25 - 46,33

Stąd:
WN =  78,52%*WB - (8,84%*WB - 18%*111,25 - 46,33) =  
= 69,68%*WB + 18%*111,25 + 46,33
 
Wynagrodzenie netto stanowi więc niecałe 70% WB plus 66 zł (18%*111,25 + 46,33 = 66,4). Pamiętajmy, że jest to przybliżenie prawidłowego WN, które wynosi 3201,58 zł, podczas gdy po wstawieniu 4500 do przedstawionego wzoru WN wyniósłby teraz 3201,96 . Jednak to przybliżenie jest nieporównywalnie lepsze niż standardowe, uproszczone podejście:
70%*4500 = 3150,
71%*4500 = 3195,
72%*4500 = 3240.

Ponieważ koszty uzyskania przychodów (KP) oraz ulga podatkowa (UP) dość często się zmieniają, to ogólniej, możemy zamiast 70% WB stosować następujący wzór:

WN = 69,68%*WB + 18%*KP + UP. 

Wzór ten jest możliwy, bo nigdzie w przekształceniach nie używałem KP i UP poza tymi miejscami.
Wzór się jednak nieco zmieni, jeśli stawka s będzie inna. Jeśli wrócilibyśmy do starej s = 19%, wtedy nowy wzór wyglądałby tak:
WN = 68,81%*WB + 19%*KP + UP. Dla WB = 4500, KP = 111,25 i UP = 46,33, WN = 3163,92. Faktyczna WN wyniosłaby 3164,58. Oczywiście ciągle stosując 70%, dostalibyśmy zawsze to samo, czyli 3150. Podejście 70% staje się teraz "bardziej prawidłowe" niż 71%, bo pierwsza część (68,81%*WB) została trochę obniżona. W każdym razie pokazałem, że choć zasada 70% nie jest idealna, to ma ona swoje uzasadnienie matematyczne.

wtorek, 10 kwietnia 2018

Analiza techniczna pokonuje strategię pasywną tylko na niedojrzałych rynkach

Do tytułowego wniosku można dojść po przeczytaniu kilku prac naukowych. Hsu i Kuan [2] skupili się na zbadaniu wielu narzędzi analizy technicznej na DJIA, S&P 500, NASDAQ oraz Russell 2000. Dane objęły okres 1989-2002, z podziałem na in-sample (1990-2000) i out-of-sample. Sprawdzono wiele strategii: reguły filtra (filter rules, FR), średnich ruchomych (moving average, MA), wsparcie i opór (support and resistance, SR), przełamanie kanału / wybicie z kanału (channel break-outs, CB), wskaźnik wolumenu (on-balance volume averages, OBV), strategie momentum w cenie (momentum strategies in price, MSP), momentum wolumenu (momentum strategies in volume MSV), głowę z ramionami (head-and-shoulders, HS), trójkąt (triangle, TA), prostokąt (rectangle, RA), podwójne szczyty i dna (double tops and bottoms, DTB), a także trójkąt rozszerzający (broadening tops and bottoms, BTB). Przetestowano dzienne stopy zwrotu w porównaniu z metodą pasywną (kup i trzymaj). Uwzględniono w tym koszty transakcyjne i usunięto zjawisko "podkradania danych" (data-snooping), które polega na zniekształcaniu wyników, gdy testuje się ciągle kolejne reguły dla tej samej próby (bo dla każdej losowej próbki możemy sztucznie szukać dowolnej reguły tylko po to, aby dopasować ją do danych).  Wyniki badania:


Jedynie AT zastosowana na NASDAQ i Russel 2000 przyniosła ponadprzeciętne stopy zwrotu. Najlepszą metodą dla obydwu rynków okazała się prosta MA(2) z niewielkim filtrem 0,001, tzn. kurs kupna/sprzedaży został przemnożony przez 1,001. Taka strategia przyniosła Nasdaq 38% rocznej stopy zwrotu, miała także wysoki współczynnik Sharpe'a. Dla DJIA i SP 500 wyniki okazały się nieistotne statystycznie (na poziomie ist. 1%).

Ponieważ na tle DJIA i S&P 500, Nasdaq i Russel 2000 były młodymi giełdami, to autorzy konkludują, że efektywność rynku została zachowana na dojrzałych rynkach, natomiast młode giełdy nie zostały jeszcze odpowiednio zdyskontowane.

Kolejni naukowcy potwierdzili powyższe wnioski. Scaillet i Bajgrowicz [5] przetestowali niektóre techniki co [2]: FR, MA, SR, CB, OBV - na danych DJIA na ogromnej przestrzeni czasu 1897-2011. Podzielili ten zakres na kilka podokresów. Po usunięciu data-snooping  i kosztów transakcyjnych, otrzymano wyniki poniżej:


Najważniejsze jest tu spojrzenie na BRC p-value (obliczone na podst testu  Bootstrap reality check White'a, BRC, który uwzględnia data-snooping). Widzimy, że do 1986 r. techniki AT pozwalały skutecznie zarabiać, a po tym roku, wraz z ich rozpowszechnieniem i rozwojem komputerów, straciły całkowicie skuteczność.

Hsu, Hsu i Kuan [3] przetestowali z kolei dwie techniki: MA oraz reguły filtrów dla podobnych giełd co [2]: SmallCap 600 Growth Index Fund (IJT), Russell 2000 Index Fund (IWM), NASDAQ Composite Index Tracking Fund (ONEQ), ale dodatkowo sprawdzono giełdy krajów rozwijających się: MSCI Emerging Market s Index, MSCI Brazil Index, MSCI South Korea Index, MSCI Malaysia Index, MSCI Mexico Index, and MSCI Taiwan Index.
Autorzy podzielili okresy na okres przed wprowadzeniem ETF-ów i po wprowadzeniu ETF-ów na te indeksy. Okresy przed i po wprowadzeniu ETF-ów dla każdej giełdy, prezentuje poniższa tabela:



Okazało się, że po wprowadzeniu ETF-ów AT straciła moc istotności na wszystkich giełdach USA, a więc także NASDAQ (ETF na niego to ONEQ) i Russel 2000 (IWM), które w badaniu [2] wykazały istotność. Natomiast w zagranicznych giełdach okres po wprowadzeniu ETF, spowodował, że tylko 2 z 6 testowanych giełd wykazywało istotne prawidłowości w badanych strategiach AT: MSCI Malaysia Index Fund (EWM) oraz MSCI Mexico Index Fund (EWW). Przed okresem ETF-ów, 4 z 6 indeksów podlegały istotnie sprawdzanym technikom. Wyniki zbiorcze poniżej:



Poza tym z punktu widzenia wskaźnika Sharpe'a zaledwie jeden rynek (EWW) charakteryzuje się ponadprzeciętnością, tzn. stosując AT ryzyko zostało istotnie obniżone w stosunku oczekiwanego zysku tylko na tym jednym rynku. Sugeruje to, że gdy giełda staje się dojrzała, AT przestaje działać, a wprowadzenie ETF-ów niemal całkowicie usuwa jej ponadprzeciętny wpływ na zyski. Ja bym dodał, że chodzi tu także o coraz większe zautomatyzowanie transakcji, które powoduje, że automaty zaczynają ze sobą konkurować.

Czy w polskich warunkach AT działa? Czekaj, Woś i Żarnowski [1] przeprowadzili szerokie badania na 32 polskich spółkach notowanych od 3 kw 1994 do 3 kw 2000, czyli na stosunkowo małej próbie. Sprawdzali najróżniejsze techniki (na danych dziennych), w tym średnie kroczące, filtry i oscylatory. Ustalili, że ogólnie rzecz biorąc, wiele znanych technik zwiększa średnią stopę zwrotu, ale - po odjęciu kosztów transakcyjnych - w sposób nieistotny statystycznie. W przypadku średniej kroczącej najlepszym parametrem było 72 dni (tj. MA(72)), a średnia miesięczna stopa zwrotu wyniosła - po odjęciu prowizji 0,3% - 1,21%. Nieco lepszym okazał się MA(3) z filtrem 2,5% - średnia miesięczna stopa zwrotu to 1,49%. Jednocześnie metoda "kup i trzymaj" przyniosła miesięcznie 0,8%. Ale żadna spółka nie zwiększyła zysku istotnie dla tych reguł. Zdarzyły się natomiast pojedyncze przypadki spółek, które dla innych technik odnotowały ponadprzeciętne zyski. Najlepszym oscylatorem okazał się ROC(2), dla którego przeciętna miesięczna stopa wyniosła 1,52% (przy 0,3% prowizji), podczas gdy metoda kup i trzymaj 0,8%. Dla tej metody 2 spółki dały istotnie ponadprzeciętne zyski. Jednak 2/32 to zaledwie 6%. Z kolei momentum(105) dał najwyższy spośród wszystkich technik miesięczny zwrot 1,7% (po odjęciu prowizji), ale żadna spółka nie wykazała się tutaj istotną poprawą w stosunku do kup i trzymaj (0,8%).

Znalazłem też pracę [6], w której testowano następujące reguły AT dla polskiej giełdy: formację głowy i ramion, odwróconą formację głowy i ramion, formacje podwójnego szczytu („M”) i dna („W”) oraz formacje potrójnego szczytu i dna - dla WIG20 z lat 1999–2005, oraz akcji wybranych spółek, z lat 2000-2005. Należy tu podkreślić, że autor uwzględnił (chyba?) tak samo jak poprzedni autorzy zjawisko podkradania danych, bo wspomina o nim, nazywając je "nadmierną analizą danych". Autor tak podsumowuje wyniki:
"(...) należy stwierdzić, że czynniki, które według analityków technicznych determinują wiarygodność formacji technicznych, albo nie wpływają w istotny sposób na prawdopodobieństwa odwrócenia trendu i wypełnienia prognozy wybicia z formacji, albo efekt ich oddziaływania jest przeciwny do postulowanego w podręcznikach analizy technicznej. Wydaje się więc, że analiza formacji w postaci rekomendowanej przez zwolenników analizy technicznej ma małą wartość prognostyczną."

Ostatnio także Hsu, Taylor i Wang przebadali w szerokim zakresie rynki walutowe, także usuwając zjawisko podkradania danych [4]. Testowano oscylatory, filtry, MA, SR, kanały. Okazało się, że choć wiele technik AT odgrywało na początku pewną rolę, to z czasem nastąpił jej zanik. Przebadano kurs USD vs 30 różnych walut, w tym polski złoty. Całkowity okres badawczy: 1971-2015. Poniższa tabela przedstawia liczbę technicznych reguł z istotną statystycznie nadwyżkową stopą zwrotu, z podziałem na okresy:


Im późniejsze okresy, tym skuteczność AT słabła. Od 2008 r. tylko dwa rynki walutowe wykazywały rzeczywistą nadwyżkę zysku. Rynek USD/PLN okazał się informacyjnie efektywny, tzn. AT została tam zdemaskowana.

Przypomnę, że robiłem także swego rodzaju test wybić z trendów (zob. tutaj) i w prawie wszystkich przypadkach okazały się nieistotne statystycznie, niemniej na pojedynczych spółkach same wybicia miały prawdopodobieństwa empiryczne powyżej 50%.

Z tych wszystkich badań wynika, że analiza techniczna powinna być traktowana z dużą rezerwą.


Literatura:
[1] Czekaj, J., Woś, M., Żarnowski, J., Efektywność giełdowego rynku akcji w Polsce, PWN W-wa 2001;
[2]  Hsu, PH; Kuan, CM, Reexamining the profitability of technical analysis with data snooping checks, 2005;
[3] Hsu, PH; Hsu, YC; Kuan, CM, Testing the predictive ability of technical analysis using a new stepwise test without data snooping bias, 2010;
[4] Hsu, PH, Taylor, M. P., Wang, Z., Technical Trading: Is it Still Beating the Foreign Exchange Market?, 2016;
[5] Scaillet, O., Bajgrowicz, P., Technical trading revisited: false discoveries, persistence tests, and transaction costs, 2012;
[6] Grotowski, M., Zastosowanie modelu logitowego do weryfikacji skuteczności analizy formacji cenowych, 2009.

niedziela, 8 kwietnia 2018

Krótki komentarz na temat podnoszenia wynagrodzeń polityków, w tym ministrów

W związku z ostatnią aferą nagrodową PIS coraz częściej pojawiają się sugestie, że wynagrodzenia polityków, zarówno wyższego jak i niższego szczebla, powinny być proporcjonalne do średniego wynagrodzenia brutto. Otóż - jeśli chodzi o zwykłych posłów, senatorów itp. - jest niemal dokładnie na odwrót: ich wynagrodzenie powinno być niezmienne w czasie, a co najwyżej korygowane o inflację. Dlaczego? A dlaczego miałoby rosnąć wraz z realnym wynagrodzeniem? Jeśli od stopy wzrostu wynagrodzeń odejmiemy inflację, to dostaniemy wzrost wynikający z produktywności pracy. Czyli wyższe realne wynagrodzenie wynika tylko ze wzrostu produktywności pracy.
Weźmy firmę prywatną: jeśli przedsiębiorca znajdzie sposób na obniżenie kosztów bez obniżania przychodów, to wzrośnie mu zysk i produktywność. Analogicznie, żeby polityk mógł sprawiedliwie dostawać większą pensję, to powinien być w stanie zwiększyć produktywność państwa, w ten sposób, że obniżyłby na stałe ponoszone koszty bez uszczerbku dla państwa. Podkreśliłem "bez uszczerbku dla państwa", bo nie chodzi przecież o zwykłe cięcie budżetu, ale o wartość dodaną. Jednakże aparat państwowy immanentnie charakteryzuje się biurokracją, która blokuje innowacyjność zarządzania jego strukturami.

Nieco inaczej wygląda sytuacja z ministrami. Oni podejmują istotne decyzje, które mogą poprawić lub pogorszyć budżet państwa. Przykładowo mogą ograniczyć przestępczość gospodarczą, zwiększając dzięki temu wpływy budżetowe. Część z tych wpływów może zostać przeznaczona na zwiększenie wynagrodzenia dla ministrów w wyniku zwiększenia produktywności gospodarki. Tutaj traktuje się państwo jak firmę. Można spojrzeć mniej abstrakcyjnie i potraktować urząd sprawowany przez ministra jako zarządzaną przez niego firmę. Skoro zwiększył "zysk", to rozsądne jest (proporcjonalne) zwiększenie pensji.

Wnioski z tego płyną następujące:
1. Podnoszenie płacy minimalnej, aby wyrównać do wzrostu średniego wynagrodzenia jest błędem, bo na wyższe wynagrodzenie należy sobie zasłużyć. Przedsiębiorcy nie będą skłonni płacić ludziom więcej niż na to zasłużyli. Ekonomia nie znosi próżni i dlatego firmy zaczną podnosić ceny, czyli efektem będzie inflacja. Jeżeli z kolei firma funkcjonuje w wysoko konkurencyjnym środowisku i nie będzie mogła sobie pozwolić na podwyższenie cen, to zacznie szukać oszczędności. Sklepy zaczną zwalniać ludzi i zastąpią ich kasami samoobsługowymi, a w przyszłości robotami. Innym, prostszym sposobem, będzie "wyciskanie pracowników jak cytryny". Skoro bowiem mają zasłużyć sobie na wyższą pensję, to muszą wykonać więcej pracy w danym przedziale czasu. Tak czy inaczej, doprowadzi to do wzrostu bezrobocia.
2. Oznacza to, że płaca minimalna powinna być tylko korygowana o inflację. Oznacza to, że dysproporcja między średnim a minimalnym wynagrodzeniem powinna rosnąć i nie powinno się ich wyrównywać.
3. Dwa powyższe punkty odnoszą się analogicznie do wynagrodzenia szeregowych urzędników państwowych. Ich realne wynagrodzenie powinno być stałe w czasie, bo nie zwiększają oni w żaden sposób produktywności gospodarki.
4. Ministrowie mają mniejszy lub większy wpływ na gospodarkę i zostaje to uwidocznione w budżecie państwa. Jeśli swoimi decyzjami, doprowadzili do tego, że różnica pomiędzy wpływami do budżetu a wydatkami z niego, zwiększyła się, np. o x% to ich wynagrodzenie powinno wzrosnąć także o ok. x%. Ale - uwaga - to działa w dwie strony. Jeśli pogorszyliby budżet o x%, to powinni też stracić x% pensji. Taki mechanizm byłby z jednej strony motywujący do pracy dla ministrów, z drugiej nikt nie miałby pretensji co do wzrostu wynagrodzeń.
Zauważmy, że zaproponowany system premii nie będzie odpowiadać ani wzrostowi PKB, ani wzrostowi wynagrodzeń w gospodarce. Gospodarka może radzić sobie bardzo dobrze, a budżet źle. Minister nie powinien zarabiać więcej tylko dlatego, że "gospodarka kwitnie".

sobota, 7 kwietnia 2018

Jak rzetelnie sprawdzić czy dana strategia działa?

Ostatnio napotkałem taki artykuł na bossafx.pl: Czy analiza techniczna może być skuteczna?, który tematycznie przypomina mój artykuł z 2011 Czy analiza techniczna działa? . Chociaż to tylko dwa przykłady, to ilustrują one niespójność podejść do tego samego problemu. O ile bossa zastosowała test serii, który testuje po prostu niezależność kolejnych obserwacji, to ja użyłem schematu Bernoulliego, który pozwala wykryć systematyczność powtarzania się danego zjawiska. Niestety czytelnik w ten sposób traci jasność, który sposób jest poprawniejszy. Odpowiedź jest prosta: moje podejście jest poprawne, natomiast bossy błędne. Jeśli mówimy akurat o analizie technicznej, to liniowa autokorelacja czy to stóp zwrotu czy to samych ich znaków, nie jest istotna dla AT. Przykładowo: wsparcia, opory, punkty odbicia lub formacje w ogóle nie pociągają za sobą konieczności jakichkolwiek autokorelacji. Mogą się pojawić spontanicznie pomiędzy przypadkowymi ruchami, a gdy się pojawią, to ich natura jest nieliniowa. Dlaczego więc bossa stosuje niewłaściwy test dla AT? Wydaje mi się, że to wynika z takiego prostackiego rozumowania:
1) test serii to test na sprawdzanie losowości procesu,
2) jeśli AT działa to znaczy, że zmiany są nielosowe.
Wniosek: jeśli test serii nie wykrywa zależności, to AT nie działa, a jeśli wykrywa, to działa. Oczywiście to jest kompletny nonsens i pomieszanie z poplątaniem. Nielosowość ma różne wymiary, a test serii wykrywa tylko ten najprostszy, podobny do zwykłej autokorelacji. Test serii jest mocniejszy od autokorelacji w tym sensie, że nie mają dla niego znaczenia wartości odstające, grube ogony czy asymetria rozkładu. Wykrywa jedynie wzory w seriach znaków. 

Jeżeli formacje AT nie są zwykłym złudzeniem, to odkryć je mogą tylko zaawansowane metody, jak np. sieci neuronowe, które są w stanie wychwycić nietrywialne wzory. Prostszym i bardziej dostępnym narzędziem jest także regresja nieparametryczna.

Ale chciałem mówić nie o samej AT, ale szerzej o tym jak wszystkie strategie oceniać w kontekście skuteczności. Oczywiście jest to tylko mały wycinek problemu selekcji, ale warto go poruszyć. Otóż wspomniałem na początku o schemacie Bernoulliego. Schemat ten to po prostu taka zbiorcza statystyka sukcesów i porażek danej strategii. Głównym pomysłem, od którego zaczynamy, jest początkowe (racjonalne) założenie, że wyniki sprawdzanej strategii są czysto przypadkowe, tzn. prawdopodobieństwo jej sukcesu jest równe prawdopodobieństwu porażki, a więc wynosi 50%. Ten pomysł przenosimy do rzeczywistości empirycznej w taki sposób: przetestowaliśmy naszą strategię na jakimś walorze i okazało się, że na 27 przypadków wystąpienia reguły (strategii), 19 z nich sprawdziło się. Przykładowo, nasza strategia to kupienie waloru, gdy zostanie przebita linia trendu spadkowego. Sukces to sytuacja, gdy po przebiciu kurs dalej rośnie. Porażka to sytuacja, gdy linia została przebita, ale kurs za chwilę się cofnął i dalej zaczął spadać. W naszym teście wystąpiło 27 linii trendu spadkowego (np. o długości co najmniej 2 miesiące jak w moim teście), która została w końcu przebita. Sukcesem było to, że 19 razy kurs przebił tę linię i dalej rósł. W pozostałych przypadkach po przebiciu wrócił do spadków. Przypominam, że zakładamy od początku, iż wszystkie sukcesy i porażki są tu przypadkowe, tzn. każde zdarzenie ma szansę 50%.
Kolejnym ważnym punktem jest pytanie, ile wynosi prawdopodobieństwo, że wystąpi dokładnie 19 przypadkowych sukcesów na 27 prób. Aby je obliczyć należy zastosować wzór Bernoulliego (funkcję  prawdopodobieństwa rozkładu dwumianowego):

(1)

W naszym przypadku p = 1/2, k = 19, n = 27. Po podstawieniu dostaniemy P(27) = 1,65%.

Na 27 prób 19 przypadkowych sukcesów (tj. 19/27 = 70% obserwacji) może się udać z prawdopodobieństwem 1,65%. Kolejnym krokiem jest sprawdzenie hipotezy zerowej czy ta szansa jest rzeczywiście przypadkowa, jak to od początku zakładamy. Musimy podjąć decyzję czy 1,65%  to dużo czy mało. Jak? Porównujemy uzyskane p-value, tj. wartość dystrybuanty rozkładu dwumianowego, z założonym poziomem istotności. Ilustrując prosto sprawę, zacznę od rozkładu Gaussa. Wiadomo, że w rozkładzie normalnym ponad 95% obserwacji znajduje się w zakresie średnia + 2 odchylenia standardowe. Jest to z pewnością powód, dla którego poziom istotności określa się na 5% jako względnie bezpieczne przybliżenie błędu 1 rodzaju, tj. odrzucenia hipotezy zerowej, która jest prawdziwa (w naszym przypadku odrzucono by losowość). Innymi słowy zakres (średnia plus 2 odchylenia standardowe) uznajemy za wystarczający do przybliżenia pełnej losowej zbiorowości (95% przybliża 100%), a to oczywiście  oznacza, że to co leży poza tym zakresem musi stanowić akceptowalny błąd (nieuwzględnienia możliwości wystąpienia pewnych skrajnych, czysto losowych zdarzeń). To znaczy, 5 na 100 zdarzeń czysto losowych będzie na tyle nietypowych, że wydawać się będą nielosowe i dlatego za takie je uznamy - to jest właśnie błąd pierwszego rodzaju.

Rozkład dwumianowy bardzo szybko przekształca się w rozkład normalny, więc 5% istotności jest dla niego też odpowiednie. Czyli 5% jest pewnym punktem odniesienia do porównania przypadkowości sukcesów. Ale nie możemy porównywać poprzednio obliczonego 1,65% do 5%, bo ta pierwsza wielkość to prawdopodobieństwo tylko konkretnej liczby 19 sukcesów, podczas gdy poziom 5% odnosi się do wszystkich teoretycznych, mało prawdopodobnych sukcesów (skoro wszystko poza główną masą 95%, to wszystko). Stąd musimy dostosować nasze obliczenia do tej kumulacji. Wyobrażamy sobie, że nasz test powtarzamy wielokrotnie w innych wymiarach przy ciągle zmieniających się danych giełdowych. Liczba sukcesów będzie się wtedy zmieniać, czasem będzie więcej sukcesów, czasem mniej - ułoży się to losowo. W ten sposób uzyskamy rozkład częstości i teoretycznie dwumianowy rozkład prawdopodobieństwa. Mając strukturę tego rozkładu, zadajemy pytanie jakie jest prawdopodobieństwo, że co najmniej 19 sukcesów będzie przypadkowych. Aby odpowiedzieć, należy zsumować wszystkie prawdopodobieństwa wystąpienia k, k+1, k+2, .... n sukcesów, tzn. od 19 do 27. W ten sposób uzyskamy dystrybuantę rozkładu. Najłatwiej to zrozumieć porównując dwa grafy poniżej. Pierwszy to "efekt reguły 2 sigm"* z poziomem 5% istotności na krańcach:


A drugi to prawdopodobieństwa dla kolejnej k-tej liczby sukcesów. Im większe k, tym szansa na sukces spada, bo po prostu większa liczba sukcesów staje się mniej prawdopodobna.


Wzór (1) stosujemy dla k = 19... 27 i sumujemy:


Suma to właśnie p-value. Jak powiedziałem wyżej, porównujemy p-wartość z poziomem istotności, tj. 0,0261 < 0,05, ale co to oznacza? Na grafie poniżej obydwie wielkości możemy przeanalizować:



5% to teoretyczne (przyjęte) ryzyko odrzucenia "hipotezy przypadkowości" w sytuacji, gdyby była ona prawdziwa. W konsekwencji prowadziłoby to przyjęcia hipotezy alternatywnej, tzn. przyjęcia testowanej strategii, która w rzeczywistości byłaby nieskuteczna. Ale empiryczne ryzyko tego błędu okazuje się niższe od 5%: szansa, że hipoteza zerowa jest prawdziwa wynosi tylko 2,6% - odrzucamy hipotezę, że 19 sukcesów to tylko przypadek. Jest to w zasadzie najważniejsza konkluzja z tej analizy.

Na koniec - w Gretlu całą opisaną procedurę możemy wykonać bardzo szybko. Aby wyznaczyć p-wartość, wchodzimy w Narzędzia -> 'Wyznaczanie wartości p' i wybieramy rozkład dwumianowy. Mamy 3 pola do wpisania. W pierwszym, Prob, wpiszemy dla naszego przykładu 0,5, bo to jest pr-stwo sukcesu dla hipotezy zerowej (czyli losowości). Liczba (wszystkich) doświadczeń = 27. Za wartość wpiszemy liczbę sukcesów danej strategii, tj. 19:

Po akceptacji dostaniemy:


Szybko zauważymy, że wystarczy dodać pierwsze i ostatnie Prob(x): 0,00957865 + 0,0165408 = 0,02611945. To jest dokładnie nasza p-value, które wcześniej ręcznie obliczyłem. Czyli tak samo jak wcześniej ją porównujemy z poziomem istotności i dochodzimy do wniosku, że hipotezę zerową należy odrzucić i przyjąć hipotezę o "zyskowności" strategii.

* To nie do końca jest efekt reguły 2 sigm, bo zauważmy, że 5% obserwacji musi rozkładać się na obydwa ogony rozkładu, a nie tylko prawy. W rzeczywistości więc mamy poziom istotności 2,5% po lewej i po prawej stronie rozkładu. Oznacza to, że powinniśmy zastosować 2,5% zamiast 5% istotności, jeśli badamy hipotezę tylko prawego ogona. Mimo to używamy 5% na pojedynczym ogonie, co technicznie oznacza 10% istotności (5% po lewej i 5% po prawej). Innym wyjaśnieniem brania 5% może być założenie, że rozkład jest niesymetryczny - występuje tylko prawy ogon, a nie lewy. Ma to sens, bo w ten sposób zakładamy, że strategia może przynieść albo losowo przeciętne wyniki (środek rozkładu) albo losowo bardzo dobre wyniki (prawy ogon), natomiast nie może przynieść bardzo złych wyników, tzn. gorszych niż losowo przeciętne (lewy ogon). Warto tu przypomnieć, że 5% istotności może mieć także zastosowanie dla niesymetrycznych rozkładów, o czym już kiedyś pisałem (zob.  Jak daleko możesz się odchylić? ).

środa, 4 kwietnia 2018

3-miesięczna cykliczność (sezonowość?) WIG

Mimo iż takie testy jak X-12-ARIMA czy TRAMO-SEATS nie wykazują sezonowości w miesięcznych szeregach stóp zwrotu WIGu, to zauważyłem, że analiza spektralna wychwytuje pewną cykliczność, ściślej 3-miesięczną. Wziąłem do sprawdzianu miesięczne dane WIG w okresie 01.2010-03.2018 (stooq.pl):


Stopy zwrotu na pierwszy rzut oka wydają się czysto przypadkowe:


Co więcej, w stopach tych nie występuje w ogóle autokorelacja:


Może trochę zaskakującym być, że test ADF-GLS wskazał niestacjonarność stóp, podczas gdy KPSS czystą stacjonarność. Możliwe, że chodzi tu nie tyle o zmienność średniej, ale wariancji - w artykule Czy oczekiwane stopy zwrotu w ogóle się zmieniają? doszedłem do wniosku, że ADF-GLS wykrywa zmienność (niewarunkowej) wariancji w czasie oraz średniej, podczas gdy KPSS i ADF nadają się wykrywania zmian tylko w wartości oczekiwanej. Wariancja jest jednak kwestią odrębną i nie zajmuję się nią teraz.

Poddałem następnie stopy zwrotu analizie spektralnej. Oto wyniki:



Wyraźnie wybija się tu zaznaczona długość okresu = 2,65 m-cy, ok. 3 miesięcy. Tak wybijająca się wartość wydaje się świadczyć o występowaniu jakiegoś cyklu raz na kwartał. Oczywiście może być to przypadek, bo gretl nie wykonuje testu na istotność statystyczną tej cykliczności. Ale dodatkowo poddałem analizie spektralnej stopy zmian wolumenu WIG, który towarzyszył tym stopom zwrotu. Same stopy zmian wolumenu tak przebiegały:


Zarówno KPSS jak i ADF-GLS wskazał stacjonarność tej zmiennej. Można więc wykonać analizę spektralną. Oto jej wyniki:


W tym przypadku jeszcze wyraźniej wybija się jedna wartość świadcząca o cykliczności w obrotach giełdowych. I gdy spojrzymy na długość cyklu, to okazuje się ona być równa 2,88, czyli znów prawie 3 miesiące. Trudno uwierzyć, żeby to był przypadek.

Same zwroty nie korelują ze zmianami wolumenu. Ale sytuacja się zmienia, gdy porównamy siłę zmian, tzn. wartość bezwzględną albo kwadrat zmiennej. Na przykład kwadrat stopy zwrotu koreluje już z samymi stopami zmian wolumenu na poziomie 26,5% (i jest to istotne stat. przy p-value 1%). Korelacja ta jeszcze się zwiększa, gdy porównamy kwadraty stopy zwrotu z kwadratami zmian wolumenu - wzrasta do 30%.

Tak więc, pomimo iż na WIGu nie występuje miesięczna autokorelacja, to ukrywa się w nim kwartalna cykliczność powiązana z obrotami.

Dość naturalnym staje się pytanie w tym momencie o sezonowość kalendarzową. Sprawdziłem więc strukturę stóp zwrotu w każdym miesiącu oddzielnie. Wyniki zbiorcze można podsumować takim histogramem:


Pamiętajmy, że jest to niewielka liczba danych (poniżej 10-ciu obserwacji dla każdego miesiąca). Najgorszym kwartałem w tym zestawieniu są maj, czerwiec i lipiec (wszystkie ujemne), co chyba nie jest specjalnym zaskoczeniem. Zaznaczyłem w tej "grupie złych" także kwiecień, bo zaskakująco słabo wypadł w badanym okresie. Dodanie tego czwartego miesiąca zostaje jakby skompensowane poprzez odjęcie jednego miesiąca w ostatniej, także słabszej grupie, w której występują tylko 2 miesiące: listopad i grudzień.

P.S. W przedostatnim poście prognozowałem lekką poprawę na WIGu w marcu. Prognoza ta się nie sprawdziła, bo WIG znacząco spadł, niewiele mniej niż w lutym. Dlatego widać, że takie granie pod "sezon" obarczone jest ryzykiem.