piątek, 23 grudnia 2016

Nieliniowa metoda najmniejszych kwadratów dla modelu trendu

W wielu pakietach ekonometrycznych można użyć Nieliniowej Metody Najmniejszych Kwadratów (NMNK), aby uzyskać bezpośrednio poszukiwany parametr. NMNK ma podobnie jak MNK podstawy teoretyczne - o ile słuszność MNK wynika z twierdzenia Gaussa-Markowa, o tyle NMNK jest słuszna z powodu uogólnionych twierdzeń Gaussa-Markowa [1, 2, 3], a także dowiedzionej asymptotycznej zgodności jej estymatora [4].

NMNK nie jest jednolitą metodą. W Gretlu stosowany jest algorytm Levenberga–Marquardt. Algorytm ten jest kombinacją dwóch znanych metod numerycznych: metody gradientu prostego oraz algorytmu Gaussa-Newtona. W metodzie gradientu prostego suma kwadratów błędów jest korygowana w kierunku spadku nachylenia funkcji (gradientu), bo tam znajduje się minimum. W metodzie Gaussa-Newtona wykorzystuje się z kolei przybliżenie funkcji za pomocą wzoru Taylora; kwadraty różnic pomiędzy prawdziwą funkcją a funkcją Taylora powinny być jak najmniejsze [5].

Na chwilę zostawmy to. Wcześniej (tu oraz tu) pokazałem, jak poprawnie retransformować model trendu, aby uzyskać warunkową oczekiwaną stopę zwrotu. Mamy następujący model trendu:

(1)


Powinniśmy zdefiniować składnik losowy. Powiedzmy, że jest on stacjonarny, posiada wartość oczekiwaną = 0 oraz stałą wariancję. Jeżeli zmienna losowa P(T) ma rozkład log-normalny, to jej wartość oczekiwana wynosi:

(2)

Dzięki NMNK możemy oszacować parametry bezpośrednio z modelu (1), a więc bez potrzeby transformacji logarytmicznej. Przykładowo, biorąc te same dane dla mbanku co w wymienionych na początku artykułach (rocznie 1994-2015; 22 obserwacje), możemy stworzyć w Gretlu model (1). Po zaimportowaniu danych, trzeba kliknąć: Model -> Nieliniowa Metoda Najmniejszych Kwadratów. Pojawi się okno i tam wpisujemy:
.................
scalar a = 1
scalar b = 1
Zamkniecie = exp(a+b*time)
deriv a = exp(a+b*time)
deriv b = exp(a+b*time)*time
.................

gdzie:
Zamkniecie - to szereg czasowy, w naszym przypadku kurs mbanku (zmienna P(T));
time - zmienna czasowa (wygenerowana w opcji Dodawanie zmiennych -> time - zmienna czasowa.
a, b - współczynniki regresji, które trzeba od początku zadeklarować. Są to skalary w naszej funkcji, które przyjmą jakąś początkową wartość, np. 1. Standardowo deklarujemy więc scalar a = 1, scalar b = 1. Mogą być one dowolne, ale może się zdarzyć, że nie wystarczy iteracji, aby zbiegły do prawdziwej wartości wg algorytmu. Jeśli tak się stanie, zmieniamy metodą prób błędów.

deriv - pochodna funkcji po danym współczynniku. Np. pochodna d(Zamkniecie)/d(a) = exp(a+b*time), dlatego jest zapis:
deriv a = exp(a+b*time).
I tak samo dla b: pochodna d(Zamkniecie)/d(b) = exp(a+b*time)*time. Dlatego jest zapis:
deriv b = exp(a+b*time)*time.

Mimo że a i b są to skalary modelu, to są one w funkcji szacowane, czyli pierwotnie są zmiennymi.

Niezbyt przyjemne. Można się obyć bez pochodnej, ale w helpie Gretl rekomenduje jej obliczanie.

Przed kliknięciem OK, możemy zaznaczyć jeszcze opcję "Odporne błędy standardowe". Wtedy OK.



Jak widać na tablicy zbieżność nastąpiła po 27 iteracjach. Gdybyśmy wpisali scalar a = 10, scalar b = 10, zbieżność nastąpiłaby dopiero po 240 iteracjach.




Uzyskany parametr b = 0,0996, natomiast wolny parametr a możemy zignorować, bo interesują nas stopy zmian. W porównaniu do logarytmicznego modelu, gdzie uzyskaliśmy logarytmiczną stopę ponad 11%, może się wydać dziwne, że teraz jest niższa wartość. Przecież otrzymaliśmy od razu stopę, która powinna być właśnie wyższa od tej z modelu logarytmicznego MNK. Co jest tego przyczyną? Stało się tak, bo nasz model jest niepełny. Założyliśmy błędnie, że wygląda jak na poniższym rysunku:


W tym modelu składnik losowy jest stacjonarny, może więc to być zmienna losowa o rozkładzie normalnym. Ta zmienna po prostu jest argumentem funkcji wykładniczej. Ale w rzeczywistości powinna być funkcją czasu. Gdy za tę zmienną losową wstawimy proces Browna, czyli skumulowaną zmienną losową o rozkładzie normalnym, to otrzymamy geometryczny proces ruchu Browna. Wtedy nasz model wygląda mniej więcej tak:



Ogólnie geometryczny proces ruchu Browna ma postać (zob. np. [6]):

(3)

gdzie B(T) jest zwykłym procesem ruchu Browna. B(0) = 0.

Proces (3) w danym punkcie czasu może przyjąć różne wartości zgodnie z pewnym rozkładem prawdopodobieństwa. Przestaje być więc rozumiany jako proces, a staje się "ruchem" - zmienną stacjonarną. Ten ruch posiada zawsze rozkład log-normalny. Oznacza to, że możemy wyprowadzić analogicznie do (1) wartość oczekiwaną tej zmiennej.


Zauważamy, że składnik losowy w modelu (1) to jest to samo co (odchylenie standardowe razy proces ruchu Browna) w modelu (3), co oznacza, że musi się tak samo przekształcać jak w modelu (2), gdzie występuje wartość oczekiwana procesu. I stąd podstawiając do (3) powyższe wyprowadzenie wariancji, dostaniemy wartość oczekiwaną geometrycznego (procesu) ruchu Browna:

(4)

W tym miejscu rodzi się pytanie czy rzeczywiście znamy wartość początkową P(0). To zależy od tego czy zaczynamy od T = 1 czy T = 0. Musimy zdecydować czy pierwsza wartość już decyduje o funkcji zależnej od czasu czy dopiero kolejna. Jeśli założymy, że P(0) jest znane, to podstawimy pierwszą cenę zamknięcia mbanku z 1994 r., czyli 30, 68. W przeciwnym wypadku P(0) musi zostać oszacowane. Wybór sposobu ma istotne znaczenie dla uzyskanych wyników: dodanie wolnego wyrazu zmienia postać modelu. Ale jeżeli wybierzemy model z wyrazem wolnym, to estymacja NMNK przyniesie ten sam rezultat co dla modelu (2) - czyli powracamy do modelu (1), który przecież uznaliśmy za niepełny. Wstawienie P(0) nie rozwiąże tego problemu, ale możemy sprawdzić do czego doprowadzi.

Wstawiamy pierwszą cenę zamknięcia P(0) = 30,68. Możemy wtedy powtórzyć całą procedurę w Gretlu, używając modelu (4):

.................
scalar b = 1
Zamkniecie = 30.68*exp(b*time)
deriv b = 30.68*exp(b*time)*time
.................

Uzyskane parametry to:


Dostaniemy wykres trendu:



Zatem u = 12,5, czyli efektywna oczekiwana stopa exp(12,5) - 1 = 13,3%.

Mimo iż obliczyliśmy parametr u, to taki estymator jest niezgodny w tym sensie, że nie będzie dążył do prawdziwej wartości parametru u. Żeby była zgodność, składnik losowy musi być stacjonarny (zob. twierdzenia w [4]). Najprawdopodobniej potrzeba użyć uogólnionej nieliniowej metody najmniejszych kwadratów, która pozwoliłaby uwzględnić rosnącą wariancję i autokorelację składnika losowego.

Ostatecznie można ten problem rozwiązać. Łatwo zauważyć, że tylko w punkcie dla T = 1 geometryczny proces ruchu Browna będzie tożsamy z modelem (1), dla którego składnik losowy jest stacjonarny. W tym punkcie obydwie krzywe się przetną. Czyli w tym punkcie model (2) równa się modelowi (4):


Wyrazy wolne możemy do siebie dostosować, aby zachować identyczną interpretację punktu startu. Dlatego przyjmiemy lnP(0) = a. Stąd:

(5)

Ze względu na stacjonarność składnika losowego dla T = 1 estymator u równy b plus połowa wariancji może stać się w końcu zgodny. Wcześniej oszacowany współczynnik b był estymatorem zgodnym (zakładaliśmy początkowo stacjonarność składnika losowego), chociaż występował w modelu niepełnym. Połowa wariancji też jest estymatorem zgodnym. Suma estymatorów zgodnych daje estymator zgodny (wynika to z własności granicy ciągów). Stąd parametr u równy b plus połowa wariancji stanie się estymatorem zgodnym. Parametr b został wcześniej oszacowany, ale wariancję również znamy, bo jest to przecież ten sam składnik, który był obliczany dla MNK. Estymowaliśmy go wcześniej za pomocą błędu standardowego reszt (tu) i wyniósł 0,346. Możemy podstawić:

u = b + 0,5var
u = 0,0996 + 0,5*0,346^2 = 0,1596

Aby uzyskać oczekiwaną (efektywną) stopę zwrotu wstawimy exp(0,1596) - 1 = 17,3%. Dla porównania w Transformacja lognormalnego modelu z nieznanym parametrem wyszła wartość zbliżona, bo 18,7%.


Literatura:
[1] Louton, T., The Gauss-Markov Theorem for Nonlinear Models, Dec. 1982,
[2] Kariya, T., A Nonlinear Version of the Gauss-Markov Theorem, Jun. 1985,
[3] Kariya, T., A Maximal Extension of the Gauss–Markov Theorem and Its Nonlinear Version, 2002,
[4] Wu, C-F, Asymptotic Theory of Nonlinear Least Squares Estimation, May 1981,
[5] Marquardt, D. W., An Algorithm for Least-Squares Estimation of Nonlinear Parameters, Jun. 1963.
[6] https://en.wikipedia.org/wiki/Geometric_Brownian_motion

niedziela, 18 grudnia 2016

Wolność mediów jest zła

Janusz Korwin-Mikke napisał na swoim blogu kilka lat temu w 2011 roku [1]:
"Jestem libertarianinem nie tylko w dziedzinie gospodarczej. Idę znacznie dalej: uważam, że człowiek powinien mieć prawo DZIAŁAĆ jak chce – byle nie szkodził innym – bo tylko on może ocenić, co jest dla niego dobre. Natomiast wcale nie uważam, że człowiek powinien mieć prawo GADAĆ, co chce… W każdym razie nie w mass mediach. Bo tam najczęściej szkodzi! Dlaczego?"

Ogólnie zgadzam się z tym stwierdzeniem, ale mam 4 zastrzeżenia, o których powiem.

Po pierwsze Korwin Mikke błędnie oddziela sferę idei od sfery gospodarczej. Mikke wprawdzie argumentuje ten podział, stwierdzając, że "nie istnieją „banki idej”, skąd za opłatą pobierałoby się ideę i sprzedawało ją komuś… Wtedy istotnie lepsza wypierałaby gorszą.". W rzeczywistości informacja to też jest dobro, które się kupuje i sprzedaje. Np. S. Hawking w książce "Krótka historia czasu" napisał we wprowadzeniu, że na początku ostrzegano go, że z każdym kolejnym wzorem zamieszczonym w swojej książce liczba sprzedanych egzemplarzy spadnie o połowę. A skoro popularyzacja nauki musi polegać na uproszczeniach i mieć formę przystępną dla laika, to znaczy, że dzieje się coś wręcz przeciwnego niż mówi Mikke: "lepsze", tj. dokładne przekazanie idei jest wypierane przez to "gorsze". Użyłem cudzysłowu, bo w przypadku światowej sławy profesora napisanie książki popularno-naukowej zawsze będzie miało wysoką wartość i jakość. Ale dlaczego tak się dzieje? To proste: mało jest osób, które byłyby w stanie zrozumieć (nie mówiąc już o chęci) wywód naukowy, a więc i popyt byłby niski, co obniżałoby cenę. To jest po drugie.

A teraz zauważmy, że w codziennym życiu występuje analogia: prasa przekazuje ludziom wiadomości w taki sposób, aby JAK NAJWIĘCEJ ludzi je przeczytało, obejrzało lub wysłuchało. Aby tak się stało, informacje muszą mieć prosty i jasny przekaz, a tytuł musi być donośny lub kontrowersyjny. Dziennikarze, którzy piszą, np. o nowych odkryciach naukowych, zapewne często głowią się jak zebrany materiał tak uprościć, aby z jednej strony przekazać nić przewodnią, z drugiej aby nie wdawać się w szczegóły. Ale - jeśli czegoś nie wystarczająco dobrze zrozumieją - to łatwo popełnią błąd merytoryczny.

Dziennikarz, który jest przecież pośrednikiem pomiędzy przedsiębiorcą (wydawcą) a konsumentem informacji, nie musi mieć wykształcenia w danej dziedzinie nauki, jednakże musi mieć umiejętność odpowiedniego ubrania trudnych rzeczy w przystępne dla przeciętnego odbiorcy słowa.

Jeżeli dziennikarz wykonuje swoją profesję sumiennie i stara się być obiektywny, to popełniane błędy, jeśli zostaną skorygowane, zostaną wybaczone. Gorzej jeśli dziennikarz ma pewien określony pogląd, który jest przez naukowców podważany lub poddawany w wątpliwość. Oczywiście nie jest niczym złym, jeśli dziennikarz ma poglądy lewicowe lub prawicowe i przemyci do swojego artykułu swoje wątpliwości co do jakiejś reformy czy ustawy - pod warunkiem, że zachowuje obiektywizm w przedstawianiu faktów. Ale w którymś momencie jego poglądy, mogą wychodzić coraz bardziej na powierzchnię, aż w końcu całkowicie przyjąć tylko punkt widzenia jednej strony i dezawuować punkt widzenia drugiej strony, np. przedstawiać tylko argumenty jednych, a pomijać fakty na korzyść drugich.

W ten sposób zaczyna rodzić się propaganda. Takie media, czyli mediatorzy, czyli pośrednicy, są oszustami. Ludzie płacą za gazetę albo obejrzą reklamę, aby mieć dostęp do informacji. Od tego momentu zaczyna się problem. Bo ludzie mogą "kupować" informacje z dwóch pobudek:
A) mogą chcieć dowiedzieć się nowych rzeczy, z czystej ciekawości albo z jakiejś innej potrzeby (np. jakiejś porady). Liczą na to, że przeczytają prawdę.

B) mogą kupować informacje tylko po to, aby móc coś lub kogoś skrytykować. Krytyka ta może przyjąć różne formy: wewnętrznego lub zewnętrznego "hejtingu" albo trollowania na forach. Ta krytyka często przyjmuje formę tzw. "mowy nienawiści". W tym przypadku nie liczy się prawda, właściwie treść nie ma znaczenia, bo i tak jest wykorzystywana jako pretekst do zaatakowania danego podmiotu. A jeżeli autor artykułu czy przemówienia nie spełni ich oczekiwań, to atakują samego autora. Jeżeli natomiast autor przedstawi zamiast prawdziwego obrazu sytuacji jedynie jego własną interpretację, to taki autor będzie chwalony.

Zauważmy do czego to prowadzi. Ludzie z (B) czytają albo słuchają tylko takich portali, które zaspokajają żądze "dokopania" komuś oraz takich, których należy dla zasady skrytykować. A skoro jest na nie popyt, to będzie rodziła się podaż i w ten sposób wyłania podział na dwa antagonistyczne rodzaje mediów.

Gdyby istnieli tylko ludzie z (B), nie byłoby żadnego problemu. Ale kłopot polega na tym, że ludzie (A) są pokrzywdzoną stroną w tym konflikcie. A przecież zgodziłem się ze stwierdzeniem Korwina Mikke, że ludzie mogą robić co chcą, dopóki nie szkodzą innym. Wprawdzie nikt nie każe czytać (A) kłamliwych bądź przeinaczonych wypowiedzi, ale chodzi o to, że treść jest wystawiona na pokaz, która może dotrzeć do mniej świadomej osoby czy to w internecie przez przypadek, czy w innym medium, za które jeszcze zapłaciła.
Stąd płynie logiczny wniosek, że pełna wolność mediów jest zła. 

Dlatego jedną z roli państwa powinno być dbanie o jakość informacji przekazywanych przez media dokładnie na tej samej zasadzie jak kontrolowana jest żywność w sklepach. Oczywiście tylko przez naukowców. Kontrola powinna odbywać się w specjalnych warunkach, do których politycy ogólnie nie powinni mieć wstępu. Jeżeli byłyby to informacje ekonomiczne, to kontrolą powinni zajmować się tylko ekonomiści.

Nie byłby to świat, w którym każda napisana notatka na Twitterze byłaby analizowana przez sztab naukowców. Są tutaj dwie drogi.
1) wybieranie do badań statystycznych próbek
2) działanie podobne jak w wikipedii (połączenie weryfikowania źródeł przez niekoniecznie specjalistów w danej dziedzinie oraz przez sztuczną inteligencję, zob. np. tutaj)

Nie będę wdawał się w szczegóły co zrobić, kiedy już taka instytucja odkryje fałszywe informacje na jakiejś stronie. Jasne jest, że jeśli będą podawane przez oficjalny podmiot (np. dziennikarzy), to kary powinny być surowsze. Np. najpierw polecenie usunięcia, a potem jeśli podobne zdarzenie się powtórzy, jakieś kary finansowe. W przypadku użytkowników anonimowych również powinny być wysyłane ostrzeżenia, a po pewnym czasie - jeśli nie byłoby poprawy - sprawa powinna trafić do prokuratury itd.

Pytanie co zrobić w sytuacji, gdy ktoś napisze ostrą satyrę na temat rządu. Wiadomo, że to jest fikcja literacka, nawet jeśli zawiera wydarzenia i postaci prawdziwe. I tu pojawia się trzecie moje zastrzeżenie w cytacie Korwina Mikke. Stwierdził on, że publiczne słowa nie powinny szkodzić innym. Otóż ostra satyra, parodia czy groteska szkodzi rządowi. Ale jest społecznie pożyteczna. Dlatego zdanie to powinno zostać doprecyzowane i na przykład słowo "innym" zastąpić "społeczeństwu". Co natomiast w przypadku jakiegoś antyrządowego bloga? Ogólna zasada powinna być taka, że dopóki autor wyraża tylko swój pogląd, którego nie można zweryfikować, bo nie dotyczy sfery nauki, to może pisać bloga. Jeżeli jednak zaczyna mieszać politykę z ekonomią i np. głosi, że program 500+ przyniesie co roku 1 pkt proc. wzrostu PKB, to należy bezwzględnie kazać mu usunąć takie herezje.

Czwarte moje zastrzeżenie dotyczy już wniosków całego tekstu. Otóż Korwin Mikke wydaje się bronić ustawy medialnej Orbana na Węgrzech, którą z kolei krytykuje inny publicysta J. Woziński. Cytując Wozińskiego, zgodnie z tą  ustawą "35% muzyki granej w radiach ma stanowić muzyka węgierska, połowa programów telewizyjnych musi być produkcji europejskiej, a jedna trzecia z nich – węgierskiej" [2]. Nie trudno zrozumieć Mikkego, że woli, aby społeczeństwo było wychowywane w duchu kultury wyższej, zamiast chłamu amerykańskiego. Problem polega na tym, że w ten sposób zabiera się wybór konsumentom. Przecież gdyby nie chcieli słuchać i oglądać tego chłamu, toby nie oglądali, a wtedy media musiałyby zmienić repertuar. Ale oglądają, bo przecież "większość jest głupich niż mądrych", cytując JKM. Zatem gdyby media zostały zmuszone do puszczania codziennie filmów Felliniego czy Antonioniego zamiast "Rambo", to ludzie przestaliby oglądać telewizję i zysk prywatnych stacji spadły, a może nawet zamieniłby się w stratę. PKB spadłoby. Do takiego efektu doprowadziłby centralny plan wyższej kultury Mikkego. Przecież komunizm i socjalizm zbankrutował dlatego, że właśnie ograniczał wybór jednostki.

Zupełnie inny charakter mają media publiczne. To właśnie ich rolą powinno być krzewienie wyższej kultury, a także stawianie na jakość podawanej informacji, stanowiąc przeciwwagę dla mediów komercyjnych. Dlatego takie ustawy powinny być ustawami tylko mediów publicznych.

Na koniec, już tylko dla refleksji, ponieważ ostatnie dni - piątek, sobota 16-17.12.2016 - obfitowały w najbardziej emocjonujące wydarzenia w polskiej polityce od wielu lat (zakończone zamieszkami protesty pod sejmem spowodowane dążeniem przez PIS do ograniczenia swobody obserwowania sejmu przez dziennikarzy), przytoczę inny fragment cytowanego powyżej artykułu Wozińskiego z 5 stycznia 2011 r. [2]:
"Posunięć węgierskich konserwatywnych purytanów nie można niestety uznać za przypadek odosobniony. O podobnych zarządzeniach marzą w wielu innych krajach rozmaite typy Kaczyńskich i Orbánów, którym jednak nie poszczęściło się nigdy na tyle, aby wygrać wybory z wynikiem 53% głosów. Gdyby w Polsce malowana prawica spod znaku PiS uzyskała kiedykolwiek podobny wynik, mielibyśmy zapewne do czynienia (z zapowiadaną przecież wielokrotnie) falą idiotycznych ustaw w rodzaju Nowego Medialnego Ładu, nacjonalizacją przedsiębiorstw o „strategicznym znaczeniu dla narodu”, zakazami określonych manifestacji, likwidacją sex shopów itd., itp."


Źródło:
[1] Korwin-Mikke: Zasada ograniczania wolności mediów nie jest zła!, http://nczas.com/wiadomosci/polska/korwin-mikke-zasada-ograniczania-wolnosci-mediow-nie-jest-zla/
[2] Prawdziwe arcydzieło pobożnego i purytańskiego socjalizmu ma Węgrzech, http://nczas.com/wiadomosci/europa/absurdalne-purytansko-nacjonalistyczne-zmiany-w-wegierskiej-telewizji/