niedziela, 23 lutego 2025

Cicha zmowa maszyn

W teorii wartości towarów, którą ostatnio przedstawiłem, założyłem, że istnieją dwie grupy trejderów: "uczciwi" i "nieuczciwi". Nieuczciwi zmawiają się ze sobą, kupując i sprzedając od siebie nawzajem, wykorzystując uczciwych - nieświadomych tego procederu. Krytycy tej teorii mogą jednak przekonywać, że takie praktyki są nielegalne i podlegają sankcjom (np. grzywny, więzienie - zob. więcej), a więc jeśli nawet są stosowane, to w sposób ostrożny i dyskretny.

Zmowa cenowa może być jednak niekooperacyjna, a nawet nieświadoma - a przez to legalna. Dokładniej rzecz biorąc, może być:

1) kooperacyjna i świadoma,

2) niekooperacyjna i świadoma,

3) niekooperacyjna i nieświadoma.

Najbardziej oczywisty jest przypadek nr (1), którego przykładem są ci nieuczciwi trejderzy. Ale przypadek nr (2) jest także dobrze znany w teorii gier. Dotyczy to gier powtarzanych, z wieloma rundami. Każda runda to kolejny odcinek czasu i gracze muszą brać pod uwagę różne scenariusze w przyszłości, tak aby zmaksymalizować zdyskontowaną wartość bieżącą dochodu. Klasycznym przykładem są oligopole, które formalnie nie muszą wchodzić w koalicję, ale obserwując rynek stawiają diagnozy i snują przypuszczenia. Jeśli firma A wie, że takich jak ona jest mało, to znaczy, że każda ma wpływ na cenę rynkową, a więc i ona sama. Jeśli A zauważy zmiany w cenie, to musi jakoś zareagować. Jeśli firma B obniży cenę, a zewnętrznych przyczyn nie widać, to znaczy, że chce przyciągnąć większy popyt  i więcej zarobić (zwiększa swój udział w rynku). Wtedy firma A też obniży cenę, aby dopasować się do nowych warunków i w ten sposób udział sprzedaży wraca do punktu wyjścia. Chociaż popyt wzrośnie dzięki niższej cenie, a firmy będą mogły zrekompensować częściowo "stratę" przez większą sprzedaż (produkcję), to nie na tyle, aby zysk został zachowany. Wojna cenowa obniży zysk wszystkich, ponieważ przybliża ich do konkurencji doskonałej. Stąd oligopolom powinno zależeć na utrzymaniu wzajemnej równowagi i niezmienianiu warunków, tak aby maksymalizować zysk. To jest koalicja niekooperacyjna (cicha zmowa).

 Przypadek (3) należy do nowej kategorii w teorii gier, w której to maszyny podejmują decyzje na podstawie rozpoznanych wzorców. Jeżeli wielu trejderów wysługuje się sztuczną inteligencją do podjęcia decyzji, to wydawałoby się, że po prostu będą tak samo ze sobą konkurować jak ludzie. Ale maszyny, AI, nie rozumują jak ludzie - uczą się na ślepo wzorców i jeśli dostrzegają, że ich ruch przyniósł parę razy zysk, to traktują to jak wzorzec do powtarzania. Jeśli więc wytrenowane AI zauważą - oczywiście każda z osobna, niezależnie od siebie - że strategia udająca zmowę (taką jak opisałem w poprzednim artykule) przynosi korzyści, to będą ją podtrzymywać. Mechanizm ten został opisany m.in. w [1], [2]. Autorzy [1] stwierdzają, że cicha zmowa AI może powstać w dwóch przeciwnych okolicznościach: zarówno gdy jest mała płynność rynku, jak i gdy jest duża liczba noise-traderów, tj. występuje ryzyko szumu handlowego. W obu przypadkach cena może łatwo wypaść z równowagi i aktywo będzie nieefektywnie wyceniane. A zatem niezależnie od płynności, algorytmy AI zamiast konkurować ze sobą, mogą się wzajemnie nakręcać. Z punktu widzenia mojego modelu będziemy mieć przypadek dużej płynności, w której grupa "uczciwych" to noise-traderzy, a grupa "nieuczciwych" to maszyny. Maszyny więc na początku kupują dużą ilość towaru pod wpływem informacji, sprzedają sobie nawzajem po coraz wyższej cenie, ale żeby ilość pieniędzy pozostała stała, zmniejszają kupowaną ilość towaru. Wtedy do gry wchodzą noise-traderzy, którzy wykupują pozostałą część. Stopniowo maszyny pozbywają się towaru i zarabiają ponadprzeciętnie, czyli bez dodatkowego ryzyka, a noise-traderzy będą już między sobą normalnie konkurować. Można przypuszczać, że cena spadnie, aby cena zrównała się z wartością fundamentalną. Odwrotna sytuacja zajdzie w przypadku informacji negatywnej dla ceny. W ten sposób można racjonalnie wyjaśnić krótkoterminowy trend rosnący (bańkę) i spadkowy (krach). 


Literatura:

[1]  Dou, W. W., I. Goldstein, and Y. Ji (2023). “AI-Powered Trading, Algorithmic Collusion, and Price Efficiency”. SSRN 4452704;

[2] Klein, T. (2021). Autonomous algorithmic collusion: Q-learning under sequential pricing. The RAND Journal of Economics 52(3), 538–558.

czwartek, 6 lutego 2025

Moja teoria wartości towarów

Wymyśliłem teorię wartości towaru. Poprzednio zaproponowałem wzór na wycenę towarów, ale wychodził on z założenia ad hoc, że wymagana stopa zwrotu dla towaru równa jest 1 / (1 + zmiana podaży) - 1. Stąd dostałem:

(1)

gdzie P - cena towaru, P0 - początkowa cena towaru, Q - podaż towaru, Q0 - początkowa podaż towaru.

Taki sam wzór dostaniemy, jeśli wykorzystamy równanie wymiany:

(2)

gdzie: M - podaż pieniądza, V - szybkość obiegu pieniądza.

Równanie wymiany jest tożsamością, które wyprowadziłem i omawiałem tutaj.

W równaniu wymiany dobro jest wymieniane na pieniądz. W przypadku wyceny towaru jest tak samo, tylko dotyczy to jednego towaru. Czyli M oznacza tu masę pieniądza przeznaczoną na kupienie tylko jednego dobra. 

Teraz przyjmę założenie, że M będzie stałe. Ponieważ rozpatrujemy tylko część całkowitej podaży pieniądza w gospodarce, to założenie może nie być prawdziwe nawet w krótkim okresie. Na przykład, jeśli zainteresowanie danym towarem wzrasta, podaż pieniądza wzrośnie. Jednak w tym modelu zakładamy, że rynek tworzą dwie grupy spekulantów: pierwsza nieuczciwa oraz druga uczciwa. W pierwszej trejderzy zmawiają się ze sobą, aby kupować i sprzedawać sobie nawzajem, po to aby wywindować cenę. Druga grupa przygotowuje w tym czasie zlecenia kupna/sprzedaży. Podaż pieniądza pozostanie stała, ponieważ trejderzy z pierwszej grupy będą kupować i sprzedawać od siebie coraz mniejszą ilość towaru, ale za to coraz większą ilość grupie drugiej. Całkowita ilość pieniądza pozostanie stała: grupa druga odda swoje pieniądze pierwszej grupie. 

Doszedłem do wniosku, że skoro M jest stałe i mamy tylko jeden towar, to znaczy, że M = P0*Q0. W okresie 0 za M jest kupowany towar w ilości Q0 po cenie P0. Stąd równanie wymiany przyjmuje postać:

P0*Q0*V = P*Q

Powiedzmy teraz, że przychodzi informacja, że Q wkrótce spadnie (np. z powodu złych warunków pogodowych). Powoduje to wzrost ceny z P0 do P. Ponieważ jednak M jest stałe, to Q musi spaść. Czyli Q spada z Q0 do Q. Wynika z tego, że M = P0*Q0 = P*Q. Ale to znaczy, że V = 1:

M = P0*Q0 = P*Q

P0*Q0*V = P*Q

V = 1.

Ma to sens, ponieważ V - jako szybkość obiegu pieniądza - stanowi jednocześnie liczbę transakcji sprzedaży danego towaru w krótkim czasie. Oczywiście transakcji będzie więcej niż jedna, ale Q będzie podzielone na wiele transakcji, a dodatkowo P stanowi średnią z tych transakcji. Inwestorzy mając M pieniędzy, kupują więc Q towarów po średniej cenie P. Na samym początku wszystko odbywa się uczciwie: spekulanci z grupy 1 wykupują z rynku cały towar (podbijając cenę), a sprzedający wycofują się z handlu.  

W ten sposób dostajemy to samo co równanie (1) na początku:

P = P0*Q0 / Q

Jeżeli towar jest dobrze wyceniony, to działa ta formuła. Zmienia się P, bo zmienia się Q.

Powiedzmy jednak, że w krótkim okresie spekulanci z grupy 1 po pierwszym wykupie, zmawiają się ze sobą, sprzedając i odkupując sobie nawzajem towar po coraz wyższej cenie pod pretekstem spadkowej podaży. Oznacza to, że V > 1 i wtedy wzór przyjmuje postać:

P = P0*Q0*V / Q

lub inaczej:

(3)

W pewnym momencie wchodzi druga grupa spekulantów, która chce od tamtych wykupić. Pierwsza grupa może stopniowo opuszczać rynek z zyskiem, a druga już walczy sama ze sobą, wprowadzając losowość do rynku.

W drugą stronę, jeśli spekulanci z grupy 1 zdecydują się na kupowanie i sprzedawanie od siebie za pomocą krótkiej sprzedaży czy kontraktów terminowych na sprzedaż, wtedy cena nabiera rozpędu w kierunku południowym. Pretekstem może być tym razem wzrost podaży. Trejderzy z grupy 1 na początku mają duże pozycje sprzedażowe, ale zmniejszają się one z czasem (są zamykane), a grupa 2 przejmuje je. 

Ponieważ spekulacja niejako ma na celu wyjść poza wartość fundamentalną, to znaczy, że teraz zmienia się tylko P, a Q pozostaje stałe. Jeżeli po zmianie fundamentalnej Q = Q1, to mamy:

 V = P*Q1 / M = P*Q1 / (P0*Q0).

Wiemy też z wcześniejszej analizy, że M jest stałe, więc po zmianie fundamentalnej z P0 na P1 i z Q0 na Q1, musi zajść równość M = P0*Q0 = P1*Q1. I wtedy:

 P*Q1 / (P0*Q0) =  P*Q1 / (P1*Q1) = P / P1.

Jeżeli P = P1, to V = 1. Wtedy towar jest dobrze wyceniony. 

Jeżeli P > P1, to V > 1. Wtedy mamy do czynienia z przewartościowaniem towaru.

Jeżeli P < P1, to V < 1. Wtedy mamy do czynienia z niedowartościowaniem towaru.

Czyli V może służyć do oceny przewartościowania / niedowartościowania.


Może się początkowo mylić P, P1 i P0, więc uporządkujmy te wielkości:

- P0 to cena początkowa towaru, którą sami ustalamy na podstawie historii. Zawsze ma przypisaną podaż Q0.  Moment 0 jest dowolny z przeszłości.

- P1 to wartość fundamentalna towaru, który wyceniamy po zmianie podaży, a właściwie po informacji, że zmieni się niedługo podaż z Q0 na Q1.

- P to cena towaru w ogólnym sensie, tzn. wzór (3). Jeżeli V równa się 1, to dostajemy wartość fundamentalną, w przeciwnym wypadku wartość spekulacyjną. 


Przykład. Wycena kawy arabica

Poprzednio wyceniłem arabikę średnio na 320-333 albo w zakresie 307-348. Jednakże obecna cena to już ponad 400. Podstawmy te same dane (P0 = 250, Q1 / Q0 = 0.75):

P1 = 250 / 0,75 = 333

Przy obecnej cenie 400:

400 = V*250 / 0,75 => V = 1,2.

Zgodnie z modelem obecna cena arabiki jest przewartościowana o 20%.


P. S. W sumie taka analiza pozwala odróżnić inwestycję od spekulacji. Trzeba tu jednak zaznaczyć, że nie znaczy to, że inwestycja jest pozbawiona ryzyka. Po pierwsze nie wiadomo po jakim czasie towar wróci do równowagi. Po drugie mogą pojawić się w tym czasie informacje zaburzające poprzednią wycenę.