Investicia do zlata.

Podílové fondy, akcie, komoditní trhy, spekulace, aukce. Kam a jak nejlépe investovat volné finanční prosředky

Moderátor: Moderátoři FinExpert.cz

Odeslat příspěvekod jednadva 14. 9. 2020 11:22

mlsal:
Update: Ve věci I(2) procesů žel zatím žádný markantní posun. Pokud testujeme na logaritmech, tak předpokládáme, že procesy generující netransformovaná data jsou multiplikativní. Diferenční stacionarita se uvažuje u lineárních procesů. To by mohlo vysvětlovat, proč se diferencováním netransformovaných dat jeví řady jako I(2). Netransformovaná data by byla generována procesem:

Y=exp(a)*exp(b0*t)*X^b1

Pokud vezmeš logaritmus, tak dostaneš:

y=a+b0*t+b1*x

Což je naše regresní rovnice na logaritmech do EG testu pro odhad kointegračního vektoru. Časový trend b0*t není v tomto podstatný - ten tam být nemusí - ale podstatná je ta změna charakteru procesu z exponenciálního na lineární, u kterého lze teprve uvažovat diferenční stacionaritu. Budeme dále zkoumat. :)

Johansenův test by dle jednoho zdroje (Gonzalo + Lee: "Pitfalls in testing for long run relationships" z r. 1998) údajně mohl mít skutečně problémy při špatném nastavení nebo při specifickém charakteru vstupních dat. Je zkrátka citlivý na "nastavení" vzhledem k vstupním řadám. Pokud byly určité nepříznivé podmínky, tak v simulacích rostla s velikostí souboru chyba I. druhu (asymptoticky snad k 1). Pro mě poměrně překvapivé zjištění, protože J test se obecně považuje za robustnější než EG test. Je tedy otázka, jestli spíš došlo k chybě II. druhu na EG testu (falešná negativita), nebo k chybě I. druhu na J testu (falešná pozitivita). Je taky možné, že se udělala chyba i ve výběru kritických hodnot do EG testu (špatná volba tau_nc nebo tau_c nebo tau_ct nebo tau_ctt). Sice by nejspíš neměnila celkový výsledek EG testu, ale možná by se tím snížila pravděpodobnost, že se udělala chyba II. druhu na EG testu.

Viděl jsem ještě varianty EG testu, kdy provedli odhad vektoru (lineární regresi v 1. kroku) v obou směrech (zlato-peníze, peníze-zlato) a teprve poté pracovali s rezidui. Zatím jsem neprovedl, ale mám to v plánu. Stejně tak ECM (korekční model). Pokud se totiž v rámci EG metody sestaví ještě ECM (jako model krátkodobé chyby, který není nutná podmínka prokázání kointegrace), může prý docházet k rozporům s výsledkem testu na reziduích, kde se prokazuje existence kointegračního vztahu. Rozpor pak ukazuje na problém s modelem nebo řadami. Postupně provedu. Zkoušel jsem ještě ADL verzi (autoregressive distributed lag) pro odhad vektoru v EG testu, ale nedokázal jsem ADL provést, výsledek tedy zatím žádný.

EG ADL.png

Celý dokument si můžeš stáhnout na adrese: https://warwick.ac.uk/fac/soc/economics ... ointeg.pdf
jednadva
Diskutér

Odeslat příspěvekod jednadva 16. 9. 2020 08:20

jednadva píše:Y=exp(a)*exp(b0*t)*X^b1

Toto samozřejmě není proces generující data. :) To je jen lineární regrese na logaritmech přepsaná do původních hodnot (po exponenciaci). :) Neříká nic o tom, jak jsou generovány řady X nebo Y, ale jenom popisuje jejich vzájemný vztah.
jednadva
Diskutér

Odeslat příspěvekod mlsal 16. 9. 2020 12:49

jednadva píše:Diferenční stacionarita se uvažuje u lineárních procesů. To by mohlo vysvětlovat, proč se diferencováním netransformovaných dat jeví řady jako I(2).

Asi nic objevného, ale všechno to jsou lineární modely. Finanční časové řady jsou často exponenciální a musí se v prvním kroku linearizovat log. transformací. Až pak se můžou diferencovat např. pro určení řádu integrace.
mlsal
Diskutér

Odeslat příspěvekod jednadva 16. 9. 2020 13:52

Nejspíš budeš mít pravdu. Já jsem obecně nikdy dobrou odpověď na to, proč se řady logaritmují, nedostal. Dělám to "automaticky", protože to je v určitých případech obvyklý postup (typicky v řadách týkajících se peněz). Z histogramu nebo "jádrově vyhlazené" hustoty je vidět, že zrovna ty dvě zkoumané řady MZMSL + zlato se logaritmováním o něco přibližují normálnímu rozdělení. Díky tomu je obecně možné provést OLS regresi. Ale přijde mi to jako účelové vysvětlení a nejsem s ním moc spokojený. Je pravda, že exponenciální proces je vlastně explozivní. Budu zkoumat. Podle mě máš pravdu. Začíná to do sebe zapadat.

Zatím si nejsem jist, co všecko se těm řadám při té transformaci stalo a jestli se tím něco nepokazilo. Je dobře, že ti ten J test vyšel jinak, aspoň musím problém (nejen) transformace řešit. :) Naopak výnosy dluhopisů by se prý logaritmovat neměly. Možná proto, že "nemají důvod" být explozivní. Když jsem zkusil J test na nelogaritmované řadě DGS10, tak to dávalo jiné hodnoty testových statistik než v logaritmech. Ale DGS10 v tuto chvíli neřeším, to až časem - potřebuji se spíše vlastními silami dopátrat nějakého vysvětlení, proč EG a J testy dopadly odlišně a co vlastně provedla ta konstanta v J testu. Je to pro mě důležité i do budoucna.

EG test by měl být méně robustní než J na malých souborech. Jak velkých, to budu postupně zkoumat, aby se vyloučilo, že byl soubor malý. EG test má určité zajímavé vlastnosti, které se dají využít naopak na větších souborech, kde je někdy paradoxně robustnější než J test - což jsem vůbec nevěděl. Například v situaci, kdy jedna ze vstupních řad má kořen blízko 1 (resp. je o málo větší než 1, tj. kdy je proces explozivní), tak už při řadě o 100 pozorováních se J testu daří výrazně hůř než EG testu a pravděpodobnost chyby I. druhu je až 96 % (pro kořen = 1,05). Viz Gonzalo + Lee, str. 135 nahoře.

Transformace vůbec dělají s těmito dvěma řadami docela paseku. Zkusil jsem si dnes ráno dvě další běžně uváděné transformace: druhou odmocninu a reciprokou hodnotu. V druhém případě se dost výrazně změnilo vyznění ADF testu. V tom prvním trochu taky. Je otázka, jestli tyto transformace jsou v tomto případě validní. Jako obvykle přidám vágní formulku: budu zkoumat. :)
jednadva
Diskutér

Odeslat příspěvekod mlsal 16. 9. 2020 14:34

Tak daleko ještě nejsem a nevím, jestli to má nějaký význam, proto budu jen citovat:

"U modelu s deterministickým trendem (Yt = β1 + β2*t + et ) pro dosažení stacionarity stačí pomocí regrese eliminovat trend. Diferencování by se zde pro stacionarizaci nemělo používat, neboť vede k modelům s reziduální složkou ve tvaru neinvertibilního MA procesu - ∆Yt = β + et - e(t-1)". (Cipra 2008,str.353)

Přeloženo do lidštiny: když budu původní data (MZMSL) diferencovat, dostanu nějakou prasárnu.
Naposledy upravil mlsal dne 16. 9. 2020 17:07, celkově upraveno 1
mlsal
Diskutér

Odeslat příspěvekod jednadva 16. 9. 2020 15:25

:) To je zajímavé. Tenhle proces by se asi označil za I(0), takže pokud by se člověk striktně držel regulí, tak by kointegrace nemohla z definice nastat. Ale ten neinvertibilní MA proces mě zaujal. :)

Jak by se ten proces diferencoval? Zkusil jsem si to napsat, ale zarazil jsem se v druhém kroku. Jaký tvar má Y(t-1)? To ß1 by byla konstanta?

Je pravda, že o trendech se jako o potenciálním problému mluví. Zatím jsem to jako potenciální problém nevyloučil. Pak je tady ještě problém malého souboru, ale 600 pozorování už by nemuselo být tak málo. Na druhou stranu J test má už na 100 pozorováních velký problém s kořenem jen o málo nad 1 (což se obtížně zjišťuje běžnými testy jednotkového kořene). Gonzalo+Lee doporučují dobře analyzovat vstupní řady, takže podle mého názoru možná zkoumat charakter těch vstupních řad a postupně z toho něco vyjde - přijde se tak časem možná na to, proč se testy liší. Ještě bych upozornil na možnost procesů typu STUR (ST jako stochastický; viz Gonzalo+Lee), kde koeficient má stochastický charakter a kolísá kolem 1 (někdy je proces stacionární, někdy explozivní - jako příklad uvádí počet připojení k internetu, tj. v době psaní článku pár let před 2000, kdy přišla dotcom bubble).
jednadva
Diskutér

Odeslat příspěvekod mlsal 16. 9. 2020 17:06

jednadva píše:Jaký tvar má Y(t-1)? To ß1 by byla konstanta?

Já bych to viděl takhle:

Y(t) = ß1 + ß2*t + e(t)
Y(t-1) = ß1 + ß2*(t-1) + e(t-1)

ß1 se vyruší
ß2 se vytkne ... ß2*(t-t+1) = ß2

∆Yt = β2 + e(t) - e(t-1)
mlsal
Diskutér

Odeslat příspěvekod jednadva 17. 9. 2020 14:19

Jo, ok, zmátlo mě to ß místo ß2. Ale i při znalosti tohoto rozdílu jsem to kupodivu domotal. :) Nakonec mi to "samozřejmě" vyšlo. :) Máš to podle mě odvozené dobře. Jak to souvisí s kointegrací, to zatím nevím. Nejde z toho udělat AR proces s nekonečně mnoha zpožděními.

A podle mě jsem domotal i to, že trendový proces musí být I(0). To je nesmysl. Ten trend může mít např. tu podobu, jakou jsi uvedl, tj. konstanta + časový trend. Ale k tomu může být přilepená třeba náhodná procházka bez driftu (uvádí se taky jako "vychýlená náhodná procházka" apod.). Takže proces by byl I(1) (béčka jsou bety):

Y(t)=b1+b2*t+e(t), kde

e(t)=e(t-1)+w(t),

kde w je bílý šum.

Někde zpátky v diskusi jsem taky uvedl poznámku o tzv. stochastickém trendu, jako by to byl identický pojem s driftem, ale to jsou dva odlišné pojmy. Náhodná procházka má stochastický trend bez ohledu na to, jestli je v ní driftový člen. Tolik uvedení na pravou míru. Nyní zpět k vážné práci.
jednadva
Diskutér

Předchozí stránka

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 0 návštevníků