Investicia do zlata.

Podílové fondy, akcie, komoditní trhy, spekulace, aukce. Kam a jak nejlépe investovat volné finanční prosředky

Moderátor: Moderátoři FinExpert.cz

Odeslat příspěvekod jednadva 2. 9. 2020 18:45

Pokud budeš mít v testovaných řadách lineární trendy, tak bys měl použít VAR/VECM bez konstanty. Takže ten můj původní model. Aspoň to tak píšou v článku z r. 1990 od Johansena/Juseliové (Maximum Likelihood Estimation and Inference on Cointegration - with Applications to the Demand for Money). Na páté straně mají rozhodovací schéma a vypadá to spíš tak, že když máš v řadách lineární trendy, tak použiješ verzi bez konstanty. (Ale netvrdím, že jsem to takhle pěkně věděl hned zkraje. Měl jsem možná šťastnou ruku.) :) Je tedy otázka, co myslí těmi lineárními trendy. Budeme zkoumat. :)
jednadva
Diskutér

Odeslat příspěvekod jednadva 3. 9. 2020 09:08

jednadva píše:Pokud budeš mít v testovaných řadách lineární trendy, tak bys měl použít VAR/VECM bez konstanty.

Prdlajs. :) Všude píšou konstanta, nebo konstanta+trend. To jsem asi v tom Johansenovi/Juseliové něco nepochytil zcela úplně správně. Jenomže pokud dám trend, tak nenajdu žádný kointegrační vektor. Tak se v tom pak vyznejte. :)
jednadva
Diskutér

Odeslat příspěvekod jednadva 3. 9. 2020 12:02

Podobně jako v případě přidání konstanty do kointegračního testu MZMSL se chová Johansenův test také na generickém dluhopisu (DGS10): je hraniční na hladině 10 %, v některých případech na této hladině zamítá r=0 (tj. existuje jeden kointegrační vektor na hladině 10 %). Ale ADF test hlásí stacionaritu jedné logaritmované řady, konkrétně DGS10 (dle AIC na 5 %, dle BIC na 10 %, v obou případech bez konstanty a bez trendu).
jednadva
Diskutér

Odeslat příspěvekod vpe 3. 9. 2020 12:45

Zlato když leží, generuje náklady. Nic nevydělává.

Za mě to není investice, ale spoření, případně spekulace.
proletáři všech zemí…
vpe
Diskutér
Uživatelský avatar

Odeslat příspěvekod jednadva 3. 9. 2020 12:48

mlsal:
mlsal píše:____________________________________________________
Dotaz:
použiju VAR model pro určení vhodného kritéria a zpoždění:

VAR systém, maximální řád zpoždění 24

Jaký VAR máš na mysli?

mlsal píše:Quandtův test

To jsi někde našel? Dá se použít na řady, které jsou I(1) a mají nějakou složitější strukturu toho procesu reziduí z první regrese? Já viděl jen to, že se tím najde pozvolný růst rozptylu reziduí, ale nějakou složitější strukturu to nenajde.
jednadva
Diskutér

Odeslat příspěvekod saabik 3. 9. 2020 12:53

Já to chápu tak, že bez konstanty může vyjít nesprávný výsledek. Kointegrace může být i tam, kde by výsledek bez konstanty říkal, že tam není. Něco jako inflexni bod . První derivace ti napoví kde může být extrém funkce, ale teprve druhá ti řekne kde je, a kde ne, protože tam je inflexní bod.
saabik
Diskutér

Odeslat příspěvekod jednadva 3. 9. 2020 13:01

mlsal píše:Navrhuji vylepšený model ceny zlata.

mlsal: Připadá mi to spíš jako data dredging: upravuješ hypotézu do té doby, než ti test najde nějakou pozitivitu. Takové sekvenční testování má asi jinou vypovídací hodnotu, než kdybys vyjel jen jeden test. Už jsi na počátku přidal hypotézu M2, teď hypotézu stříbro apod. Je toho už maličko hodně. :) Přidržel bych se asi spíš jedné hypotézy a pořádně testoval - nesnažil bych se z dat vytáhnout "něco". Nemám nic proti odlišné specifikaci testu jako takového. To, co jsi udělal v Johansenově testu, je rozumné a možná odůvodnitelné.

V tom posledním širším testu si otestuj stacionaritu řad. Zvaž kritickou hodnotu. Je možné, že i v těchto testech hraje roli konstanta a tím se mohou měnit kritické hodnoty v neprospěch hypotézy. Atd.

Zatím tedy zlato/MZMSL: Johansen negativní (trend nebo nic - jen já), Johansen pozitivní (konstanta - ty, já potvrzuji), EG test negativní (já, ty). Podezření na deterministický trend (já), komplikovaná situace s deterministickými členy (dokladovaná v literatuře).

-- 3. 9. 2020 14:12 --

saabik píše:Já to chápu tak, že bez konstanty může vyjít nesprávný výsledek. Kointegrace může být i tam, kde by výsledek bez konstanty říkal, že tam není. Něco jako inflexni bod . První derivace ti napoví kde může být extrém funkce, ale teprve druhá ti řekne kde je, a kde ne, protože tam je inflexní bod.

saabik: Kéž by to bylo takhle "jednoduché". Viz např. "Inference in Cointegrated Models: UK M1 Revisited". Podívej se třeba dolů na str. 10 (Test Results): "There may be economic ground for preferring one specification over another". Koukni se pak do tabulky na stejné stránce. Podle mě tam jednoznačně preferují variantu s lineárním trendem (podle mě deterministickým, tj. jako beta*t), na základě ekonomického úsudku. (Můj úsudek tedy byl nula nula nic, takže samozřejmě netvrdím, že jsem v tomto směru objevil Ameriku - to bych tu pěkně kecal.) :)
jednadva
Diskutér

Odeslat příspěvekod mlsal 3. 9. 2020 17:25

jednadva píše:Přidržel bych se asi spíš jedné hypotézy a pořádně testoval

Mám stejný názor. Začínám se v tom ztrácet. Navrhuji vrátit se k původnímu modelu MZMSL - GOLDAMGBD228NLBM, měsíční data 1968.04 2020.07 a pořádně to otestovat krok za krokem.

1) MZMSL:
ADF, crit BIC, test bez konstanty, s konstantou, s trendem ... kořen nelze zamítnout. Lag 5
KPSS, lag 5, zamítám stacionaritu

2) d_MZMSL:
ADF, crit BIC, test bez konstanty, s konstantou, s trendem ... kořen nelze zamítnout. Lag 4
KPSS, lag 4, zamítám stacionaritu
MZMSL je I(2). Nestacionarita 1. dif je způsobena extrémním růstem v 2020. Mám 2 možnosti.
a) Uříznout data do 2020.01, pak podle ADF stacionární, podle KPSS (lag 2) zamítám stacionaritu ... neprůkazné.
b) logaritmovat
d_MZMSL.png
d_MZMSL


Pokračuji opět na celých datech
3) l_MZM:
ADF, crit BIC, test bez konstanty, s konstantou, s trendem ... kořen nelze zamítnout. Lag 2
KPSS, lag 2, zamítám stacionaritu
l_MZMSL.png
l_MZMSL

To je ten lineární trend, jak jsi psal výše. Porovnej s exponenciálním trendem u MZMSL.

4) d_l_MZMSL
ADF, crit BIC, test bez konstanty, s konstantou, s trendem ... kořen zamítám, Lag 1
KPSS, lag 1, stacionaritu nelze zamítnout.

Výsledek: l_MZMSL je I(1), d_l_MZMSL je I(0). Stejně i pro GOLDAMGBD228NLBM. Jsou splněny podmínky pro kointegraci.

Můžeš potvrdit výsledky, pak budu pokračovat.
mlsal
Diskutér

Odeslat příspěvekod jednadva 4. 9. 2020 02:09

mlsal píše:Začínám se v tom ztrácet.

Protože děláš moc testů na různých hypotézách. :) V podstatě jsi tím Johansenem určitý kointegrační vztah už našel. Tím by se to dalo v podstatě uzavřít. Je otázka, jak dobře je ten test specifikovaný, ale je dost dobře možné, že konstanta tam patří. Pokud by tam patřil i časový trend (tj. funkce jen času), tak je výsledek negativní. V případě nulového "interceptu" taky. Otázka deterministických členů ve VECM/VAR podle Johansena je každopádně problematická. V tuto chvíli to chápu tak, že lineární trendy v obou řadách = přidat koeficient do VECM, popř. také trend (jako fci času).

mlsal píše:MZMSL je I(2).

To je možné. To si ověřím. Jak se stalo, že z I(2) řady je I(1) řada, přestože jsi nediferencoval, ale logaritmoval?

mlsal píše:To je ten lineární trend, jak jsi psal výše. Porovnej s exponenciálním trendem u MZMSL.

Jasně, to je samozřejmé. Jde o to, jestli to je náhodná procházka s driftem, nebo trendově stacionární proces. Oba tyto procesy generují lineární trend. Ale každý trochu jinak. Trendově stacionární proces není I(1), kdežto náhodná procházka s driftem ano - což je tady podstatné.

Před Johansenovou kointegrací není potřeba testovat řady na jednotkový kořen: to se řeší v testu. Jak je to s I(2) procesy, to nevím, ten test na to nejspíš není stavěný, ale možná se to v testu nějak projeví tak, aby nedošlo k omylu. Přesně to nevím. Na I(2) procesy jsou asi jiné testy. Ale Johansen se těmito procesy taky zabýval, tak kdo ví.

KPSS test (na trend) mi trendovou stacionaritu MZMSL nepotvrdil. PP test nezamítá nestacionaritu. ADF test naopak zamítá jednotkový kořen MZMSL (na 5 %) a zamítá neexistenci driftu (5 %) a neexistenci trendu (těsně nad 5 %) při (typicky) vysokém počtu zpoždění podle AIC (v posledním testu 12 lagů). Při nižším počtu lagů (BIC) se zamítá jenom neexistence driftu, všecko ostatní je poměrně slušně nad hladinou 10 %, tj. nevýznamné. Testoval jsem i MZM, ale nakonec jsem se rozhodl to sem nedat, abychom se dívali pořád na ty samé řady. KPSS a ADF daly odlišné výsledky.

Této nejistotě v charakteru řady podle mého soudu odpovídá i výsledek Johansenova testu s konstantou (téměř potvrzen druhý kointegrační vektor), resp. rozdílnost výsledků EG testu a J testu. Je potřeba to tedy brát maličko s rezervou. Ale zcela striktně řečeno jsi tam kointegrační vztah našel.

Ještě jsem neodpověděl na volbu lagů podle informačních kritérií: doporučuje se např. testovat podle všech kritérií a potom uvést všechny výsledky pro srovnání.
Naposledy upravil jednadva dne 4. 9. 2020 12:28, celkově upraveno 1
jednadva
Diskutér

Odeslat příspěvekod mlsal 4. 9. 2020 17:32

jednadva,

jednadva píše:Je otázka, jak dobře je ten test specifikovaný, ale je dost dobře možné, že konstanta tam patří.

V OLS vychází konstanta jako nevýznamná, tak jsem ji vypustil. EG i Johansena jsem dělal automaticky bez konstanty.

jednadva píše:Jak se stalo, že z I(2) řady je I(1) řada, přestože jsi nediferencoval, ale logaritmoval?

To netuším. Ale logaritmováním se data vyhladí, tak snad to má vliv.

Dotaz: má smysl v našem případě testovat Grangerovu kauzalitu? Co jsem pochopil, testuje se to buď modelem vektorové autoregrese VAR nebo modelem korekce chyby VECM. Používají se stacionární data. Změna X způsobí změnu Y a naopak. Vyšlo mi, že změna MZM ovlivňuje změnu Gold při zpoždění 3 období. Opačná kauzalita se neprojevila.

Rovnice 1: d_l_GOLDAMGBD228NLBM

-------------------------------- koeficient ... směr. chyba ... t-podíl ... p-hodnota
--------------------------------------------------------------------------------------------------
d_l_GOLDAMGBD2~_1 ... 0,0402840 ... 0,0406598 ... 0,9908 ... 0,3222
d_l_GOLDAMGBD2~_2 ... 0,0110980 ... 0,0407422 ... 0,2724 ... 0,7854
d_l_GOLDAMGBD2~_3 ... 0,00153082 ... 0,0404906 ... 0,03781 ... 0,9699
d_l_MZMSL_1 ............. 0,317663 ... 0,367680 ... 0,8640 ... 0,3879
d_l_MZMSL_2 ............ −0,705672 ... 0,500392 ... −1,410 ... 0,1590
d_l_MZMSL_3 ............ 0,781166 ... 0,381132 ... 2,050 ... 0,0408 **

Rovnice 2: d_l_MZMSL

................................ koeficient ... směr. chyba ... t-podíl ... p-hodnota
----------------------------------------------------------------
d_l_GOLDAMGBD2~_1 ... 0,00468127 ... 0,00439579 ... 1,065 ... 0,2873
d_l_GOLDAMGBD2~_2 ...−0,00116305 ... 0,00440470 ... −0,2640 ... 0,7918
d_l_GOLDAMGBD2~_3 ...−0,00565159 ... 0,00437749 ... −1,291 ... 0,1972
d_l_MZMSL_1 ............. 0,943866 ... 0,0397504 ... 23,74 ... 4,61e-089 ***
d_l_MZMSL_2 .............−0,345622 ... 0,0540981 ... −6,389 ... 3,29e-010 ***
d_l_MZMSL_3 ............. 0,220630 ... 0,0412047 ... 5,354 ... 1,21e-07 ***
mlsal
Diskutér

Odeslat příspěvekod jednadva 4. 9. 2020 23:05

mlsal píše:V OLS vychází konstanta jako nevýznamná, tak jsem ji vypustil. EG i Johansena jsem dělal automaticky bez konstanty.

Opravdu? Mně to bez konstanty nedá ani jeden kointegrační vektor, bez ohledu na počet lagů. I když vezmu mnoho zpoždění podle AIC nebo málo podle HQ/SC/FPE, tak nedostanu ani jeden vektor bez ohledu na volbu typu testu (stopa matice / maximální vlastní číslo matice), sezónnost apod. To máš asi v gretlu defaultně nastavenou konstantu. V tom EG testu to možná nebude hrát takovou zásadní roli - je to odhad jen jednoho vztahu, kdežto v J vstupuje konstanta do těch vztahů poměrně složitě, aspoň pokud já můžu soudit. Je to VAR, resp. VECM, takže matice/vektory a mj. křížové vztahy mezi oběma proměnnými.

Mimochodem náhodou jsem našel jakýsi elaborát z IMF, kde píšou, že jeden kointegrační vektor může být i v případě, kdy v systému je řada I(1) a k ní I(0). To si samozřejmě musím ještě ověřit - na internetu se toho píše spousta.

V tom EG testu "nezáleží" na signifikanci konstanty (interceptu): v tom smyslu, že t-statistiky regrese nemají standardní rozdělení, takže ten výstup nedává smysl (viz DW statistika, která ukazuje na výraznou sériovou korelaci, což mj. indikuje taky možnou nestacionaritu procesu). Účelem první regrese v EG je jen odhadnout koeficient nezávislé proměnné. To, zda celý postup dává smysl, se pak testuje na reziduích ADF testem (s těmi odlišnými kritickými hodnotami). Smysluplné je to jen tehdy, když se prokáže stacionarita reziduí, protože pak je odhad koeficientu v regresi "superkonzistentní", tj. rychle konverguje ke skutečnému koeficientu. Je možné, že ta první regrese se má dělat bez konstanty, vyloučit to nemůžu.

mlsal píše:To netuším. Ale logaritmováním se data vyhladí, tak snad to má vliv.

Problém I(2) řad budu postupně řešit.

mlsal píše:Dotaz: má smysl v našem případě testovat Grangerovu kauzalitu?

To tady podle mě testujeme: zpožděné hodnoty MZMSL ovlivňují budoucí hodnoty zlata nebo naopak. (V tom J testu nemusíme vědět, co je příčina a co následek. V EG si to musíme zvolit dopředu.) Johansen je vektorová autoregrese. Ty rovnice dole jsou v maticovém zápisu, takže y_t=(mzmsl_t, zlato_t) atd. Koeficienty jsou maticové, disturbance je taky vektor (zase dvourozměrný jako y_t, tj. pro každou řadu vlastní chybový člen).
J.png


Ta Grangerova kauzalita je asi typu "aspoň 1". Takže toto ti tvůj test prokázal: jedna proměnná grangerovsky zapříčiňuje tu druhou. (Vlastně mě nenapadá, jak by to v tomto případě se 2 proměnnými mohlo být jinak: jedna musí být ta příčina a druhá pak musí být ten následek, takže ta druhá už nemůže být současně příčina.)
jednadva
Diskutér

Odeslat příspěvekod jednadva 8. 9. 2020 00:58

jednadva píše:To tady podle mě testujeme: zpožděné hodnoty MZMSL ovlivňují budoucí hodnoty zlata nebo naopak.

Tj. zpožděné hodnoty MZMSL mají vliv na budoucí hodnoty zlata nebo zpožděné hodnoty zlata mají vliv na budoucí hodnoty MZMSL.
jednadva
Diskutér

Odeslat příspěvekod mlsal 8. 9. 2020 06:25

U testu ADF (konstanta + trend, BIC) pro l_MZMSL jsem si nechal ukázat výsledky regrese a je tam statisticky významný deterministický trend. U stejného testu pro l_Gold je trend nevýznamný.

Je nějaký důvod, proč s trendem v J nebo v EG nepočítat? Třeba z důvodu nízkého koef. u trendu (5,74678e-05)?

Kdybych musel v našem případě použít rovnici s trendem, kointegrační vztah by neexistoval.

Vysvětlím, o co mi jde. Kointegrace podle J se dělá podle jedné z 5 rovnic (bez konstanty, konstanta s omezením, konstanta bez omezení, trend s omezením, trend bez omezení), viz volby v Gretlu nebo tady, str. 21. Jde mi o to jak zjistit, kterou rovnici použít. Můžu to udělat Zkusmiho metodou ("tak aby to vyšlo") nebo použít regresi z ADF testu a postupně vyloučit trend a případně i konstantu podle statistické významnosti.
mlsal
Diskutér

Odeslat příspěvekod jednadva 9. 9. 2020 01:28

mlsal píše:U testu ADF (konstanta + trend, BIC) pro l_MZMSL jsem si nechal ukázat výsledky regrese a je tam statisticky významný deterministický trend. U stejného testu pro l_Gold je trend nevýznamný.

To je problém. Pokud je řada stacionární, tak nemůže být kointegrace.

mlsal píše:Je nějaký důvod, proč s trendem v J nebo v EG nepočítat? Třeba z důvodu nízkého koef. u trendu (5,74678e-05)?

Je k tomu důvod, ale spíš tehdy, pokud v řadách není nějaký trend. V tomto případě bohužel asi je, minimálně v MZMSL, tedy můj první test nebyl nejspíš provedený lege artis. Problém malého koeficientu zkoumám. Je to sice řada dlouhá 50 let a nestoupá nijak rychle, ale je pravda, že trend je o tři řády menší, než by odpovídalo směrnici přímky, kterou bychom proložili prvním a posledním bodem řady. Ale zatím dobrou odpověď nemám. Možná to roli hrát bude.

mlsal píše:Kdybych musel v našem případě použít rovnici s trendem, kointegrační vztah by neexistoval.

Pokud by MZMSL byla trendově stacionární řada (tj. řada s deterministickým trendem + reziduálním procesem typu ARMA), tak by kointegrace nemohla být.

mlsal píše:Jde mi o to jak zjistit, kterou rovnici použít.

Správnější bude spíš jedna z variant trend nebo konstanta.
mlsal píše:Vysvětlím, o co mi jde. Kointegrace podle J se dělá podle jedné z 5 rovnic (bez konstanty, konstanta s omezením, konstanta bez omezení, trend s omezením, trend bez omezení), viz volby v Gretlu nebo tady, str. 21. Jde mi o to jak zjistit, kterou rovnici použít. Můžu to udělat Zkusmiho metodou ("tak aby to vyšlo") nebo použít regresi z ADF testu a postupně vyloučit trend a případně i konstantu podle statistické významnosti.

Je mi jasné. Bude záležet na charakteru (tvaru) řad. Viz např. tuto pasáž o kointegraci, str. 453. Bez konstanty by asi obě řady musely být "těsně" spojené a jejich stacionární lineární kombinace by měla průměr v nule. V případě MZMSL + zlato to vypadá spíš na variantu neomezené konstanty nebo omezeného trendu (Case 3, resp. Case 4). Problém bude možná trochu v odlišném charakteru zlata a MZMSL: zlato by spíš mluvilo pro variantu s omezenou konstantou, kdežto MZMSL spíš pro neomezenou konstantu, resp. omezený trend.
Naposledy upravil jednadva dne 9. 9. 2020 11:38, celkově upraveno 2
jednadva
Diskutér

Odeslat příspěvekod jednadva 9. 9. 2020 11:09

Jinak co se týče I(2) procesů: na simulacích (nebo spíš na "simulacích", aby to neznělo příliš domýšlivě) :) se mi zatím potvrzuje podezření, že I(2) vypadá velmi podobně jako exponenciální řada. Ale dobré vysvětlení toho, proč po odstranění exponenciálního trendu logaritmováním dostáváme I(1) řadu, zatím nemám. Pracujeme na tom (a ještě dlouho budeme). :)

Ten RESET mimochodem nebyl zas tak špatný nápad. Podle mě to nebylo ono, protože RESET taky hledá nějakou "podezřelou" strukturu v reziduích (jako Quandtův test) a podezřelá struktura tam defakto musí být, ale špatná specifikace modelu může hrát roli (to se koneckonců už velmi výrazně ukázalo při doplnění konstanty do Johansenova VECM).

Ke Grangerově kauzalitě: pracuji s hypotézou, že G kauzalita je "jen" nutná podmínka kointegrace, tj. předcházející hodnoty x musí mít vliv na následující y, ale neprokáže-li se provázanost hladin, nemusí to možná ještě znamenat zamítnutí G kauzality. Nezdá se mi, že by totiž kointegrace byla ekvivalentní s G kauzalitou. Ale taky na tom pracujeme (a taky ještě dlouho budeme). :)
jednadva
Diskutér

Předchozí stránkaDalší stránka

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 0 návštevníků