Investicia do zlata.

Podílové fondy, akcie, komoditní trhy, spekulace, aukce. Kam a jak nejlépe investovat volné finanční prosředky

Moderátor: Moderátoři FinExpert.cz

Odeslat příspěvekod jednadva 26. 8. 2020 23:46

mlsal:
mlsal píše:Pokud už to počítám správně,

Nevidím tam chybu. Přečetl jsem to dvakrát a vypadá to dobře. Asi v pořádku. Pokud bych časem ještě něco našel, tak napíšu.

mlsal píše:(strukturální zlom)

Pěkné. :)
jednadva
Diskutér

Odeslat příspěvekod mlsal 27. 8. 2020 01:31

jednadva,

děkuji. Je to zajímavé cvičení pro dlouhé zimní večery. Nemáš nápad, co by se ještě dalo otestovat?

Hlava,

jestli nechceš zblbnout, tak to nečti. :-)

Jedná se o kointegraci časových řad - testuje se, jestli mají řady mezi sebou nějaký dlouhodobý vztah. Není k tomu žádná literatura. Vysvětlené je to třeba tady.
mlsal
Diskutér

Odeslat příspěvekod jednadva 27. 8. 2020 11:29

mlsal: Např. nominální měnové kurzy, akciové indexy, dluhopisy-akcie, spot-futures, parita kupní síly, výnosy dluhopisů (výnosová křivka).
jednadva
Diskutér

Odeslat příspěvekod jednadva 29. 8. 2020 12:22

mlsal: Technická. Jaké máš v testu u_hat kritické hodnoty pro ADF test? Údajně by se měly použít kritické hodnoty z MacKinnon (1991). Zatím to bohužel neumím zdůvodnit, ale příčina tkví asi v té regresi na I(1) řadách. Pokud si udělám ručně standardní ADF test reziduí z první regrese na I(1) řadách a počet zpoždění dám podle AIC, tak zamítám jednotkový kořen v reziduích EG testu zlato/MZMSL na hladině 5 %. Zpoždění podle BIC dávají stejný výsledek.

Kód: Vybrat vše
> summary(ur.df(residuals(e),lags=100,selectlags=c("AIC")))

###############################################
# Augmented Dickey-Fuller Test Unit Root Test #
###############################################

Test regression none


Call:
lm(formula = z.diff ~ z.lag.1 - 1 + z.diff.lag)

Residuals:
      Min        1Q    Median        3Q       Max
-0.205548 -0.033985 -0.004981  0.026085  0.249464

Coefficients:
             Estimate Std. Error t value Pr(>|t|) 
z.lag.1     -0.018507   0.007757  -2.386   0.0177 *
z.diff.lag1 -0.086036   0.056947  -1.511   0.1319 
z.diff.lag2  0.094332   0.056995   1.655   0.0990 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.05342 on 293 degrees of freedom
Multiple R-squared:  0.03733,   Adjusted R-squared:  0.02747
F-statistic: 3.787 on 3 and 293 DF,  p-value: 0.01086


Value of test-statistic is: -2.3857

Critical values for test statistics:
      1pct  5pct 10pct
tau1 -2.58 -1.95 -1.62

>


Podle EG testu v balíku "egcm" v R (viz výše) dostávám hodnotu testové statistiky ještě nižší -2,767, ale p-hodnotu přesto 0,16715, takže ADF nezamítá nulovou a ty kritické hodnoty se musí lišit: podle standardního testu je kritická hodnota pro 1% hladinu -2,58, takže by se podle standardního ADF testu zamítal jednotkový kořen (potvrzovala kointegrace) i na hladině 1 %.

Rozdílný počet pozorování ve tvém a mém testu (~600 v. ~290) hodlám řešit taky. Vyhodilo mi to spoustu NA hodnot, což jsem zjistil až později. Musím to udělat nějak sofistikovaněji, tj. asi nahradit chybějící hodnotu k 1. v měsíci nějakou blízkou hodnotou. Budu řešit. :)

Na ten strukturální zlom bych se rád zaměřil taky, to je velice důležité. Zatím netuším, jak se s tím dá vypořádat standardním Johansenovým (popř. EG) testem, nebo zda se musí postupovat jinak (Hansen apod.). Podle mě to standardní test neumí a musí se nějak chytřeji.
Naposledy upravil jednadva dne 29. 8. 2020 18:27, celkově upraveno 1
jednadva
Diskutér

Odeslat příspěvekod mlsal 29. 8. 2020 14:42

jednadva,

asi bych nejdřív pořešil ty data. Já to mám od 1968.3 - 2020.6 (T-628).

Podle nápovědy gretlu používá EG test p-hodnoty podle MacKinnon (1996). Já se řídím p-hodnotami.
Podle této práce str. 17 jsou kritické hodnoty pro EG víc záporné než u ADF testu, takže na rezidua nelze použít ADF test, viz dále.

Testovací statistika pro EG mi vychází -1,93307, kritická hodnota musí být alespoň -3,350.

Graf reziduí OLS modelu GOLDAMGBD228NLBM/MZMSL bez konstanty (statisticky nevýznamná):
Rezudua regrese.png
Graf reziduí


DF test pro rezidua (BIC)
Rozšířený Dickey-Fullerův test pro uhat6
testing down from 24 lags, criterion BIC
počet pozorování 627
nulová hypotéza jednotkového kořenu: a = 1

test bez konstanty
s použitím 0 zpožděných proměnných (1-L)uhat6
model: (1-L)y = (a-1)*y(-1) + e
odhadovaná hodnota (a - 1): -0,00858489
testovací statistika: tau_nc(1) = -1,93307
p-hodnota 0,05095 > 0.05 ... nelze zamítnout jednotkový kořen
autokorelační koeficient 1. řádu pro e: 0,039

test s konstantou
s použitím 0 zpožděných proměnných (1-L)uhat6
model: (1-L)y = b0 + (a-1)*y(-1) + e
odhadovaná hodnota (a - 1): -0,00859366
testovací statistika: tau_c(1) = -1,9344
p-hodnota 0,3164
autokorelační koeficient 1. řádu pro e: 0,038

Test KPSS pro uhat6

T = 628
Parametr řádu zpoždění = 0
Testovací statistika = 5,30826

10% 5% 1%
Kritické hodnoty: 0,348 0,462 0,742
P-hodnota < .01 .... zamítám stacionaritu, potvrzuje předchozí test

DF test pro rezidua (AIC)
Rozšířený Dickey-Fullerův test pro uhat6
testing down from 24 lags, criterion AIC
počet pozorování 615
nulová hypotéza jednotkového kořenu: a = 1

test bez konstanty
s použitím 12 zpožděných proměnných (1-L)uhat6
model: (1-L)y = (a-1)*y(-1) + ... + e
odhadovaná hodnota (a - 1): -0,0130392
testovací statistika: tau_nc(1) = -2,85511
asymptotická p-hodnota 0,004187 < 0,05 zamítám jednotkový kořen
autokorelační koeficient 1. řádu pro e: 0,002
zpožděné diference: F(12, 602) = 3,538 [0,0000]

test s konstantou
s použitím 12 zpožděných proměnných (1-L)uhat6
model: (1-L)y = b0 + (a-1)*y(-1) + ... + e
odhadovaná hodnota (a - 1): -0,0130893
testovací statistika: tau_c(1) = -2,86339
asymptotická p-hodnota 0,04975
autokorelační koeficient 1. řádu pro e: 0,002
zpožděné diference: F(12, 601) = 3,499 [0,0001]

Pro kritérium AIC je zamítnut jednotkový kořen, pro BIC nelze zamítnout = rozpor.
____________________________________________________________________________________________
Dotaz:
použiju VAR model pro určení vhodného kritéria a zpoždění:

VAR systém, maximální řád zpoždění 24

Hvězdička dole označuje nejlepší (tedy minimalizované) hodnoty
příslušného informačního kritéria, AIC = Akaikovo kritérium,
BIC = Schwartz Bayesovské kritérium a HQC = Hannan-Quinnovo kritérium.

zpoždění logvěr. p(LR) AIC BIC HQC

1 2911,52441 -9,627564 -9,598402 -9,616215
2 3106,65588 0,00000 -10,260450 -10,202124 -10,237752
3 3124,54350 0,00000 -10,306435 -10,218947* -10,272388*
4 3131,60177 0,00693 -10,316562 -10,199911 -10,271166
5 3132,40012 0,80938 -10,305961 -10,160147 -10,249215
6 3135,07845 0,25262 -10,301584 -10,126608 -10,233490
7 3137,01810 0,42259 -10,294762 -10,090623 -10,215318
8 3140,07803 0,19037 -10,291649 -10,058347 -10,200856
9 3146,73576 0,00983 -10,300450 -10,037985 -10,198308
10 3152,02244 0,03180 -10,304710 -10,013083 -10,191219
11 3155,68335 0,11983 -10,303587 -9,982797 -10,178747
12 3170,65237 0,00001 -10,339909 -9,989956 -10,203719
13 3176,34534 0,02255 -10,345514* -9,966399 -10,197976

Výsledek: pro BIC i HQC stejné - 3 zpoždění .... použiju kritérium BIC. Je to tak správně?.
___________________________________________________________________________________
K tomu strukturálnímu zlomu:
v gretlu udělám OLS a pak Quandtův (QLR) test.

Quandtův test podílu věrohodnosti pro strukturální zlom v neznámém bodě,
s usekáním 15%:
Maxima F(2, 625) = 125,477 se dosahuje pro pozorování 1977:08
Asymptotic p-value = 2,63757e-055 for chi-square(2) = 250,954

Pak lze omezit "rozsah dat"
mlsal
Diskutér

Odeslat příspěvekod jednadva 29. 8. 2020 18:08

mlsal: Podívám se na to v průběhu příštího týdne.
jednadva
Diskutér

Odeslat příspěvekod peliculiar 29. 8. 2020 21:35

Taky čekám, zda někdo napíše nějaký výstup, který bude pochopitelný i pro nematfyzáky. :-D
peliculiar
Diskutér
Uživatelský avatar

Odeslat příspěvekod jednadva 31. 8. 2020 19:43

mlsal:
mlsal píše:Podle této práce str. 17 jsou kritické hodnoty pro EG víc záporné než u ADF testu, takže na rezidua nelze použít ADF test, viz dále.
mlsal píše:Rozšířený Dickey-Fullerův test pro uhat6

Jde "pouze" o kritické hodnoty testovací statistiky (tau), resp. p-hodnoty. Model je stejný, tj. ADF. Ale rozdělení, resp. kritické hodnoty tau statistiky jsou nestandardní, přesně jak uvádíš. Rozdělení tau statistiky závisí mj. na počtu řad, které vstupují do první regrese. V tomto případě jsou tyto řady dvě.

mlsal píše:Testovací statistika pro EG mi vychází -1,93307, kritická hodnota musí být alespoň -3,350.

Kritická hodnota tau je právě -3,350, popř. trochu odlišné číslo, v závislosti na zdroji, ze kterého se údaj čerpá. Takže ne "alespoň", ale "právě".

Porovnej si s kritickou hodnotou tvoji hodnotu testovací statistiky, která ti vyšla ve dvou testech níže. Co vidíš?
mlsal píše:test bez konstanty
s použitím 0 zpožděných proměnných (1-L)uhat6
model: (1-L)y = (a-1)*y(-1) + e
odhadovaná hodnota (a - 1): -0,00858489
testovací statistika: tau_nc(1) = -1,93307
p-hodnota 0,05095 > 0.05 ... nelze zamítnout jednotkový kořen
autokorelační koeficient 1. řádu pro e: 0,039

mlsal píše:test bez konstanty
s použitím 12 zpožděných proměnných (1-L)uhat6
model: (1-L)y = (a-1)*y(-1) + ... + e
odhadovaná hodnota (a - 1): -0,0130392
testovací statistika: tau_nc(1) = -2,85511
asymptotická p-hodnota 0,004187 < 0,05 zamítám jednotkový kořen
autokorelační koeficient 1. řádu pro e: 0,002
zpožděné diference: F(12, 602) = 3,538 [0,0000]
jednadva
Diskutér

Odeslat příspěvekod mlsal 31. 8. 2020 20:01

V tom druhém případě je
jednadva píše:testovací statistika: tau_nc(1) = -2,85511

To ale nestačí pro zamítnutí. Při EG musí být alespoň -3,35 a nižší.
mlsal
Diskutér

Odeslat příspěvekod jednadva 31. 8. 2020 20:08

Přesně tak. Kritickou hodnotu tau pro tento typ testu uvádíš -3,35. Hodnota tau spočítaná ve tvém testu je větší než -3,35. Takže nelze zamítnout jednotkový kořen v reziduích a neexistenci kointegrace.
jednadva
Diskutér

Odeslat příspěvekod mlsal 31. 8. 2020 20:30

Tomu bych rozuměl. Žádná kointegrace podle EG.

Dám sem ještě výstup z Johansenova testu (stejná data, 3 zpoždění):

Johansenův test:
Počet rovnic = 2
Řád zpoždění = 3
Perioda odhadu: 1968:06 - 2020:06 (T = 625)
Případ 1: Žádná konstanta

Logaritmus věrohodnosti = 5016,61 (včetně konstanty: 3242,94)

Hodnost Vlastní číslo Test stopy matice p-hodnota Lmax test p-hodnota
0 0,092364 64,367 [0,0000] 60,570 [0,0000]
1 0,0060562 3,7966 [0,0591] 3,7966 [0,0611]

Opraveno pro velikost výběru (df = 619)
Hodnost Test stopy matice p-hodnota
0 64,367 [0,0000]
1 3,7966 [0,0614]

Jestli tomu rozumím (a moc nerozumím), tak pro r=0 zamítám nulovou hypotézu H0: nepřítomnost kointegračního vztahu .... tedy 1 kointegrační vztah ????
mlsal
Diskutér

Odeslat příspěvekod jednadva 1. 9. 2020 05:37

Ano, to je pravda. Pokud se Johansenův test "nastaví" na přítomnost konstanty, tak v tomto konkrétním případě zamítá nulovou hypotézu r=0 a dává právě jeden kointegrační vektor. V R jsem dostal stejný výsledek (taky za období 1968 - 2020, 628 měsíců). To by samozřejmě hovořilo ve prospěch tvé hypotézy.

Kód: Vybrat vše
######################
# Johansen-Procedure #
######################

Test type: trace statistic , without linear trend and constant in cointegration

Eigenvalues (lambda):
[1]  9.423918e-02  7.175539e-03 -7.979438e-18

Values of teststatistic and critical values of test:

          test 10pct  5pct  1pct
r <= 1 |  4.50  7.52  9.24 12.97
r = 0  | 66.36 17.85 19.96 24.60

Eigenvectors, normalised to first column:
(These are the cointegration relations)

            gold.l3   money.l3  constant
gold.l3   1.0000000  1.0000000  1.000000
money.l3 -0.1328587 -0.5567566 -1.860412
constant 18.3349643 -1.4970196  8.885430

Weights W:
(This is the loading matrix)

             gold.l3      money.l3      constant
gold.d  0.0003239221 -0.0083679638  3.533647e-17
money.d 0.0001035132  0.0001872444 -5.524899e-18


Ve výstupu z gretlu je p-hodnota pro r<=1 poměrně blízko 5 %. To znamená, že by obě řady ještě mohly být stacionární. V tomto případě by se asi muselo jednat o nějakou trendovou stacionaritu, protože na grafu rostou v čase.
jednadva
Diskutér

Odeslat příspěvekod mlsal 2. 9. 2020 15:15

Navrhuji vylepšený model ceny zlata.

Data jsou ve formě bazických indexů 2006=100 (logaritmováno)
DollarIndex je tento.
Výstup z EG je bez ADF testů.

Krok 6: kointegrační regrese

Kointegrační regrese -
OLS, za použití pozorování 2006:01-2020:07 (T = 175)
Závisle proměnná: l_Gold

koeficient směr. chyba t-podíl p-hodnota
--------------------------------------------------------------
l_Silver 0,507586 0,0116251 43,66 1,19e-094 ***
l_SP500 −0,239089 0,0218453 −10,94 1,82e-021 ***
l_DollarIndex −0,265798 0,0215803 −12,32 2,32e-025 ***
l_MZMSL 0,995581 0,0302544 32,91 6,87e-076 ***

Střední hodnota závisle proměnné 5,415935
Sm. odchylka závisle proměnné 0,296324
Součet čtverců reziduí 0,465215
Sm. chyba regrese 0,052159
Necentrovaný koeficient determinace 0,999910
Centrovaný koeficient determinace 0,969551
Logaritmus věrohodnosti 270,5644
Akaikovo kritérium −533,1287
Schwarzovo kritérium −520,4696
Hannan-Quinnovo kritétium −527,9938
rho (koeficient autokorelace) 0,657779
Durbin-Watsonova statistika 0,684397
zde je poznámka o zkratkách statistik modelu

Krok 7: test jednotkového kořenu v uhat

Rozšířený Dickey-Fullerův test pro uhat
testing down from 12 lags, criterion BIC
počet pozorování 173
nulová hypotéza jednotkového kořenu: a = 1

test bez konstanty
s použitím jedné zpožděné proměnné (1-L)uhat
model: (1-L)y = (a-1)*y(-1) + ... + e
odhadovaná hodnota (a - 1): -0,262353
testovací statistika: tau_nc(5) = -4,3181
asymptotická p-hodnota 0,02631
autokorelační koeficient 1. řádu pro e: -0,037

Graf.png
Graf vyrovnaných a skutečných hodnot

________________________________________________________________________________
Největší vliv na cenu zlata má MZM - koeficient = 0,995581, tedy "tištění" peněz, jak říkají odborníci.
mlsal
Diskutér

Odeslat příspěvekod jednadva 2. 9. 2020 16:51

To mi neřeší problém s potenciální trendovou stacionaritou MZMSL. I když jsem trochu skeptický, protože aby byl v logaritmické řadě deterministický trend (lineární), tak by asi FED musel každý rok (1+n)krát zvyšovat peněžní zásobu, skoro jako hodinky. Ovšem po vyslovení této teze mi to zas tak nesmyslné nepřipadá. V průměru. :) Na grafu vypadá logaritmovaná řada MZMSL každopádně tak nějak celkově podezřele (moc hladce - ale to je možná jen problém měsíčních dat + triviální problém grafického výstupu programu). Jak ti vychází ADF test řady MZMSL, pokud do testu přidáš deterministický trend?

Jaká je podle tvého názoru role konstanty v Johansenově kointegračním testu? Jaký má ekonomický význam? Nedovedu ji zatím v tomto případě dobře interpretovat. Ale něčeho se snad dopátráme.

Akaikeho kritérium je ve tvém rozšířeném modelu (stříbro apod.) větší než u tvého předchozího EG modelu.*****[WARNING - see below] :))***** Akaikeho kritérium trestá overfitting. Je možné, že v případě odhadu kointegračního vektoru v EG testu nemá toto kritérium dobrou interpretaci. Vezmi to tedy prosím jako pracovní verzi, popř. námět. Postupně to budu řešit. Určitě se podíváme i na tento širší model.

****Tak nikoliv. To bylo AIC tvé regrese na diferencích. Mea culpa.
jednadva
Diskutér

Odeslat příspěvekod saabik 2. 9. 2020 18:02

Ad role konstanty v Johansenově testu. Nejsem moc kovaný v ekonometrii, ale domnívám se, že role konstanty se využívá pro možnost situace, kdy mezi veličinami existuje trend, přestože vykazují odlišné hodnoty. Ale ruku do ohně za to nedám. Ani prst.
saabik
Diskutér

Předchozí stránkaDalší stránka

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 0 návštevníků