/usr/share/gretl/gretl_cli_cmdref.gl is in gretl-common 2017d-3build1.
This file is owned by root:root, with mode 0o644.
The actual contents of the file can be viewed below.
| headings 10
Tests 22
add
adf
chow
coeffsum
coint
coint2
cusum
difftest
hausman
kpss
leverage
levinlin
meantest
modtest
normtest
omit
qlrtest
reset
restrict
runs
vartest
vif
Graphs 9
boxplot
gnuplot
graphpg
hfplot
plot
qqplot
rmplot
scatters
textplot
Statistics 13
anova
corr
corrgm
fractint
freq
hurst
mahal
pca
pergm
spearman
summary
xcorrgm
xtab
Dataset 18
append
data
dataset
delete
genr
info
join
labels
markers
nulldata
open
rename
setinfo
setmiss
setobs
smpl
store
varlist
Estimation 35
ar
ar1
arbond
arch
arima
arma
biprobit
dpanel
duration
equation
estimate
garch
gmm
heckit
hsk
intreg
lad
logistic
logit
midasreg
mle
mpols
negbin
nls
ols
panel
poisson
probit
quantreg
system
tobit
tsls
var
vecm
wls
Programming 19
break
catch
clear
debug
elif
else
end
endif
endloop
flush
foreign
function
if
include
loop
makepkg
run
set
setopt
Transformations 9
diff
discrete
dummify
lags
ldiff
logs
orthdev
sdiff
square
Printing 7
eqnprint
modprint
outfile
print
printf
sprintf
tabprint
Utilities 7
eval
help
install
modeltab
pvalue
quit
shell
Prediction 1
fcast
# add Tests
Argumento: listavariables
Opcións: --lm (Fai unha proba de ML; só con MCO)
--quiet (Presenta só os resultados básicos da proba)
--silent (Non presenta nada)
--vcv (Presenta a matriz de covarianzas do modelo ampliado)
--both (Só para estimación VI; mira abaixo)
Exemplos: add 5 7 9
add xx yy zz --quiet
Debes de solicitar esta instrución despois de executar unha instrución de
estimación. Realiza unha proba conxunta (cuxos resultados podes obter cos
accesorios "$test" e "$pvalue") sobre a adición das variables indicadas no
argumento, ao derradeiro modelo estimado.
Por defecto, estímase unha versión "ampliada" do modelo orixinal, que
resulta ao engadirlle a este as variables do argumento listavariables, como
regresores. Neste caso, a proba é de tipo Wald sobre o modelo ampliado,
pasando a ser este o "modelo vixente" en troques do orixinal. Debes de ter
isto en conta, por exemplo, para usar $uhat porque este permite recuperar os
erros do que sexa o modelo vixente en cada momento, ou para facer probas
posteriores.
Alternativamente, se indicas a opción --lm (que só está dispoñible para
aqueles modelos estimados mediante MCO), realízase unha proba de
Multiplicadores de Lagrange. Para iso, execútase unha regresión auxiliar
na que o erro de estimación do derradeiro modelo tómase como variable
dependente; e as variables independentes son as dese derradeiro modelo máis
as de listavariables. Baixo a hipótese nula de que as variables engadidas
non teñen unha capacidade explicativa adicional, o estatístico formado
multiplicando o tamaño da mostra polo R-cadrado desta regresión, ten a
distribución dunha variable khi-cadrado con tantos graos de liberdade como
o número de regresores engadidos. Neste caso, o modelo orixinal non se
substitúe polo modelo da regresión auxiliar.
A opción --both é específica do método de estimación de Mínimos
Cadrados en 2 etapas. Indica que as novas variables deben de engadirse tanto
á lista dos regresores como á lista dos instrumentos, posto que cando non
se indica nada engádense por defecto só á de regresores.
Ruta do menú: Fiestra de modelo: Probas/Engadir variables
# adf Tests
Argumentos: nivel listavariables
Opcións: --nc (Sen constante)
--c (Con constante)
--ct (Con constante máis tendencia)
--ctt (Con constante, máis tendencia linear e cadrada)
--seasonals (Inclúe variables ficticias estacionais)
--gls (Detrae a media ou a tendencia usando MCX)
--verbose (Amosa os resultados da regresión)
--quiet (Non presenta os resultados)
--difference (Usa as primeiras diferenzas da variable)
--test-down[=criterio] (Nivel de retardos automático)
--perron-qu (Mira abaixo)
Exemplos: adf 0 y
adf 2 y --nc --c --ct
adf 12 y --c --test-down
Mira tamén jgm-1996.inp
As opcións que se amosan abaixo e a discusión que segue correspóndense co
uso da instrución adf con datos de series temporais típicos. Para utilizar
esta instrución con datos de panel, mira máis abaixo.
Calcula un conxunto de probas de Dickey-Fuller sobre cada unha das variables
do argumento, sendo a hipótese nula a existencia dunha raíz unitaria.
(Agora ben, cando escolles a opción --difference, calcúlase a primeira
diferenza da(s) variable(s) antes de facer a proba, e a discusión de abaixo
debes de entendela como referida á(s) variable(s) transformada(s).)
Por defecto, amósanse dúas variantes da proba: unha baseada nunha
regresión que utiliza unha constante, e outra que utiliza unha constante
máis unha tendencia linear. Podes controlar as variantes que se presentan
especificando un ou máis dos indicadores de opción.
Podes utilizar a opción --gls xuntamente con algunha das dúas opcións --c
e --ct (o modelo con constante, ou o modelo con constante máis tendencia).
O efecto desta opción é que a detracción da media ou da tendencia da
variable que se quere probar, faise utilizando o procedemento de Mínimos
Cadrados Xeneralizados suxerido por Elliott, Rothenberg e Stock (1996), que
proporciona unha proba de maior potencia que a aproximación estándar de
Dickey-Fuller. Esta opción non é compatible con --nc, --ctt nin
--seasonals.
En tódolos casos, a variable dependente é a primeira diferenza da variable
especificada (y) e a variable independente clave é o primeiro retardo de y.
O modelo constrúese de xeito que o coeficiente da variable y retardada, é
igual á raíz en cuestión menos 1. Por exemplo, o modelo con constante
pode escribirse como
(1 - L)y(t) = b0 + (a-1)y(t-1) + e(t)
. Baixo a hipótese nula de existencia dunha raíz unitaria, o coeficiente
da variable y retardada é igual a cero; e baixo a hipótese alternativa de
que y é estacionaria, este coeficiente é negativo.
Se o argumento nivel (de aquí en diante chamarémoslle nivel ou orde k) é
maior ca 0, entón inclúense k retardos da variable dependente no lado
dereito da regresión que se estima para calcular o estatístico de proba de
cada caso. Cando indicas o nivel de retardos como -1, k establécese
seguindo o aconsellado por Schwert (1989): concretamente tómase a parte
enteira de calcular 12(T/100)^0.25, onde T indica o tamaño da mostra.
Porén, en cada caso no que indicas a opción --test-down, entón k tómase
como o retardo máximo, e o nivel de retardos concreto que se utilizará,
obtense probando cara abaixo. Podes escoller o criterio para ir probando
cara abaixo, utilizando un dos parámetros de opción que deberá ser AIC
(por defecto), BIC ou tstat.
Cando pides que se probe cara atrás mediante AIC ou BIC, o nivel de
retardos final para a ecuación ADF é o que optimiza o criterio de
información escollido (de Akaike ou Bayesiano de Schwarz). O procedemento
exacto depende de se indicas ou non a opción --gls: cando se especifica a
detracción con MCX (GLS) da tendencia, os AIC e BIC son as versións
"modificadas" descritas en Ng e Perron (2001); noutro caso, son as versións
estándar. No caso de MCX, dispós dun refinamento pois cando indicas a
opción adicional --perron-qu, calcúlanse estes criterios de información
modificados de acordo co método revisado que recomendaron Perron e Qu
(2007).
Cando pides que se probe cara atrás mediante o método do estatístico t, o
procedemento é como se indica deseguido:
1. Estímase a regresión de Dickey-Fuller utilizando k retardos da variable
dependente.
2. É significativo o último retardo? Se o é, execútase a proba cun nivel
de retardos k. Se non o é, faise que k = k - 1, e vólvese ao paso 1 cun
retardo menos. O proceso repítese ata que sexa significativo o último
retardo dunha regresión, ou ata que k sexa 0 (faríase a proba cun nivel
de retardos igual a 0).
No contexto do paso 2 de arriba, "significativo" quere dicir que o
estatístico t do derradeiro retardo ten un valor p asintótico de dúas
colas igual ou menor a 0.10, fronte á distribución Normal.
Os valores P para as probas de Dickey-Fuller están baseadas en MacKinnon
(1996); e o código relevante inclúese co amable permiso do propio autor.
No caso da proba coa tendencia linear utilizando MCX (GLS), estes valores P
non son aplicables; por iso, no seu lugar amósanse os puntos críticos da
Táboa 1 que hai en Elliott, Rothenberg e Stock (1996).
Datos de Panel
Cando se utiliza a instrución adf con datos de panel para facer unha proba
de raíz unitaria de panel, as opcións aplicables e os resultados que se
amosan son algo diferentes.
Primeiro, mentres que podes indicar unha lista de variables para probar no
caso de series temporais típicas, con datos de panel só podes probar unha
variable por cada instrución. Segundo, as opcións que manexan a inclusión
de termos determinísticos pasan a ser mutuamente excluíntes: debes de
escoller unha entre sen constante, con constante, e con constante máis
tendencia; por defecto é con constante. Ademais, a opción --seasonals non
está dispoñible. Terceiro, a opción --verbose aquí ten un significado
diferente: produce un breve informe da proba para cada serie temporal
individual (sendo este por defecto unha presentación só do resultado
global).
Calcúlase a proba global (Hipótese nula: A serie en cuestión ten unha
raíz unitaria para todas as unidades do panel) dunha ou as dúas formas
seguintes: utilizando o método de Im, Pesaran e Shin (Journal of
Econometrics, 2003) ou a de Choi (Journal of International Money and
Finance, 2001) A proba de Choi require que estean dispoñibles as
probabilidades asociadas (valores P) para as probas individuais; se este non
é o caso (dependendo das opcións escollidas), omítese. O estatístico
concreto proporcionado para a proba de Im, Pesaran e Shin varía do xeito
seguinte: se o nivel de retardo para a proba non é cero, amósase o seu
estatístico W; por outra banda, se as longuras das series de tempo difiren
dun individuo a outro, amósase o seu estatístico Z; noutro caso, amósase
o seu estatístico t-barra.
Ruta do menú: /Variable/Probas de raíz unitaria/Proba ampliada de Dickey-Fuller
# anova Statistics
Argumentos: resposta tratamento [ control ]
Opción: --quiet (Non presenta os resultados)
Análise da Varianza: O argumento resposta deberá de ser unha serie que
mida algún efecto de interese, e tratamento deberá de ser unha variable
discreta que codifique dous ou máis tipos de tratamento (ou non
tratamento). Para un ANOVA de dous factores, a variable control (que tamén
será discreta) deberá de codificar os valores dalgunha variable de
control.
Agás cando indicas a opción --quiet, esta instrución presenta unha táboa
amosando as sumas de cadrados e os cadrados da media xunto cunha proba F.
Podes recuperar o estatístico dunha proba F e a súa probabilidade asociada
utilizando os accesorios "$test" e "$pvalue", respectivamente.
A hipótese nula da proba F é que a resposta media é invariante con
respecto ao tipo de tratamento ou, noutras palabras, que o tratamento non
ten efecto. Falando estritamente, a proba só é válida cando a varianza da
resposta é a mesma para tódolos tipos de tratamento.
Cae na conta de que os resultados que amosa esta instrución son de feito un
subconxunto da información ofrecida polo seguinte procedemento, que podes
preparar doadamente no Gretl. (1) Xera un conxunto de variables ficticias
que codifiquen todos os tipos de tratamento agás un. Para un ANOVA de dous
factores, xera ademais un conxunto de variables ficticias que codifiquen
todos os bloques de "control" agás un. (2) Fai a regresión de resposta
sobre unha constante e as variables ficticias utilizando "ols". Cun só
factor, preséntase a táboa ANOVA mediante a opción --anova nesa función
ols. No caso de dous factores, a proba F relevante atópala utilizando a
instrución "omit" logo da regresión. Por exemplo, (asumindo que resposta
é y, que xt codifica o tratamento, e que xb codifica os bloques de
"control"):
# Un factor
list Fict_xt = dummify(xt)
ols y 0 Fict_xt --anova
# Dous factores
list Fict_xb = dummify(xb)
ols y 0 Fict_xt Fict_xb
# Proba de significación conxunta de Fict_xt
omit Fict_xt --quiet
Ruta do menú: /Modelar/Outros Modelos Lineais/ANOVA
# append Dataset
Argumento: nomeficheiro
Opcións: --time-series (Mira abaixo)
--fixed-sample (Mira abaixo)
--update-overlap (Mira abaixo)
Mira abaixo para opcións adicionais especiais
Abre un ficheiro de datos e agrega o contido ao conxunto vixente de datos,
se os novos datos son compatibles. O programa tentará detectar o formato do
ficheiro de datos (propio, texto plano, CSV, Gnumeric, Excel, etc.).
Os datos engadidos poden ter ben o formato de observacións adicionais sobre
series xa presentes no conxunto de datos, e/ou ben o formato de novas
series. No caso de engadir series, a compatibilidade require (a) que o
número de observacións dos novos datos sexa igual ao número de datos
actuais, ou (b) que os novos datos carrexen clara información das
observacións de xeito que Gretl poda deducir como colocar os valores.
Un caso que non se admite é aquel no que os novos datos comezan antes e
rematan despois ca os datos orixinais. Para engadir series nesa situación,
podes utilizar a opción --fixed-sample; isto ten como efecto que se suprime
o engadido de observacións, polo que así restrínxese a operación
unicamente a engadir series novas.
Admítese unha característica especial cando se engaden datos a un conxunto
de datos de panel. Se n denota o número de unidades atemporais no panel, T
denota o número de períodos de tempo, e m denota o número de
observacións dos novos datos. Se m = n, os novos datos considéranse
invariantes no tempo, e cópianse repetidos para cada período de tempo. Por
outra banda, se m = T os datos trátanse como invariantes entre as unidades
atemporais, e cópianse repetidos para cada unidade atemporal. Se o panel é
"cadrado", e m é igual tanto a n como a T, aparece unha ambigüidade. Por
defecto, neste caso trátanse os novos datos como invariantes no tempo, pero
podes forzar a que Gretl trate os novos datos como series temporais coa a
opción --time-series. (Esta posibilidade ignórase en tódolos outros
casos.)
Cando se selecciona un ficheiro de datos para agregar, pode haber un area de
solapamento co conxunto de datos existente; é dicir, unha ou máis series
poden ter unha ou máis observacións en común entre as dúas orixes. Cando
indicas a opción --update-overlap, a instrución append substitúe calquera
observación solapada cos valores do ficheiro de datos escollido; noutro
caso, os valores que nese momento xa están no seu sitio non se ven
afectados.
As opcións especiais adicionais --sheet, --coloffset, --rowoffset e
--fixed-cols funcionan do mesmo xeito que con "open"; consulta esa
instrución para obter máis explicacións.
Consulta tamén "join" para un manexo máis sofisticado de orixes de datos
múltiples.
Ruta do menú: /Ficheiro/Engadir datos
# ar Estimation
Argumentos: retardos ; depvar indepvars
Opción: --vcv (Presenta a matriz de covarianzas)
Exemplo: ar 1 3 4 ; y 0 x1 x2 x3
Calcula as estimacións dos parámetros utilizando o procedemento iterativo
xeneralizado de Cochrane-Orcutt; consulta a Sección 9.5 de Ramanathan
(2002). As iteracións rematan cando a sucesión de sumas de erros cadrados
non difire dun termo ao seguinte en máis do 0.005 por cento, ou despois de
20 iteracións.
Con "retardos" tes que indicar unha lista de retardos do termo de
perturbación, rematada por un punto e coma. No exemplo de arriba, o termo
de perturbación especifícase como
u(t) = rho(1)*u(t-1) + rho(3)*u(t-3) + rho(4)*u(t-4)
Ruta do menú: /Modelar/Series temporais/Perturbacións AR (MCX)
# ar1 Estimation
Argumentos: depvar indepvars
Opcións: --hilu (Utiliza o procedemento de Hildreth-Lu)
--pwe (Utiliza o estimador de Prais-Winsten)
--vcv (Presenta a matriz de covarianzas)
--no-corc (Non afina os resultados con Cochrane-Orcutt)
--loose (Utiliza un criterio de converxencia menos preciso)
Exemplos: ar1 1 0 2 4 6 7
ar1 y 0 xlista --pwe
ar1 y 0 xlista --hilu --no-corc
Calcula estimacións MCX que sexan viables para un modelo no que o termo de
perturbación asúmese que sigue un proceso autorregresivo de primeira orde.
O método utilizado por defecto é o procedemento iterativo de
Cochrane-Orcutt; por exemplo, consulta a sección 9.4 de Ramanathan (2002).
O criterio para acadar a converxencia é que as estimacións sucesivas do
coeficiente de autocorrelación, non difiran en máis de 1e-6 ou, cando
indicas a opción --loose, en máis de 0.001. Se isto non se acada antes de
que se fagan as 100 iteracións, amósase un fallo.
Cando indicas a opción --pwe, utilízase o estimador de Prais-Winsten. Isto
implica unha iteración similar á de Cochrane-Orcutt; a diferenza está en
que mentres que o método de Cochrane-Orcutt descarta a primeira
observación, o método de Prais-Winsten fai uso dela. Para obter máis
detalles consulta, por exemplo, o capítulo 13 de Greene (2000).
Cando indicas a opción --hilu, utilízase o procedemento de procura de
Hildreth-Lu. Nese caso afínanse os resultados utilizando o método de
Cochrane-Orcutt, agás que especifiques a opción --no-corc. Esta opción
--no-corc ignórase para estimadores diferentes ao do método de
Hildreth-Lu.
Ruta do menú: /Modelar/Series temporais/Perturbacións AR (MCX)
# arbond Estimation
Argumento: p [ q ] ; depvar indepvars [ ; instrumentos ]
Opcións: --quiet (Non amosa o modelo estimado)
--vcv (Presenta a matriz de covarianzas)
--two-step (Realiza a estimación MXM (GMM) en 2 etapas)
--time-dummies (Engade variables ficticias temporais)
--asymptotic (Desviacións padrón asintóticas sen corrixir)
Exemplos: arbond 2 ; y Dx1 Dx2
arbond 2 5 ; y Dx1 Dx2 ; Dx1
arbond 1 ; y Dx1 Dx2 ; Dx1 GMM(x2,2,3)
Mira tamén arbond91.inp
Realiza a estimación de modelos dinámicos con datos de panel (é dicir,
modelos de panel que inclúen un ou máis retardos da variable dependente)
utilizando o método MXM-DIF establecido por Arellano e Bond (1991).
Consulta "dpanel" para ver os detalles dunha versión actualizada e máis
flexible desta instrución que permite manexar tanto MXM-SIS coma MXM-DIF.
O parámetro p representa a orde da autorregresión da variable dependente.
O parámetro q (opcional) indica o retardo máximo no nivel da variable
dependente que se vai utilizar como instrumento. Cando omites este argumento
ou indicas que é 0, utilízanse todos os retardos dispoñibles.
Debes de indicar a variable dependente no seu nivel pois xa se vai calcular
automaticamente a súa diferenza (posto que este estimador utiliza a
diferenciación para eliminar os efectos individuais). As diferenzas das
variables independentes non se van calcular automaticamente; se queres
utilizar estas diferenzas (o que xeralmente será o caso para variables
cuantitativas habituais, aínda que quizais non para variables ficticias
temporais) debes de xerar primeiro as diferenzas e logo indicar que estas
son regresores.
O último campo (opcional) da instrución é para especificar os
instrumentos. Se non indicas instrumentos, asúmese que todas as variables
independentes son estritamente esóxenas. E se especificas algún
instrumento, debes de incluír na lista algunha variable independente
estritamente esóxena. Con regresores predeterminados, podes utilizar a
función GMM para incluír un rango indicado de retardos en disposición
diagonal por bloques; como se ilustra no terceiro exemplo de arriba. Así, o
primeiro argumento de GMM é o nome da variable en cuestión, o segundo é o
retardo mínimo que se utiliza como instrumento, e o terceiro é o retardo
máximo. Cando indicas o terceiro argumento cun 0, utilízanse todos os
retardos dispoñibles.
Por defecto, preséntanse os resultados da estimación nunha etapa (coas
desviacións padrón robustas), pero podes escoller a estimación en 2
etapas como opción. En ambos casos, proporciónanse as probas de
autocorrelación de orde 1 e 2, así como tamén a proba de
sobreidentificación de Sargan e o estatístico de proba de Wald para a
significación conxunta dos regresores. Cae na conta de que neste modelo
diferenciado, a autocorrelación de primeira orde non é unha ameaza para a
validez do modelo, pero a autocorrelación de segunda orde viola os supostos
estatísticos que o sosteñen.
No caso da estimación en 2 etapas, as desviacións padrón calcúlanse por
defecto utilizando a corrección de mostra finita suxerida por Windmeijer
(2005). As desviacións padrón asintóticas estándar asociadas ao
estimador do método en 2 etapas xeralmente considérase que son unha guía
pouco fiable para a inferencia, pero se queres velas por algunha razón
podes utilizar a opción --asymptotic para inhabilitar así a corrección de
Windmeijer.
Cando indicas a opción --time-dummies, engádese un conxunto de variables
ficticias temporais aos regresores especificados. O número de variables
ficticias é igual ao número máximo de períodos utilizados na estimación
menos un, para evitar multicolinearidade perfecta coa constante. As
variables ficticias introdúcense en niveis; se queres utilizar variables
ficticias temporais en forma de primeiras diferenzas, tes que definir e
engadir estas variables manualmente.
# arch Estimation
Argumentos: nivel depvar indepvars
Exemplo: arch 4 y 0 x1 x2 x3
Neste momento, esta instrución mantense por compatibilidade con versións
anteriores, pero saes gañando se utilizas o estimador máximo verosímil
que ofrece a instrución "garch". Se queres estimar un modelo ARCH sinxelo,
podes usar o GARCH facendo que o seu primeiro parámetro sexa 0.
Estima a especificación indicada do modelo permitindo ARCH
(Heterocedasticidade Condicional Autorregresiva). Primeiro, estímase o
modelo mediante MCO, e logo execútase unha regresión auxiliar, na que se
regresa o erro cadrado da primeira sobre os seus propios valores retardados.
O paso final é a estimación por mínimos cadrados ponderados, utilizando
como ponderacións as inversas das varianzas dos erros axustados coa
regresión auxiliar. (Se varianza que se predí para algunha observación
coa regresión auxiliar non é positiva, entón utilízase no seu lugar o
erro cadrado correspondente).
Os valores alpha presentados debaixo dos coeficientes son os parámetros
estimados do proceso ARCH coa regresión auxiliar.
Consulta tamén "garch" e "modtest" (opción --arch).
# arima Estimation
Argumentos: p d q [ ; P D Q ] ; depvar [ indepvars ]
Opcións: --verbose (Presenta os detalles das iteracións)
--vcv (Presenta a matriz de covarianzas)
--hessian (Mira abaixo)
--opg (Mira abaixo)
--nc (Sen constante)
--conditional (Utiliza Máxima Verosimilitude condicional)
--x-12-arima (Utiliza ARIMA X-12 na estimación)
--lbfgs (Utiliza o maximizador L-BFGS-B)
--y-diff-only (ARIMAX especial; mira abaixo)
--save-ehat (Mira abaixo)
Exemplos: arima 1 0 2 ; y
arima 2 0 2 ; y 0 x1 x2 --verbose
arima 0 1 1 ; 0 1 1 ; y --nc
Advertencia: arma é un alcume aceptable para esta instrución.
Cando non indicas a lista indepvars, estímase un modelo univariante ARIMA
(Autorregresivo, Integrado, de Medias móbiles). Os valores p, d e q
representan a orde autorregresiva (AR), a orde de diferenciación e a orde
de medias móbiles (MA), respectivamente. Podes indicar estes valores en
formato numérico, ou como nomes de variables escalares xa existentes. Por
exemplo, un valor de 1 para d significa que, antes de estimar os parámetros
do ARMA, debe de tomarse a primeira diferenza da variable dependente.
Se queres incluír no modelo só retardos AR ou MA específicos (en
contraposición a todos os retardos ata un nivel indicado) podes substituír
por p e/ou q ben (a) o nome dunha matriz definida previamente que contén un
conxunto de valores enteiros, ou ben (b) unha expresión tal como {1,4}; é
dicir, un conxunto de retardos separados con comas e contornados entre
chaves.
Os valores enteiros P, D e Q (opcionais) representan a orde AR estacional, a
orde de diferenciación estacional e a orde MA estacional, respectivamente.
Estas ordes só as podes aplicar cando os datos teñen unha frecuencia maior
ca 1 (por exemplo, con datos trimestrais ou mensuais); e podes indicalas en
formato numérico ou como variables escalares.
No caso univariante, por defecto inclúese unha ordenada na orixe no modelo
pero podes eliminar isto por medio da opción --nc. Cando engades indepvars,
o modelo vólvese un ARMAX; neste caso, debes de incluír a constante
explicitamente se queres ter a ordenada na orixe (como no segundo exemplo de
arriba).
Dispós dunha forma alternativa de sintaxe para esta instrución: se non
queres aplicar diferenzas (nin estacionais nin non estacionais), podes
omitir os dous campos d e D á vez, mellor que introducir explicitamente 0.
Ademais, arma é un alias ou sinónimo de arima e así, por exemplo, a
seguinte instrución é un xeito válido de especificar un modelo ARMA(2,
1):
arma 2 1 ; y
Por defecto, utilízase a funcionalidade ARMA "propia" de Gretl, coa
estimación Máximo Verosímil (MV) exacta utilizando o filtro de Kalman;
pero dispós da opción de facer a estimación mediante MV condicional. (Se
o programa ARIMA X-12 está instalado no ordenador, tes a posibilidade de
utilizalo en vez do código propio.) Para outros detalles relacionados con
estas opcións, consulta o Guía de usuario de Gretl (Capítulo 27).
Cando se utiliza o código propio de MV exacta, as desviacións padrón
estimadas baséanse por defecto nunha aproximación numérica á (inversa
negativa da) matriz Hessiana, cun último recurso ao Produto Externo do
vector Gradiente (PEG) se o cálculo da matriz Hessiana numérica puidera
fallar. Podes utilizar dous indicadores de opción (mutuamente excluíntes)
para forzar esta cuestión: mentres que a opción --opg forza a utilización
do método PEG, sen intentar calcular a matriz Hessiana, a opción --hessian
inhabilita o último recurso a PEG. Ten en conta que un fallo no cálculo da
matriz Hessiana numérica é xeralmente un indicador de que un modelo está
mal especificado.
A opción --lbfgs é específica da estimación que utiliza código ARMA
propio e Máxima Verosimilitude exacta, e solicita que se utilice o
algoritmo de "memoria limitada" L-BFGS-B en vez do maximizador BFGS
habitual. Isto pode ser de axuda nalgúns casos nos que a converxencia é
difícil de acadar.
A opción --y-diff-only é específica da estimación de modelos ARIMAX
(modelos cunha orde de integración non nula, nos que se inclúen regresores
esóxenos) e aplícase só cando se utiliza a Máxima Verosimilitude exacta
propia de Gretl. Para eses modelos, o comportamento por defecto consiste en
calcular as primeiras diferenzas tanto da variable dependente como dos
regresores, pero cando indicas esta opción, só se calcula para a variable
dependente, quedando os regresores en niveis.
A opción --save-ehat só pode aplicarse cando se utiliza a estimación
Máximo Verosímil exacta propia de Gretl. O seu efecto consiste en que te
permite dispoñer dun vector que contén a estimación óptima ata o
período t da perturbación ou innovación de data t, e que podes recuperar
co accesorio $ehat. Estes valores difiren das series cos erros ($uhat) que
conteñen os erros das predicións adiantadas un paso.
O valor do AIC de Akaike indicado en conexión con modelos ARIMA, calcúlase
de acordo coa definición que utiliza o ARIMA X-12, concretamente
AIC = -2L + 2k
onde L é o logaritmo da verosimilitude e k é o número total de
parámetros estimados. Observa que o ARIMA X-12 non produce criterios de
información tales como AIC cando a estimación é por Máxima
Verosimilitude condicional.
As raíces AR e MA amosadas en conexión coa estimación ARMA baséanse na
seguinte representación dun proceso ARMA(p, q):
(1 - a_1*L - a_2*L^2 - ... - a_p*L^p)Y =
c + (1 + b_1*L + b_2*L^2 + ... + b_q*L^q) e_t
Polo tanto, as raíces AR son as solucións a
1 - a_1*z - a_2*z^2 - ... - a_p*L^p = 0
e a estabilidade require que estas raíces se atopen fóra do círculo de
radio unitario.
A cantidade "Frecuencia" presentada en conexión coas raíces AR e MA é o
valor lambda que soluciona z = r * exp(i*2*pi*lambda) onde z é a raíz en
cuestión e r é o seu módulo.
Ruta do menú: /Modelar/Series temporais/ARIMA
# arma Estimation
Consulta "arima"; arma é un alcume.
# biprobit Estimation
Argumentos: depvar1 depvar2 indepvars1 [ ; indepvars2 ]
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para aclaración)
--opg (Mira abaixo)
--save-xbeta (Mira abaixo)
--verbose (Presenta información adicional)
Exemplos: biprobit y1 y2 0 x1 x2
biprobit y1 y2 0 x11 x12 ; 0 x21 x22
Mira tamén biprobit.inp
Estima un modelo probit bivariante utilizando o método de Newton-Raphson
para maximizar a verosimilitude.
A lista de argumentos comeza coas dúas variables (binarias) dependentes,
seguidas dunha lista de regresores. Cando indicas unha segunda lista,
separada por un punto e coma, esta se entende como un grupo de regresores
específicos da segunda ecuación, sendo indepvars1 específica da primeira
ecuación; noutro caso, indepvars1 considérase que representa un conxunto
de regresores común.
Por defecto, as desviacións padrón calcúlanse utilizando unha
aproximación numérica á matriz Hessiana ao converxer. Pero se indicas a
opción --opg, a matriz de covarianzas baséase no Produto Externo do vector
Gradiente (PEG ou OPG); ou se indicas a opción --robust, calcúlanse as
desviacións padrón case que máximo verosímiles (QML), utilizando un
"emparedado" entre a inversa da matriz Hessiana e o PEG.
Logo dunha estimación correcta, o accesorio $uhat permite recuperar unha
matriz con 2 columnas que contén os erros xeneralizados das dúas
ecuacións; é dicir, os valores agardados das perturbacións condicionadas
aos resultados observados e ás variables covariantes. Por defecto, $yhat
permite recuperar unha matriz con 4 columnas que contén as probabilidades
estimadas dos 4 posibles resultados conxuntos para (y_1, y_2), na orde
(1,1), (1,0), (0,1), (0,0). Alternativamente, cando indicas a opción
--save-xbeta, entón $yhat ten 2 columnas e contén os valores das funcións
índice das ecuacións respectivas.
O resultado inclúe unha proba de Razón de Verosimilitudes respecto á
hipótese nula de que as perturbacións das dúas ecuacións non están
correlacionadas.
# boxplot Graphs
Argumento: listavariables
Opcións: --notches (Amosa o intervalo do 90 por cento para a mediana)
--factorized (Mira abaixo)
--panel (Mira abaixo)
--matrix=nome (Representa as columnas da matriz indicada)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Estas gráficas amosan a distribución dunha variable. Unha caixa central
encerra o 50 por cento central dos datos; i.e. está deslindado polo
primeiro e terceiro cuartís. Un "bigote" esténdese desde cada límite da
caixa cun rango igual a 1.5 veces o rango intercuartil. As observacións que
están fóra dese rango considéranse valores atípicos e represéntanse
mediante puntos. Debúxase unha liña ao largo da caixa na mediana. O signo
"+" utilízase para indicar a media. Se escolles a opción de amosar un
intervalo de confianza para a mediana, este calcúlase mediante o método
bootstrap e amósase con formato de liñas con raias horizontais por arriba
e/ou abaixo da mediana.
A opción --factorized te permite examinar a distribución da variable
elixida condicionada ao valor de algún factor discreto. Por exemplo, se un
conxunto de datos contén unha variable cos salarios e unha variable
ficticia co xénero, podes escoller a dos salarios como obxectivo e a do
xénero como o factor, para ver así as gráficas de caixas de salarios de
homes e mulleres unha a carón da outra, como en
boxplot salario xenero --factorized
Ten en conta que neste caso debes de especificar exactamente só dúas
variables, co factor indicado en segundo lugar.
Cando tes un conxunto vixente de datos de panel e especificas só unha
variable, a opción --panel produce unha serie de gráficas de caixas (unha
a carón da outra) na que cada unha se corresponde cun grupo ou "unidade" do
panel.
Xeralmente requírese o argumento listavariables que se refire a unha ou
máis series do conxunto vixente de datos (indicadas ben polo nome ou ben
polo número ID). Pero se indicas mediante a opción --matrix unha matriz xa
definida, este argumento convértese en opcional pois, por defecto,
debúxase unha gráfica para cada columna da matriz especificada.
As gráficas de caixas en Gretl xéranse utilizando a instrución gnuplot, e
resulta posible especificar con maior detalle a gráfica engadindo
instrucións adicionais de Gnuplot, contornadas entre chaves. Para obter
máis detalles, consulta a axuda para a instrución "gnuplot".
En modo interactivo, o resultado amósase inmediatamente. En modo de
procesamento por lotes, o proceder por defecto é que se escribe un ficheiro
de instrucións de Gnuplot no cartafol de traballo do usuario, cun nome co
padrón gpttmpN.plt, comezando con N = 01. Podes xerar as gráficas máis
tarde utilizando o gnuplot (ou ben wgnuplot baixo MS Windows). Podes
modificar este comportamento mediante o uso da opción
--output=nomeficheiro. Se queres obter máis detalles, consulta a
instrución "gnuplot".
Ruta do menú: /Ver/Gráfica de variables indicadas/Gráficas de caixa
# break Programming
Fuxida dun bucle. Podes utilizar esta instrución só dentro dun bucle; iso
provoca que a execución de instrucións fuxa do bucle actual (do máis
interior, se hai varios aniñados). Consulta tamén "loop".
# catch Programming
Sintaxe: catch command
Esta non é unha instrución por si mesma pero podes utilizala como prefixo
na maioría das instrucións habituais: o seu efecto é o de previr que
remate dun guión de instrucións se ocorre un fallo ao executar unha delas.
Se aparece un fallo, isto rexístrase cun código de fallo interno ao que
podes acceder con $error (un valor de 0 indica éxito). Inmediatamente
despois de utilizar catch debería de verificarse sempre cal é o valor de
$error, e tomarse unha acción axeitada se fallou unha das instrucións.
Non podes utilizar a palabra chave catch antes de if, elif ou endif.
Ademais, non debe de utilizarse en peticións a funcións definidas polo
usuario pois preténdese utilizar só coas instrucións de Gretl e coas
peticións aos operadores ou funcións "internos".
# chow Tests
Variantes: chow obs
chow dummyvar --dummy
Opcións: --dummy (Utiliza unha variable ficticia xa existente)
--quiet (Non presenta as estimacións do modelo ampliado)
--limit-to=lista (Limita a proba a un subconxunto de regresores)
Exemplos: chow 25
chow 1988:1
chow muller --dummy
Debe de ir a continuación dunha regresión MCO (OLS). Se indicas un número
de observación ou unha data, proporciona unha proba respecto á hipótese
nula de que non existe cambio estrutural no punto de corte indicado. O
procedemento consiste en crear unha variable ficticia que toma o valor 1
desde o punto de corte especificado por obs ata o final da mostra, e 0
noutro caso, así como xerar termos de interacción entre esa ficticia e os
regresores orixinais. Se indicas unha ficticia, próbase esa hipótese nula
de homoxeneidade estrutural respecto desa variable ficticia e tamén
engádense termos de interacción. En cada caso execútase unha regresión
ampliada incluíndo os termos adicionais.
Por defecto, calcúlase un estatístico F, considerando a regresión
ampliada como o modelo sen restricións e o modelo orixinal como o
restrinxido. Pero se o modelo orixinal utilizou un estimador robusto para a
matriz de covarianzas, o estatístico de proba é un de Wald con
distribución khi-cadrado e co seu valor baseado nun estimador robusto da
matriz de covarianzas da regresión ampliada.
Podes utilizar a opción --limit-to para limitar o conxunto de termos de
interacción coa variable ficticia de corte a un subconxunto dos regresores
orixinais. O argumento para esta opción debe de ser unha lista xa definida
na que todos os seus elementos estean entre os regresores orixinais e non
debe de incluír a constante.
Ruta do menú: Fiestra de modelo: Probas/Proba de Chow
# clear Programming
Opción: --dataset (Libra só o conxunto de datos)
Sen ningunha opción, quita da memoria todos os obxectos gardados,
incluíndo o conxunto de datos (se hai algún). Ten en conta que tamén tes
este efecto ao abrir un novo conxunto de datos ou ao utilizar a instrución
"nulldata" para crear un conxunto de datos baleiro; por iso normalmente non
necesitas utilizar "clear".
Cando indicas a opción --dataset, entón só se limpa o conxunto de datos
(máis calquera lista de series definida); outros obxectos gardados como
matrices e escalares xa definidos vanse conservar.
# coeffsum Tests
Argumento: listavariables
Exemplos: coeffsum xt xt_1 xr_2
Mira tamén restrict.inp
Debe de ir despois dunha regresión. Calcula a suma dos coeficientes das
variables do argumento listavariables. Presenta esta suma xunto coa súa
desviación padrón e a probabilidade asociada ao estatístico para probar a
hipótese nula de que a suma é cero.
Ten en conta a diferenza entre isto e a instrución "omit", pois esta
última te permite probar a hipótese nula de que os coeficientes dun
subconxunto especificado de variables independentes son todos nulos.
Ruta do menú: Fiestra de modelo: Probas/Suma dos coeficientes
# coint Tests
Argumentos: nivel depvar indepvars
Opcións: --nc (Sen constante)
--ct (Con constante e tendencia)
--ctt (Con constante máis tendencia linear e cadrada)
--skip-df (Sen probas DF sobre as variables individuais)
--test-down[=criterio] (Nivel de retardos automático)
--verbose (Presenta detalles adicionais das regresións)
--silent (Non presenta nada)
Exemplos: coint 4 y x1 x2
coint 0 y x1 x2 --ct --skip-df
Proba de cointegración de Engle-Granger (1987). O proceso por defecto
consiste en: (1) realizar as probas de Dickey-Fuller respecto á hipótese
nula de que cada unha das variables enumeradas ten unha raíz unitaria; (2)
estimar a regresión de cointegración; e (3) facer unha proba DF respecto
aos erros que comete a regresión de cointegración. Cando se indica a
opción --skip-df, omítese o paso (1).
Se o nivel especificado de retardos é positivo, todas as probas de
Dickey-Fuller usan ese nivel pero con este requisito: cando se indica a
opción --test-down, o valor indicado tómase como un máximo, e o nivel de
retardos concreto que se utilizará en cada caso obtense probando cara
abaixo. Consulta a instrución "adf" para obter máis detalles sobre este
procedemento.
Por defecto, a regresión de cointegración contén unha constante pero, se
queres eliminar a constante, engade a opción --nc. Se queres ampliar a
lista de termos determinísticos na regresión de cointegración con
tendencia linear (ou linear e cadrada), engade a opción --ct (ou --ctt).
Estes indicadores de opción son mutuamente excluíntes.
Os valores P (probabilidades asociadas) desta proba baséanse en MacKinnon
(1996). O código relevante inclúese co amable permiso do propio autor.
Ruta do menú: /Modelar/Series temporais/Multivariante
# coint2 Tests
Argumentos: nivel ylista [ ; xlista ] [ ; rxlista ]
Opcións: --nc (Sen constante)
--rc (Constante restrinxida)
--uc (Constante non restrinxida)
--crt (Constante e tendencia restrinxida)
--ct (Constante e tendencia non restrinxida)
--seasonals (Inclúe variables ficticias estacionais centradas)
--asy (Garda os valores p asintóticos)
--quiet (Presenta só as probas)
--silent (Non presenta nada)
--verbose (Presenta detalles das regresións auxiliares)
Exemplos: coint2 2 y x
coint2 4 y x1 x2 --verbose
coint2 3 y x1 x2 --rc
Leva a cabo a proba de cointegración de Johansen entre as variables de
ylista para o nivel de retardos seleccionado. Para obter máis detalles
sobre esta proba, consulta o Guía de usuario de Gretl (Capítulo 29) ou o
capítulo 20 de Hamilton (1994). As probabilidades asociadas (valores p)
calcúlanse mediante a aproximación Gamma de Doornik (Doornik, 1998).
Amósanse dous conxuntos de valores p para a proba da traza: valores
asintóticos directos e valores axustados polo tamaño da mostra. Por
defecto, o accesorio "$pvalue" xera a variante axustada, pero podes utilizar
a opción --asy para obter no seu lugar os valores asintóticos.
A inclusión de termos determinísticos no modelo contrólase mediante os
indicadores de opción. Por defecto, se non especificas ningunha opción,
inclúese unha "constante non restrinxida", que permite a presenza dunha
ordenada na orixe non nula nas relacións de cointegración, así como unha
tendencia nos niveis das variables endóxenas. Na literatura xerada a partir
do traballo de Johansen (por exemplo, consulta o seu libro de 1995)
refírese esta situación como o "caso 3". As 4 primeiras opcións indicadas
arriba, que son mutuamente excluíntes, producen respectivamente os casos 1,
2, 4 e 5. Tanto o significado destes casos como o criterio para seleccionar
un caso explícanse no Guía de usuario de Gretl (Capítulo 29).
As listas xlista e rxlista (opcionais) te permiten controlar as variables
esóxenas especificadas, e así estas entran no sistema ben sen restricións
(xlista) ou ben restrinxidas ao espazo de cointegración (rxlista). Estas
listas sepáranse de ylista e unhas das outras mediante un punto e coma.
A opción --seasonals, que podes combinar con calquera das outras opcións,
especifica a inclusión dun conxunto de variables ficticias estacionais
centradas. Esta opción está dispoñible só para datos trimestrais ou
mensuais.
A seguinte táboa ofrécese como guía para a interpretación dos resultados
da proba que se amosan, para o caso con 3 variables. H0 denota a hipótese
nula, H1 a hipótese alternativa, e c o número de relacións de
cointegración.
Rango Proba traza Proba Lmáx
H0 H1 H0 H1
---------------------------------------
0 c = 0 c = 3 c = 0 c = 1
1 c = 1 c = 3 c = 1 c = 2
2 c = 2 c = 3 c = 2 c = 3
---------------------------------------
Consulta tamén a instrución "vecm".
Ruta do menú: /Modelar/Series temporais/Multivariante
# corr Statistics
Variantes: corr [ listavariables ]
corr --matrix=nomematr
Opcións: --uniform (Garante unha mostra uniforme)
--spearman (Rho de Spearman)
--kendall (Tau de Kendall)
--verbose (Presenta xerarquías)
--plot=modo-ou-nomeficheiro (Mira abaixo)
Exemplos: corr y x1 x2 x3
corr ylista --uniform
corr x y --spearman
corr --matrix=X --plot=display
Por defecto, presenta os coeficientes de correlación (correlación
produto-momento de Pearson) por pares das variables de listavariables, ou de
tódalas variables do conxunto de datos se non indicas listavariables. O
comportamento típico desta instrución consiste en utilizar todas as
observacións dispoñibles para calcular cada coeficiente por parellas de
variables, pero cando indicas a opción --uniform, a mostra limítase (se é
necesario) de xeito que se utiliza o mesmo conxunto de observacións para
todos os coeficientes. Esta opción é adecuada só cando hai un número
diferente de valores ausentes nas variables utilizadas.
As opcións --spearman e --kendall (que son mutuamente excluíntes) permiten
calcular, respectivamente, o coeficiente rho de correlación por rangos de
Spearman e o coeficiente tau de correlación por rangos de Kendall en
troques do coeficiente de Pearson (por defecto). Cando indicas algunha
destas opcións, listavariables debe de conter só dúas variables.
Cando se calcula unha correlación por rangos, podes utilizar a opción
--verbose para presentar os datos orixinais e a súa xerarquía (noutro
caso, esta alternativa ignórase).
Se listavariables contén máis de dúas series e o programa non está en
modo de procesamento por lotes, amósase unha gráfica de "mapa de calor" da
matriz de correlacións. Podes axustar isto mediante a opción --plot, na
que os parámetros que se admiten son: none (para non amosar a gráfica),
display (para presentar a gráfica mesmo cando se estea en modo de
procesamento por lotes), ou un nome de ficheiro. O efecto de indicar un nome
de ficheiro é como o descrito para a opción --output da instrución
"gnuplot". Cando activas a representación da gráfica, podes utilizar a
opción adicional --triangle para amosar só o mapa de calor do triángulo
inferior da matriz.
Cando indicas unha forma alternativa, utilizando unha matriz xa definida en
lugar dunha lista de series, as opcións --spearman e --kendall non están
dispoñibles (pero consulta a función "npcorr").
Ruta do menú: /Ver/Matriz de correlacións
Outro acceso: Fiestra principal: Menú emerxente (selección múltiple)
# corrgm Statistics
Argumentos: serie [ nivel ]
Opcións: --bartlett (Utiliza as desviacións padrón de Bartlett)
--plot=modo-ou-nomeficheiro (Mira abaixo)
Exemplo: corrgm x 12
Presenta os valores da función de autocorrelación (FAC ou ACF) do
argumento serie, que pode especificarse polo seu nome ou número. Os valores
defínense como rho(u_t, u_t-s) onde u_t é a t-ésima observación da
variable u e s denota o número de retardos.
Tamén se presentan as autocorrelacións parciais (FACP ou PACF, que se
calculan utilizando o algoritmo de Durbin-Levinson), e que están libres dos
efectos dos retardos intermedios. Ademais, preséntase o estatístico Q de
Ljung-Box que podes utilizar para probar a hipótese nula de que a serie é
un "ruído branco", e que se distribúe asintoticamente como unha
khi-cadrado con tantos graos de liberdade como o número de retardos
utilizados.
Utilízanse asteriscos para indicar a significación estatística das
autocorrelacións individuais. Por defecto, isto avalíase utilizando unha
desviación padrón igual ao cociente entre 1 e a raíz cadrada do tamaño
da mostra; pero cando indicas a opción --bartlett, entón utilízanse as
desviacións padrón de Bartlett para a FAC. Se resulta aplicable, esta
opción tamén determina a banda de confianza que se debuxa na gráfica da
FAC.
Se especificas un valor para nivel, a lonxitude do correlograma limítase
ata ese número de retardos como máximo; noutro caso, a longura
determínase automaticamente como unha función da frecuencia dos datos e do
número de observacións.
Por defecto, xérase unha gráfica do correlograma: unha gráfica de Gnuplot
en modo interactivo ou unha gráfica ASCII en modo de procesamento por
lotes. Isto podes axustalo mediante a opción --plot na que os parámetros
que se admiten son: none (para non amosar a gráfica), ascii (para presentar
unha gráfica de texto mesmo en modo interactivo), display (para presentar
unha gráfica de Gnuplot mesmo en modo de procesamento por lotes); ou un
nome de ficheiro. O efecto de indicar un nome de ficheiro é como o descrito
para a opción --output da instrución "gnuplot".
Cando se completa con éxito esta instrución, os accesorios "$test" e
"$pvalue" conteñen os dous valores respectivos da proba de Ljung-Box para o
máximo nivel de retardo presentado. Se unicamente queres calcular o
estatístico Q, ten en conta que probablemente será preferible que utilices
en troques a función "ljungbox".
Ruta do menú: /Variable/Correlograma
Outro acceso: Fiestra principal: Menú emerxente (selección única)
# cusum Tests
Opcións: --squares (Realiza a proba CUSUMSQ)
--quiet (Só presenta a proba de Harvey-Collier)
Debe de ir despois da estimación dun modelo mediante MCO. Te permite levar
adiante a proba CUSUM de estabilidade dos parámetros (ou a proba CUSUMSQ se
indicas a opción --squares). Vas obter unha serie cos erros de predición
adiantados un paso, executando unha serie de regresións: na primeira
regresión se utilizan as primeiras k observacións e permíteche xerar a
predición da variable dependente na observación k + 1; na segunda se
utilizan as primeiras k + 1 observacións e xera unha predición para a
observación k + 2, e así sucesivamente (onde k é o número de parámetros
do modelo orixinal).
Preséntase e debúxase a suma acumulada dos erros de predición escalados
(ou os cadrados destes erros). A hipótese nula de estabilidade dos
parámetros rexéitase cun nivel de significación do 5 por cento cando a
suma acumulada se afasta da banda de confianza do 95 por cento.
No caso da proba CUSUM, tamén se presenta o estatístico t de
Harvey-Collier para probar a hipótese nula de estabilidade dos parámetros.
Consulta o libro Econometric Analysis de Greene para obter máis detalles.
Para a proba CUSUMSQ, calcúlase a banda de confianza do 95 por cento
utilizando o algoritmo indicado en Edgerton e Wells (1994).
Ruta do menú: Fiestra de modelo: Probas/Proba CUSUM(SQ)
# data Dataset
Argumento: listavariables
Opcións: --compact=metodo (Especifica o método para compactar)
--interpolate (Fai a interpolación para datos de baixa frecuencia)
--quiet (Non amosa os resultados agás no caso de fallo)
Le as variables de listavariables dun banco de datos (Gretl, RATS 4.0 ou
PcGive) que debe de abrirse previamente utilizando a instrución "open".
Podes establecer a frecuencia dos datos e o rango da mostra mediante as
instrucións "setobs" e "smpl" antes de utilizar esta instrución. Este é
un exemplo completo:
open macrodat.rat
setobs 4 1959:1
smpl ; 1999:4
data GDP_JP GDP_UK
As instrucións de arriba abren un banco de datos chamado macrodat.rat,
determinan que os datos son de tipo trimestral, que comezan no primeiro
trimestre de 1959, que a mostra finaliza no cuarto trimestre de 1999, e logo
importan as series denominadas GDP_JP e GDP_UK.
Se non especificas setobs e smpl deste xeito, a frecuencia dos datos e o
rango da mostra establécense utilizando a primeira variable que se le do
banco de datos.
Se as series que se van ler son de frecuencia maior que o conxunto de datos
de traballo, podes especificar un método para compactar como aquí debaixo:
data LHUR PUNEW --compact=average
Os cinco métodos que permiten compactar dos que dispós son estes:
"average" (toma a media das observacións de alta frecuencia), "last"
(utiliza a última observación), "first", "sum" e "spread", pero se non
especificas ningún método, por defecto utilízase a media. O método
"spread" é especial pois con el non se perde ningunha información, senón
que máis ben esta espállase entre varias series, unha por cada
subperíodo. Así con ela cando engades, por exemplo, unha serie mensual a
un conxunto de datos trimestrais, xéranse 3 series (unha por cada mes do
trimestre) cuxos nomes conteñen os sufixos m01, m02 e m03.
Cando as series que se len son de frecuencia menor que a do conxunto de
datos de traballo, por defecto repítense os valores dos datos engadidos
segundo se necesite. Pero podes utilizar a opción --interpolate para
solicitar que se faga a interpolación utilizando o método de Chow e Lin
(1971) no que os regresores son unha constante máis unha tendencia linear e
cadrada, e asúmese que a perturbación segue un AR(1). Porén, ten en conta
que dispós desta opción só para converter datos trimestrais en mensuais,
ou datos anuais en trimestrais.
No caso de bancos de datos propios (unicamente) de Gretl, podes utilizar os
caracteres "xenéricos", * e ? en listavariables para importar series que
coincidan co padrón indicado. Por exemplo, a seguinte expresión vai
importar todas as series do banco de datos cuxos nomes comecen por cpi:
data cpi*
Ruta do menú: /Ficheiro/Bancos de datos
# dataset Dataset
Argumentos: chave parametros
Exemplos: dataset addobs 24
dataset insobs 10
dataset compact 1
dataset compact 4 last
dataset expand interp
dataset transpose
dataset sortby x1
dataset resample 500
dataset renumber x 4
dataset pad-daily 7
dataset clear
Realiza diversas operacións no conxunto de datos como un todo, dependendo
da chave indicada, que debe de ser: addobs, insobs, clear, compact, expand,
transpose, sortby, dsortby, resample, renumber ou pad-daily. Advertencia:
Coa excepción da opción clear, estas accións non están dispoñibles
mentres teñas unha submostra do conxunto de datos escollida por selección
dos casos segundo algún criterio booleano.
addobs: Debe de estar seguido dun enteiro positivo. Engade o número
especificado de observacións adicionais ao final do conxunto de datos de
traballo. Isto está pensado principalmente co propósito de facer
predicións. Os valores da maioría das variables ao longo do rango engadido
vanse estipular como ausentes, pero certas variables determinísticas se
recoñecen e o seu contido esténdese ao rango engadido, en concreto, as
variables con tendencia linear simple e as variables ficticias periódicas.
insobs: Debe de estar seguido dun enteiro positivo non maior ca o número
vixente de observacións, que especifica a posición na que se insire unha
única observación. Todos os datos posteriores desprázanse un lugar e o
conxunto de datos amplíase nunha observación. Agás á constante,
dánselle valores ausentes a todas as variables na nova observación. Esta
acción non está dispoñible para conxuntos de datos de panel.
clear: Non necesita ningún parámetro. Libra todos os datos vixentes,
devolvendo o Gretl a o seu estado "baleiro" inicial.
compact: Debe de estar seguido dun enteiro positivo que represente a nova
frecuencia dos datos, e que debe de ser menor que a frecuencia vixente (por
exemplo, indicar un valor de 4 cando a frecuencia vixente é 12, indica que
se van compactar os datos de mensuais a trimestrais). Esta instrución só
está dispoñible para datos de series temporais e compacta todas as series
do conxunto de datos a unha nova frecuencia. Tamén podes indicar un segundo
parámetro, en concreto un de entre sum, first, last ou spread. Estes
permiten especificar que se vai compactar, respectivamente: utilizando a
suma dos valores de frecuencia maior, o valor de inicio-de-período, o valor
de fin-de-período, ou espallando os valores de frecuencia maior entre
varias series (unha por cada subperíodo), pois por defecto faise usando a
media.
expand: Esta instrución só está dispoñible para datos de series
temporais anuais ou trimestrais, pois os datos anuais pódense estender a
trimestrais e os datos trimestrais a frecuencia mensual. Por defecto, todas
as series do conxunto de datos énchense coa nova frecuencia repetindo os
valores existentes, pero se engades o parámetro interp, entón a serie
esténdese utilizando a interpolación de Chow-Lin (para os detalles,
consulta Chow e Lin, 1971) na que os regresores son unha constante máis
unha tendencia linear e cadrada, e asúmese que a perturbación segue un
AR(1).
transpose: Non necesita ningún parámetro adicional. Traspón o conxunto
vixente de datos, é dicir, cada observación (fila) do conxunto vixente de
datos vaise tratar como unha variable (columna), e cada variable como unha
observación. Esta instrución pode serte útil se os datos se leron
dalgunha orixe externa na que as filas da táboa de datos representan
variables.
sortby: Requírese o nome dunha única serie ou lista. Cando indicas unha
serie, as observacións de todas as variables do conxunto de datos vólvense
ordenar segundo os valores ascendentes da serie especificada. Cando indicas
unha lista, a reordenación faise xerarquicamente: se hai observacións
empatadas ao reordenarse segundo a primeira variable chave, entón a segunda
chave utilízase para rachar o empate, e así sucesivamente ata que se rache
o empate ou se esgoten as chaves. Cae na conta de que esta instrución está
dispoñible só para datos sen data.
dsortby: Funciona como sortby agás que a reordenación faise segundo os
valores descendentes da serie chave.
resample: Constrúe un novo conxunto de datos mediante mostraxe aleatoria
(con substitución) das filas do conxunto vixente de datos, e require que
indiques como argumento o número concreto de filas que queres incluír.
Este pode ser menor, igual ou maior ca o número de observacións dos datos
orixinais. Podes recuperar o conxunto orixinal de datos mediante a
instrución smpl full.
renumber: Require o nome dunha serie xa existente seguida dun número
enteiro entre 1 e o número de series do conxunto de datos menos 1. Move a
serie especificada á posición indicada do conxunto de datos, volvendo
numerar as demais series conforme a isto. (A posición 0 ocúpase coa
constante, que non pode moverse.)
pad-daily: Válido só cando o conxunto vixente de datos contén datos con
datas diarias cun calendario incompleto. Ten como efecto encher os datos nun
calendario completo inserindo filas en branco (é dicir, filas que non
conteñen nada agás NAs). Esta opción require un número enteiro como
parámetro, concretamente o número de días por semana (5, 6 ou 7) e que
debe de ser maior ou igual que a frecuencia vixente dos datos. Cando se
completa con éxito, o calendario de datos vai estar "completo" en relación
a este valor. Por exemplo, se días-por-semana é igual a 5, entón
represéntanse tódolos días laborables, haxa ou non algún dato
dispoñible para eses días.
Ruta do menú: /Datos
# debug Programming
Argumento: función
Depurador experimental para funcións definidas polo usuario, que está
dispoñible no programa Gretlcli de liñas de instrucións e na consola de
Interface Gráfica de Usuario (GUI). Debes de invocar esta instrución debug
despois de que estea definida a función en cuestión, pero antes de chamar
por ela. O efecto desta instrución consiste en que a execución detense
cando se chama pola función e amósase un indicador especial.
Ante o indicador de depuración podes teclear next para executar a seguinte
instrución da función, ou continue para permitir que a execución da
función continúe sen trabas; e podes acurtar estas instrucións mediante n
e c, respectivamente. Tamén podes intercalar unha instrución ao aparecer
este indicador; por exemplo, a instrución print para revelar o valor actual
dalgunha variable de interese.
# delete Dataset
Variantes: delete listavariables
delete nomevar
delete --type=tipo
deletenomepaquete
Opción: --db (Elimina series do banco de datos)
Esta instrución é un destrutor. Deberías de utilizala con precaución
pois non se pide confirmación.
Na primeira variante de arriba, listavariables é unha lista de series,
indicada polo seu nome ou número ID. Ten en conta que cando eliminas
series, vólvese a numerar calquera serie cuxo número ID sexa maior que os
das series da lista que se elimina. Se indicas a opción --db, as series da
lista non se eliminan con esta instrución do conxunto vixente de datos,
pero si do banco de datos de Gretl (supoñendo que se abriu un deles e que o
usuario ten permisos para escribir no ficheiro en cuestión). Consulta
tamén a instrución "open".
Na segunda variante, podes indicar o nome dun escalar, dunha matriz, dunha
cadea de texto ou dun feixe para que se elimine. A opción --db non pode
aplicarse neste caso. Ten en conta que non debes de mesturar series e
variables de diferentes tipos nunha mesma chamada a delete.
Na terceira variante, a opción --type debes de acompañala por algún dos
seguintes nomes de tipos: matrix, bundle, string, list, scalar ou array; e o
seu efecto consiste en eliminar tódalas variables do tipo indicado. Neste
caso non debes de indicar ningún argumento que non sexa a opción.
Podes usar a cuarta variante para descargar un paquete de función. Neste
caso, debes de proporcionar o sufixo .gfn como en
delete somepkg.gfn
Cae na conta de que isto non elimina o ficheiro de paquete; unicamente
descarga o paquete da memoria.
Ruta do menú: Fiestra principal: Menú emerxente (selección única)
# diff Transformations
Argumento: listavariables
Con esta instrución obtés a primeira diferenza de cada variable de
listavariables, e o resultado gárdase nunha nova variable co prefixo d_.
Así "diff x y" xera as novas variables
d_x = x(t) - x(t-1)
d_y = y(t) - y(t-1)
Ruta do menú: /Engadir/Primeiras diferenzas das variables seleccionadas
# difftest Tests
Argumentos: serie1 serie2
Opcións: --sign (Proba dos signos, por defecto)
--rank-sum (Proba da suma de rangos de Wilcoxon)
--signed-rank (Proba dos rangos con signo de Wilcoxon)
--verbose (Presenta resultados adicionais)
Leva a cabo unha proba non paramétrica sobre a diferenza entre dúas
poboacións ou grupos, na que a proba concreta depende da opción
seleccionada.
Coa opción --sign, realízase a proba dos signos. Esta proba baséase no
feito de que, cando se extraen dúas mostras, x e y, de forma aleatoria
dunha mesma distribución, a probabilidade de que x_i > y_i, para cada
observación i, deberá de ser igual a 0.5. O estatístico de proba é w, é
dicir, o número de observacións para as que se cumpre que x_i > y_i. Baixo
a hipótese nula, este estatístico segue unha distribución de
probabilidade Binomial con parámetros (n, 0.5), onde n indica o número de
observacións.
Coa opción --rank-sum, realízase a proba da suma de rangos de Wilcoxon.
Esta proba desenvólvese determinando o rango en xerarquía das
observacións de ambas mostras xuntas, desde a de menor valor ata a de
maior, e logo calculando a suma dos rangos das observacións dunha calquera
das dúas mostras. Non é necesario que as dúas mostras teñan o mesmo
tamaño e, se son diferentes, utilízase a mostra máis pequena para
calcular a suma dos rangos. Baixo a hipótese nula de que as mostras
proceden de poboacións coa mesma mediana, a distribución de probabilidade
da suma de rangos pode calcularse para calquera tamaño de mostra que se
indique; e para mostras razoablemente longas, existe unha estreita
aproximación Normal.
Coa opción --signed-rank, realízase a proba dos rangos con signo de
Wilcoxon, que está ideada para pares de datos emparellados como, por
exemplo, os pares de valores dunha mesma variable nunha mostra de
individuos, antes e despois dalgún tratamento. A proba desenvólvese
calculando as diferenzas entre as observacións emparelladas x_i - y_i, e
determinando o rango destas diferenzas segundo o seu valor absoluto, ademais
de asignándolle a cada par un rango cun signo que coincide co signo da
diferenza. A continuación calcúlase a suma dos rangos con signo positivo
(W_+). De igual xeito que na proba da suma de rangos, baixo a hipótese nula
de que a diferenza das medianas é cero, este estatístico segue unha
distribución de probabilidade ben definida, que converxe á Normal para
mostras de tamaño razoable.
Para as probas de Wilcoxon, cando indicas a opción --verbose, entón
preséntase a ordenación. (Esta opción non ten efecto cando se selecciona
a proba dos signos.)
# discrete Transformations
Argumento: listavariables
Opción: --reverse (Marca as variables como continuas)
Marca cada variable de listavariables como discreta pois, por defecto, todas
as variables trátanse como continuas. Ao facer que unha variable sexa
discreta, iso afecta ao xeito no que se manexa esa variable nas gráficas de
frecuencia, e tamén te permite escoller a variable para a instrución
"dummify".
Cando especificas a opción --reverse, a operación invértese, é dicir, as
variables contidas en listavariables márcanse como continuas.
Ruta do menú: /Variable/Editar atributos
# dpanel Estimation
Argumento: p ; depvar indepvars [ ; instrumentos ]
Opcións: --quiet (Non amosa o modelo estimado)
--vcv (Presenta a matriz de covarianzas)
--two-step (Realiza a estimación MXM (GMM) en 2 etapas)
--system (Engade ecuacións en niveis)
--time-dummies (Engade variables ficticias temporais)
--dpdstyle (Imita o paquete DPD para Ox)
--asymptotic (Desviacións padrón asintóticas sen corrixir)
Exemplos: dpanel 2 ; y x1 x2
dpanel 2 ; y x1 x2 --system
dpanel {2 3} ; y x1 x2 ; x1
dpanel 1 ; y x1 x2 ; x1 GMM(x2,2,3)
Mira tamén bbond98.inp
Realiza a estimación de modelos dinámicos con datos de panel (é dicir,
modelos de panel que inclúen un ou máis retardos da variable dependente)
utilizando ben o método MXM-DIF ou ben MXM-SYS.
O parámetro p representa o nivel de autorregresión para a variable
dependente. No caso máis sinxelo, este parámetro é un valor escalar, pero
tamén podes indicar unha matriz definida previamente para este argumento,
para especificar con elo un conxunto de retardos (posiblemente non
consecutivos) a utilizar.
Debes de indicar a variable dependente e os regresores cos seus valores en
niveis, pois xa se van diferenciar automaticamente (dado que este estimador
utiliza a diferenciación para eliminar os efectos individuais).
O último campo (opcional) da instrución é para especificar os
instrumentos. Se non indicas ningún instrumento, asúmese que tódalas
variables independentes son estritamente esóxenas. Se especificas calquera
instrumento, debes de incluír na lista calquera variable independente
estritamente esóxena. Para os regresores predeterminados podes utilizar a
función GMM para incluír un rango específico de retardos co estilo
diagonal por bloques, como se ilustra no terceiro exemplo de arriba. O
primeiro argumento de GMM é o nome da variable en cuestión, o segundo é o
retardo mínimo que se utiliza como instrumento, e o terceiro é o retardo
máximo. Podes utilizar a mesma sintaxe coa función GMMlevel para
especificar instrumentos de tipo MXM para as ecuacións en niveis.
Por defecto, preséntanse os resultados da estimación en 1 etapa (coas
desviacións padrón robustas) pero tes a opción de escoller a estimación
en 2 etapas. En ambos casos, preséntanse as probas de autocorrelación de
orde 1 e 2 , así como a proba de sobreidentificación de Sargan e o
estatístico da proba de Wald para a significación conxunta dos regresores.
Ten en conta que neste modelo en diferenzas, a autocorrelación de primeira
orde non é unha ameaza para a validez do modelo, pero a autocorrelación de
segunda orde infrinxe os supostos estatísticos vixentes.
No caso da estimación en 2 etapas, as desviacións padrón calcúlanse por
defecto utilizando a corrección de mostra finita suxerida por Windmeijer
(2005). Xeralmente considérase que as desviacións padrón asintóticas
estándar asociadas ao estimador do método en 2 etapas son unha guía pouco
fiable para a inferencia, pero se por algunha razón queres velas, podes
utilizar a opción --asymptotic para desactivar a corrección de Windmeijer.
Se indicas a opción --time-dummies, engádese un conxunto de variables
ficticias temporais aos regresores especificados. O número destas variables
ficticias é unha menos que o número máximo de períodos usados na
estimación, para evitar que haxa multicolinearidade perfecta coa constante.
As variables ficticias introdúcense en forma de diferenzas agás que se
indique a opción --dpdstyle, en cuxo caso introdúcense en niveis.
Para obter outros detalles e exemplos, consulta o Guía de usuario de Gretl
(Capítulo 20).
Ruta do menú: /Modelar/Panel/Modelo de Panel Dinámico
# dummify Transformations
Argumento: listavariables
Opcións: --drop-first (Exclúe da codificación ao valor máis baixo)
--drop-last (Exclúe da codificación ao valor máis alto)
Para calquera variable adecuada de listavariables, xera un conxunto de
variables ficticias que codifican os distintos valores desa variable. As
variables adecuadas son aquelas que se marcan explicitamente como discretas
ou aquelas que teñen un número claramente pequeno de valores, dos que
todos eles estean "claramente arredondados" (múltiplos de 0.25).
Por defecto, engádese unha variable ficticia por cada valor diferente da
variable en cuestión. Por exemplo, se unha variable discreta x ten 5
valores diferentes, engádense 5 variables ficticias ao conxunto de datos,
cos nomes Dx_1, Dx_2, etcétera. A primeira variable ficticia vai ter o
valor 1 nas observacións onde x toma o seu valor máis pequeno e 0 noutro
caso; a seguinte variable ficticia vai ter o valor 1 nas observacións onde
x toma o seu segundo valor máis pequeno, etcétera. Se engades un dos
indicadores de opción --drop-first ou --drop-last, entón omítese do
proceso de codificación ben o valor máis baixo ou ben o valor máis alto
de cada variable, respectivamente (o que pode serte útil para evitar a
"trampa das variables ficticias").
Tamén podes inserir esta instrución no contexto da especificación dunha
regresión. Por exemplo, a seguinte liña especifica un modelo onde y se
regresa sobre o conxunto de variables ficticias que se codifican para x.
(Non podes aplicar os indicadores de opción a "dummify" neste contexto.)
ols y dummify(x)
Outro acceso: Fiestra principal: Menú emerxente (selección única)
# duration Estimation
Argumentos: depvar indepvars [ ; censuravar ]
Opcións: --exponential (Utiliza a distribución exponential)
--loglogistic (Utiliza a distribución log-loxística)
--lognormal (Utiliza a distribución log-normal)
--medians (Os valores axustados son as medianas)
--robust (Desviacións padrón robustas: CMV (QML))
--cluster=clustervar (Consulta "logit" para explicación)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
Exemplos: duration y 0 x1 x2
duration y 0 x1 x2 ; cens
Estima un modelo de duración no que a variable dependente (que debe de ser
positiva) representa a duración dalgún estado dun asunto; por exemplo, a
duración do período de desemprego para unha sección cruzada de
enquisados. Por defecto, utilízase a distribución de Weibull pero tamén
están dispoñibles as distribucións exponencial, log-loxística e
log-normal.
Se algunhas das medidas de duración están censuradas pola dereita (e.g. o
período do desemprego dun individuo aínda non rematou dentro do período
de observación), entón debes de indicar no argumento posterior censuravar,
unha serie na que os valores non nulos indiquen os casos censurados pola
dereita.
Por defecto, os valores axustados que obtés mediante o accesorio $yhat son
as medias condicionadas das duracións, pero cando indicas a opción
--medians entón $yhat te proporciona as medianas condicionadas no seu
lugar.
Consulta o Guía de usuario de Gretl (Capítulo 34) para obter máis
detalles.
Ruta do menú: /Modelar/Variable Dependente Limitada/Datos de Duración
# elif Programming
Consulta "if".
# else Programming
Consulta "if". Ten en conta que a instrución "else" necesita unha liña
para ela mesma, antes da seguinte instrución condicional. Podes engadirlle
un comentario, como en
else # Correcto, fai algo distinto
Pero non podes engadirlle unha instrución, como en
else x = 5 # Incorrecto!
# end Programming
Termina un bloque de instrucións dalgunha clase. Por exemplo, "end system"
termina un sistema de ecuacións ("system").
# endif Programming
Consulta "if".
# endloop Programming
Marca a fin dun bucle de instrucións. Consulta "loop".
# eqnprint Printing
Opcións: --complete (Xera un documento completo)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Debe de ir despois da estimación dun modelo e presenta o modelo estimado en
formato dunha ecuación LaTeX. Se especificas o nome dun ficheiro utilizando
a opción --output, o resultado diríxese a ese ficheiro; noutro caso,
diríxese a un ficheiro cun nome co estilo equation_N.tex, onde N é o
número de modelos estimados ata ese momento na sesión vixente. Consulta
tamén "tabprint".
O ficheiro resultante vai escribirse no cartafol de traballo ("workdir")
establecido nese momento, agás que a cadea nomeficheiro conteña unha
especificación completa da ruta.
Cando especificas a opción --complete, o ficheiro LaTeX é un documento
completo (listo para procesar); noutro caso, debes de incluílo nun
documento.
Ruta do menú: Fiestra de modelo: LaTeX
# equation Estimation
Argumentos: depvar indepvars
Exemplo: equation y x1 x2 x3 const
Te permite especificar unha das ecuacións dun sistema delas (consulta
"system"). A sintaxe para especificar unha ecuación dun sistema SUR é o
mesmo que para, e.g., "ols". Pero para unha das ecuacións dun sistema a
estimar con Mínimos Cadrados en 3 etapas, podes: (a) indicar unha
especificación dunha ecuación como se estima con MCO e proporcionar unha
lista normal de instrumentos utilizando a palabra chave "instr" (de novo,
consulta "system"), ou (b) utilizar a mesma sintaxe de ecuacións que para
"tsls".
# estimate Estimation
Argumentos: [ nomesistema ] [ estimador ]
Opcións: --iterate (Reitera ata a converxencia)
--no-df-corr (Sen corrección dos graos de liberdade)
--geomean (Mira abaixo)
--quiet (Non presenta os resultados)
--verbose (Presenta os detalles das iteracións)
Exemplos: estimate "Klein Model 1" method=fiml
estimate Sys1 method=sur
estimate Sys1 method=sur --iterate
Solicita a estimación dun sistema de ecuacións que debes de definir
previamente usando a instrución "system". Debes de indicar primeiro o nome
do sistema, contornado entre comiñas se o nome contén espazos. O estimador
debe de ser un dos seguintes: "ols", "tsls", "sur", "3sls", "fiml" ou
"liml"; e debes de poñerlle antes a cadea de texto method=. Estes
argumentos son optativos se o sistema en cuestión xa se estimou e ocupa o
lugar do "último modelo"; nese caso, o estimador que se toma por defecto
será o utilizado previamente.
Se o sistema en cuestión tivo aplicadas un conxunto de restricións
(consulta a instrución "restrict"), a estimación estará suxeita ás
restricións especificadas.
Se o método de estimación é "sur" ou "3sls" e especificas a opción
--iterate, vaise calcular o estimador iterativamente. No caso de SUR, se o
procedemento converxe, os resultados son as estimacións máximo
verosímiles. A iteración de Mínimos Cadrados en 3 Etapas (3sls), porén,
en xeral non converxe aos resultados da máxima verosimilitude con
información completa (fiml). A opción --iterate ignórase para outros
métodos de estimación.
Se elixes os estimadores de ecuación a ecuación "ols" ou "tsls", por
defecto aplícase unha corrección dos graos de liberdade cando se calculan
as desviacións padrón, mais podes eliminar isto utilizando a opción
--no-df-corr. Esta opción non ten efecto cos outros estimadores e así non
se aplica a corrección dos graos de liberdade en ningún caso.
Por defecto, a fórmula utilizada para calcular os elementos da matriz de
covarianzas das ecuacións cruzadas é
sigma(i,j) = u(i)' * u(j) / T
Cando indicas a opción --geomean, aplícase unha corrección dos graos de
liberdade co que a fórmula nese caso é
sigma(i,j) = u(i)' * u(j) / sqrt((T - ki) * (T - kj))
onde as ks denotan o número de parámetros independentes en cada ecuación.
Cando indicas a opción --verbose e especificas un método iterativo,
preséntanse detalles das iteracións.
# eval Utilities
Argumento: Expresión
Exemplos: eval x
eval inv(X'X)
eval sqrt($pi)
Esta instrución fai que Gretl funcione como unha sofisticada calculadora. O
programa avalía Expresión e presenta o seu valor. O argumento pode ser o
nome dunha variable, ou algo máis complicado. En calquera caso, debe de ser
unha expresión que podas poñer correctamente como o lado dereito dun
enunciado de asignación (igualdade).
Cae na conta de que unha instrución tal como
print x^2
non funcionará en Gretl posto que x^2 non é (non pode ser) o nome dunha
variable, pero (dada unha variable escalar denominada x)
eval x^2
funcionará correctamente, amosando o cadrado de x.
Consulta tamén "printf", no caso de que queiras combinar resultados
numéricos e de texto.
# fcast Prediction
Variantes: fcast [obsinicio obsfin] [nomev]
fcast [obsinicio obsfin] pasosadiante [nomev] --recursive
Opcións: --dynamic (Xera a predición dinámica)
--static (Xera a predición estática)
--out-of-sample (Xera a predición postmostral)
--no-stats (Non presenta as estatísticas de predición)
--stats-only (Presenta só as estatísticas de predición)
--quiet (Non presenta nada)
--recursive (Mira abaixo)
--plot=nomeficheiro (Mira abaixo)
Exemplos: fcast 1997:1 2001:4 f1
fcast fit2
fcast 2004:1 2008:3 4 rfcast --recursive
Debe de ir despois dunha instrución de estimación. As predicións xéranse
para certo rango de observacións que será, ben o definido cando indicas
obsinicio e obsfin (de ser posible), ben o definido polas observacións que
van a continuación do rango sobre o que se estimou o modelo cando indicas a
opción --out-of-sample, ou ben, noutro caso, o rango da mostra definido
nese momento. Cando solicitas unha predición 'out-of-sample' pero non hai
dispoñibles observacións relevantes, amósase un fallo. Dependendo da
natureza do modelo, tamén poden xerarse as desviacións padrón (mira
abaixo). Tamén mira abaixo para indagar sobre o efecto especial da opción
--recursive.
Se o derradeiro modelo estimado ten unha única ecuación, entón o
argumento nomev (opcional) ten o seguinte efecto: non se presentan os
valores da predición, senón que se gardan no conxunto de datos co nome
indicado. Se o último modelo é un sistema de ecuacións, nomev ten un
efecto distinto xa que concretamente escolle unha variable endóxena en
particular para facer a predición (pois por defecto xéranse as predicións
para todas as variables endóxenas). No caso dun sistema ou se non indicas
nomev, podes recuperar os valores de predición utilizando o accesorio
$fcast e, se están dispoñibles, as desviacións padrón mediante $fcse.
A elección entre unha predición estática ou dinámica aplícase
unicamente no caso de modelos dinámicos, cunha perturbación cun proceso
autorregresivo e/ou que inclúan un ou máis valores retardados da variable
dependente como regresores. As predicións estáticas son un paso adiantadas
(baseadas nos valores acadados no período previo), mentres que as
predicións dinámicas empregan a regra da cadea de predición. Por exemplo,
se unha predición para y en 2008 require como entrada un valor de y en
2007, unha predición estática é imposible sen datos actualizados para
2007, pero unha predición dinámica para 2008 é posible se podes
substituír unha predición previa para y en 2007.
Por defecto proporciónase: (a) unha predición estática para algunha
porción do rango de predición que cae dentro do rango da mostra sobre o
que se estima o modelo, e (b) unha predición dinámica (se é relevante)
fóra da mostra. A opción --dynamic solicita unha predición dinámica a
partir da data o máis temperá posible, e a opción --static solicita unha
predición estática aínda fóra da mostra.
A opción --recursive está actualmente dispoñible só para modelos dunha
soa ecuación, estimados mediante MCO. Cando indicas esta opción as
predicións son recursivas; é dicir, cada predición xérase a partir dunha
estimación do modelo indicado, utilizando os datos a partir dun punto de
inicio fixado (en concreto, o inicio do rango da mostra para a estimación
orixinal) ata a data de predición menos k, o número de pasos adiantados
que debes de indicar no argumento pasosadiante. As predicións sempre son
dinámicas se iso é pertinente. Cae na conta de que debes de indicar o
argumento pasosadiante unicamente xunto coa opción --recursive.
A opción --plot (dispoñible só no caso da estimación dunha única
ecuación) solicita que se produza un ficheiro gráfico, que contén unha
representación gráfica da predición. O sufixo do argumento nomeficheiro
desta opción controla o formato da gráfica: .eps para EPS, .pdf para PDF,
.png para PNG, e .plt para un ficheiro de instrucións Gnuplot. Podes
utilizar o título display en substitución do nome de ficheiro para forzar
a representación da gráfica nunha xanela. Por exemplo,
fcast --plot=fc.pdf
vai xerar unha gráfica con formato PDF. Respéctanse os nomes de rutas que
non ofrezan dúbidas; noutro caso, os ficheiros escríbense no cartafol de
traballo de Gretl.
A natureza das desviacións padrón das predicións (se están dispoñibles)
depende da natureza do modelo e da predición. En modelos lineais
estáticos, as desviacións padrón calcúlanse utilizando o método
bosquexado por Davidson e MacKinnon (2004); eles incorporan tanto a
incerteza debida ao proceso da perturbación como a incerteza nos
parámetros (resumida na matriz de covarianzas dos estimadores dos
parámetros). En modelos dinámicos, as desviacións padrón das predicións
calcúlanse unicamente no caso dunha predición dinámica, e non incorporan
a incerteza nos parámetros. Para modelos non lineais, as desviacións
padrón das predicións non están dispoñibles actualmente.
Ruta do menú: Xanela de modelo: Análise/Predicións
# flush Programming
Esta sinxela instrución (sen argumentos, sen opcións) está ideada para
usarse en guións que levan algo de tempo e que deben de executarse coa
Interface Gráfica de Usuario (GUI) de Gretl (o programa de liñas de
instrución o ignora), para darlle ao usuario un indicio visual de que as
cousas estanse movendo e Gretl non está "parado".
Xeralmente, se lanzas un guión na Interface Gráfica de Usuario (GUI), non
se amosa o resultado ata que se complete a súa execución, pero o efecto de
invocar flush é como se indica deseguido:
Na primeira chamada, Gretl abre unha xanela, amosa os resultados ata o
presente e engade a mensaxe "Procesando...".
Tras invocacións posteriores, actualízase o texto que se amosa na xanela
de resultados, e engádese unha nova mensaxe "procesando".
Cando se completa a execución do guión, calquera resultado que quede
pendente descárgase automaticamente na xanela de texto.
Ten en conta que non ten senso que utilices flush en guións que tarden
menos de (digamos) 5 segundos en executarse. Tamén cae na conta de que non
deberías utilizar esta instrución nun lugar do guión onde non hai
resultados posteriores que presentar, xa que a mensaxe "procesando" será
entón enganosa para o usuario.
O seguinte código ilustra o uso que se pretende con flush:
set echo off
scalar n = 10
loop i=1..n
# Facer unha operación que leve algo de tempo
loop 100 --quiet
a = mnormal(200,200)
b = inv(a)
endloop
# Presentar algúns resultados
printf "Iteración %2d feita\n", i
if i < n
flush
endif
endloop
# foreign Programming
Sintaxe: foreign language=ling
Opcións: --send-data[=lista] (Carga previamente os datos; mira abaixo)
--quiet (Elimina os resultados do programa externo)
Esta instrución abre un modo especial no que se admiten instrucións que
van executarse con outro programa. Podes saír deste modo con end foreign e
nese punto execútanse as instrucións amoreadas.
Actualmente os programas "externos" aos que se lles dá sostén deste xeito
son GNU R (language=R), Python, Julia, GNU Octave (language=Octave), Ox de
Jurgen Doornik e Stata. Os nomes das linguaxes recoñécense en termos que
non distinguen maiúsculas e minúsculas.
En conxunto con R, Octave e Stata, a opción --send-data ten como efecto o
de facer accesibles os datos do espazo de traballo do Gretl dentro do
programa sinalado. Por defecto, se envía o conxunto completo de datos, pero
ti podes limitar os datos que se van enviar indicando o nome dunha lista de
series definida previamente. Por exemplo:
list Rlist = x1 x2 x3
foreign language=R --send-data=Rlist
Consulta o Guía de usuario de Gretl (Capítulo 38) para obter máis
detalles e exemplos.
# fractint Statistics
Argumentos: serie [ nivel ]
Opcións: --gph (Fai a proba de Geweke e Porter-Hudak)
--all (Fai ambas probas)
--quiet (Non presenta os resultados)
Comproba a integración fraccional ("memoria longa") das series
especificadas probando a hipótese nula de que a orde de integración da
serie é cero. Por defecto, utilízase o estimador local de Whittle
(Robinson, 1995), pero cando indicas a opción --gph, realízase a proba GPH
(Geweke e Porter-Hudak, 1983) en troques. Cando decidas indicar a opción
--all, entón vanse presentar os resultados de ámbalas dúas probas.
Para obter máis detalles sobre esta clase de proba, consulta Phillips e
Shimotsu (2004).
Cando non indicas o argumento nivel (opcional), o nivel para a(s) probas(s)
establécese automaticamente como o número menor entre T/2 e T^0.6.
Podes recuperar os resultados utilizando os accesorios "$test" e "$pvalue".
Estes valores baséanse no Estimador Local de Whittle agás cando indicas a
opción --gph.
Ruta do menú: /Variable/Probas de raíz unitaria/Integración fraccional
# freq Statistics
Argumento: Variable
Opcións: --nbins=n (Especifica o número de intervalos)
--min=valormin (Especifica o mínimo, mira abaixo)
--binwidth=ancho (Especifica o ancho do intervalo, mira abaixo)
--normal (Proba a distribución Normal)
--gamma (Proba a distribución Gamma)
--silent (Non presenta nada)
--matrix=nomematr (Utiliza unha columna da matriz indicada)
--plot=modo-ou-nomeficheiro (Mira abaixo)
Exemplos: freq x
freq x --normal
freq x --nbins=5
freq x --min=0 --binwidth=0.10
Se non indicas opcións, amosa a distribución de frecuencias da serie
Variable (indicada polo seu nome ou número), co número de intervalos e os
seus tamaños elixidos automaticamente.
Cando indicas a opción --matrix, entón Variable debe de ser un número
enteiro e interprétase neste caso como un índice que escolle unha columna
da matriz indicada. Se a matriz en cuestión é realmente un vector columna,
podes omitir este argumento Variable.
Para controlar a presentación da distribución podes especificar, ou ben o
número de intervalos, ou ben o valor mínimo xunto co ancho dos intervalos,
como se amosou nos dous últimos exemplos de arriba. A opción --min
establece o límite inferior do intervalo situado máis á esquerda.
Cando indicas a opción --normal, calcúlase o estatístico khi-cadrado de
Doornik-Hansen para probar a normalidade. Cando indicas a opción --gamma, a
proba de normalidade substitúese pola proba non paramétrica de Locke
respecto á hipótese nula de que unha variable segue unha distribución
Gamma; consulta Locke (1976) e Shapiro e Chen (2001). Cae na conta de que a
forma na que se indican en Gretl os parámetros da distribución Gamma
utilizada é (forma, escala).
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica da distribución, pero podes axustar isto mediante a
opción --plot. Os parámetros admisibles para esta opción son: none (para
suprimir a gráfica), display (para amosar unha gráfica mesmo cando esteas
en modo de procesamento por lotes), ou un nome de ficheiro. O efecto de
indicar un nome de ficheiro é como se describe para a opción --output da
instrución "gnuplot".
A opción --silent elimina o resultado de texto habitual. Podes utilizar
isto xunto con unha ou outra das opcións para probas de distribución;
entón rexístranse o estatístico de proba máis a súa probabilidade
asociada, e podes recuperalos utilizando os accesorios "$test" e "$pvalue".
Tamén podes usar isto xunto coa opción --plot se unicamente queres un
histograma e non te interesa mirar o texto que o acompaña.
Ten en conta que Gretl non ten unha función que se corresponda con esta
instrución, pero resulta posible utilizar a función "aggregate" para
acadar o mesmo obxectivo.
Ruta do menú: /Variable/Distribución de frecuencias
# function Programming
Argumento: nomefuncion
Abre un bloque de expresións nas que se define unha función. Este bloque
debe de estar rematado con end function. Consulta o Guía de usuario de
Gretl (Capítulo 13) para obter máis detalles.
# garch Estimation
Argumentos: p q ; depvar [ indepvars ]
Opcións: --robust (Desviacións padrón robustas)
--verbose (Presenta os detalles das iteracións)
--vcv (Presenta a matriz de covarianzas)
--nc (Sen constante)
--stdresid (Tipifica os erros)
--fcp (Utiliza o algoritmo de Fiorentini, Calzolari e Panattoni)
--arma-init (Parámetros iniciais da varianza partindo de ARMA)
Exemplos: garch 1 1 ; y
garch 1 1 ; y 0 x1 x2 --robust
Estima un modelo GARCH (GARCH, Heterocedasticidade Condicional
Autorregresiva Xeneralizada), ben nun modelo univariante ou ben incluíndo
as variables esóxenas indicadas se especificas indepvars. Os valores
enteiros p e q (que podes indicar en formato numérico ou con nomes de
variables escalares xa existentes) representan os niveis de retardo na
ecuación de varianza condicional:
h(t) = a(0) + sum(i=1 to q) a(i)*u(t-i)^2 + sum(j=1 to p) b(j)*h(t-j)
Así, o parámetro p representa o nivel Xeneralizado (ou "AR"), mentres que
q representa o nivel normal ARCH (ou "MA"). Cando p é non nulo, q tamén
debe ser non nulo; noutro caso, o modelo non está identificado. Con todo,
podes estimar un modelo ARCH normal establecendo que q é un valor positivo
e que p é cero. A suma de p e q non debe de ser maior ca 5. Ten en conta
que se inclúe automaticamente unha constante na ecuación media agás que
indiques a opción --nc.
Por defecto, utilízase o propio código de Gretl para estimar os modelos
GARCH, pero tamén tes a opción de usar o algoritmo de Fiorentini,
Calzolari e Panattoni (1996). O primeiro utiliza o maximizador BFGS mentres
que o último usa a matriz de información para maximizar a verosimilitude,
cunha posta a punto mediante a matriz Hessiana.
Dispós de diversas variantes da matriz estimada das covarianzas dos
estimadores con esta instrución. Por defecto, utilízase a matriz Hessiana
agás que indiques a opción --robust, en cuxo caso vaise usar a matriz de
covarianzas CMV (QML de White). Tamén podes especificar outras
posibilidades (e.g. a matriz de información ou o estimador de
Bollerslev-Wooldridge) utilizando a instrución "set".
Por defecto, as estimacións dos parámetros da varianza inícianse usando a
varianza da perturbación non condicionada dunha estimación inicial por MCO
(para a constante) e valores positivos pequenos (para os coeficientes que
acompañan aos valores pasados tanto das perturbacións cadradas como da
varianza da perturbación). A opción --arma-init solicita que, para
establecer os valores iniciais destes parámetros, se utilice un modelo
inicial ARMA, explotando a relación entre GARCH e ARMA exposta no capítulo
21 do libro Time Series Analysis de Hamilton. Nalgúns casos, isto pode
mellorar as posibilidades de converxencia.
Podes recuperar os erros GARCH e a varianza condicionada estimada con $uhat
e $h, respectivamente. Por exemplo, para conseguir a varianza condicional:
series ht = $h
Cando indicas a opción --stdresid, divídense os valores de $uhat pola
raíz cadrada de h_t.
Ruta do menú: /Modelar/Series temporais/GARCH
# genr Dataset
Argumentos: novavariable = fórmula
NOTA: Esta instrución experimentou numerosos cambios e melloras desde que
se escribiu o seguinte texto de axuda, por iso para comprender e actualizar
a información sobre esta instrución, deberás de seguir a referencia do
Guía de usuario de Gretl (Capítulo 9). Por outra banda, esta axuda non
contén nada actualmente incorrecto, polo que interpreta o que sigue como
"tes isto, e máis".
Para esta instrución e no contexto apropiado, as expresións series,
scalar, matrix, string e bundle son sinónimos.
Xera novas variables, habitualmente mediante transformacións das variables
xa existentes. Consulta tamén "diff", "logs", "lags", "ldiff", "sdiff" e
"square" como atallos. No contexto dunha fórmula genr, debes facer
referencia ás variables xa existentes mediante o seu nome, non co número
ID. A fórmula debe de ser unha combinación ben feita de nomes de
variables, constantes, operadores e funcións (descrito máis abaixo). Ten
en conta que podes atopar máis detalles sobre algúns aspectos desta
instrución no Guía de usuario de Gretl (Capítulo 9).
Unha instrución genr pode producir un resultado escalar ou unha serie. Por
exemplo, a fórmula x2 = x * 2 naturalmente produce unha serie cando a
variable x é unha serie, e un escalar cando x é un escalar. As fórmulas x
= 0 e mx = mean(x) naturalmente devolven escalares. Baixo certas
circunstancias, podes querer ter un resultado escalar ampliado a unha serie
ou vector; isto podes facelo utilizando series coma un "alcume" para a
instrución genr. Por exemplo, series x = 0 produce unha serie na que todos
os seus valores póñense a 0. Tamén podes utilizar scalar coma alcume de
genr. Non é posible forzar a un resultado en forma de vector que sexa un
escalar, pero a utilización desta palabra chave indica que o resultado
debera ser un escalar: se non o é, xorde un fallo.
Cando unha fórmula produce un resultado en forma de serie, o rango sobre o
que se escribe ese resultado na variable obxectivo depende da configuración
vixente da mostra. Polo tanto, podes definir unha serie feita a cachos
utilizando a instrución smpl xunto con genr.
Se admiten os operadores aritméticos, en orde de prioridade: ^ (elevar á
potencia); *, / e % (módulo ou resto); + e -.
Os operadores booleanos dispoñibles son (de novo, en orde de prioridade): !
(negación), && (E lóxico), || (OU lóxico), >, <, == (igual a), >= (maior
ou igual que), <= (menor ou igual que) e != (non igual). Tamén podes
utilizar os operadores booleanos na construción de variables ficticias: por
exemplo, (x > 10) devolve 1 no caso de que x > 10, e 0 noutro caso.
As constantes integradas son pi e NA. A última é o código de valor
ausente: podes iniciar unha variable co valor ausente mediante scalar x =
NA.
A instrución genr admite un amplo rango de funcións matemáticas e
estatísticas, incluíndo todas as habituais máis varias que son especiais
de Econometría. Ademais, ofrece acceso a moitas variables internas que se
definen durante a execución das regresións, a realización de probas de
hipóteses, etcétera. Para obter unha listaxe de funcións e accesorios,
escribe "help functions".
Ademais dos operadores e das funcións indicados arriba, hai algúns usos
especiais de "genr":
"genr time" xera unha variable de tendencia temporal (1,2,3,...) chamada
"time". E "genr index" ten o mesmo efecto salvo que a variable chámase
index.
"genr dummy" xera tantas variables ficticias como a periodicidade dos
datos. No caso de ter datos trimestrais (periodicidade 4), o programa xera
dq1 = 1 para o primeiro trimestre e 0 para os outros trimestres, dq2 = 1
para o segundo trimestre e 0 para os outros trimestres, etcétera. Con
datos mensuais, as variables ficticias noméanse dm1, dm2, etcétera. Con
outras frecuencias, os nomes son dummy_1, dummy_2, etc.
"genr unitdum" e "genr timedum" xeran conxuntos de variables ficticias
especiais para utilizar con datos de panel, codificando a primeira as
unidades de sección cruzada e a segunda o período de tempo das
observacións.
Advertencia: Co programa en liñas de instrución, as instrucións "genr"
que recuperan datos relacionados cun modelo, sempre se refiren ao modelo que
se estimou máis recentemente. Isto tamén é certo no programa de Interface
Gráfica de Usuario (GUI), cando se utiliza "genr" na "consola de Gretl"ou
se introduce unha fórmula usando a opción "Definir nova variable" baixo o
menú Engadir na xanela principal. Coa GUI, porén, tes a opción de
recuperar datos de calquera dos modelos que se amosan nese momento nunha
xanela (sexa ou non sexa o modelo estimado máis recentemente). Podes facer
isto baixo o menú "Gardar" da xanela do modelo.
A variable especial obs serve como índice para as observacións. Por
exemplo, series dum = (obs==15) xera unha variable ficticia que ten valor 1
para a observación 15, e o valor 0 noutro caso. Tamén podes usar esta
variable para escoller observacións concretas por data ou nome. Por
exemplo, series d = (obs>1986:4), series d = (obs>"2008-04-01"), ou series d
= (obs=="CA"). Cando utilizas datas diarias ou marcadores de observación
neste contexto, debes de contornalas entre comiñas, pero podes usar as
datas trimestrais e mensuais (cos dous puntos) sen comiñas. Ten en conta
que, no caso de datos de series temporais anuais, o ano non se distingue
sintacticamente dun sinxelo número enteiro. Polo tanto, se queres comparar
observacións fronte a obs por ano, debes de usar a función obsnum para
converter así o ano nun valor índice en base 1, como se fai en series d =
(obs>obsnum(1986)).
Podes sacar os valores escalares dunha serie no contexto dunha fórmula
genr, utilizando a sintaxe varname[obs] na que podes indicar o valor obs por
número ou data. Exemplos: x[5], CPI[1996:01]. Para datos diarios, debes de
usar a forma YYYY-MM-DD; e.g. ibm[1970-01-23].
Podes modificar unha observación individual dunha serie mediante genr. Para
facer isto, debes de engadir un número de observación ou de data válidos,
entre corchetes, ao nome da variable no lado esquerdo da fórmula. Por
exemplo, genr x[3] = 30 ou genr x[1950:04] = 303.7.
Fórmula Comentario
------- -------
y = x1^3 x1 ao cubo
y = ln((x1+x2)/x3)
z = x>y z(t) = 1 se x(t) > y(t), noutro caso 0
y = x(-2) x retardada 2 períodos
y = x(+2) x adiantada 2 períodos
y = diff(x) y(t) = x(t) - x(t-1)
y = ldiff(x) y(t) = log x(t) - log x(t-1), a taxa de crecemento
instantáneo de x
y = sort(x) Ordena x en orde ascendente e gárdao en y
y = dsort(x) Ordena x en orde descendente
y = int(x) Tronza x e garda o seu valor enteiro como y
y = abs(x) Garda os valores absolutos de x
y = sum(x) Suma os valores de x excluíndo as entradas ausentes
NA
y = cum(x) Acumulación: y(t) = suma desde s=1 ata s=t de x(s)
aa = $ess Establece aa igual á Suma de Erros Cadrados da
derradeira regresión
x = $coeff(sqft) Apaña o coeficiente estimado da variable sqft da
derradeira regresión
rho4 = $rho(4) Apaña o coeficiente autorregresivo de orde 4 do
derradeiro modelo (asume un modelo ar)
cvx1x2 = $vcv(x1, x2) Apaña a covarianza estimada dos coeficientes das
variables x1 e x2 do derradeiro modelo
foo = uniform() Variable pseudoaleatoria Uniforme no rango 0-1
bar = 3 * normal() Variable pseudoaleatoria Normal, mu = 0, sigma = 3
samp = ok(x) = 1 para as observacións onde x non está ausente.
Ruta do menú: /Engadir/Definir nova variable
Outro acceso: Xanela principal: Menú emerxente
# gmm Estimation
Opcións: --two-step (Estimación en 2 etapas)
--iterate (MXM (GMM) reiterados)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--lbfgs (Utiliza L-BFGS-B en lugar do BFGS normal)
Realiza a estimación co Método Xeneralizado dos Momentos (MXM ou GMM)
utilizando o algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). Debes de
especificar: (a) unha ou máis instrucións para actualizar as cantidades
relevantes (tipicamente erros MXM), (b) un ou máis conxuntos de condicións
de ortogonalidade, (c) unha matriz inicial de ponderacións, e (d) unha
listaxe cos parámetros a estimar, todo contornado entre as etiquetas gmm e
end gmm. Calquera opción deberá de engadirse á liña end gmm.
Consulta o Guía de usuario de Gretl (Capítulo 23) para obter máis
detalles sobre esta instrución. Aquí simplemente o ilustramos cun exemplo
sinxelo.
gmm e = y - X*b
orthog e ; W
weights V
params b
end gmm
No exemplo de arriba, asumimos que y e X son matrices de datos, b é un
vector de valores dos parámetros coa dimensión adecuada, W é unha matriz
de instrumentos, e V é unha matriz axeitada de ponderacións. A expresión
orthog e ; W
indica que o vector de erros (e) é ortogonal en principio a cada un dos
instrumentos que constitúen as columnas de W.
Nomes dos parámetros
Ao estimar un modelo non linear, frecuentemente resulta conveniente que
nomees os parámetros de xeito conciso. Ao presentar os resultados, porén,
pode que desexes utilizar etiquetas máis informativas. Podes acadar isto
mediante a palabra chave adicional param_names dentro do bloque de
instrución. Para un modelo con k parámetros, o argumento que sigue a esta
palabra chave debe de ser ben unha cadea de texto literal entre comiñas que
conteña k nomes separados por espazos ou ben o nome dunha variable de cadea
que conteña k deses nomes.
Ruta do menú: /Modelar/Método Xeneralizado Momentos
# gnuplot Graphs
Argumentos: yvars xvar [ varficticia ]
Opcións: --with-lines[=varspec] (Utiliza liñas, non puntos)
--with-lp[=varspec] (Utiliza liñas e puntos)
--with-impulses[=varspec] (Utiliza barras finas verticais)
--with-steps[=varspec] (Utiliza segmentos de liñas perpendiculares (pasos))
--time-series (Representa fronte ao tempo)
--single-yaxis (Forza o uso dun único eixe de ordenadas)
--dummy (Mira abaixo)
--fit=espaxuste (Mira abaixo)
--font=espfonte (Mira abaixo)
--band=espfranxa (Mira abaixo)
--band-style=estilofranxa (Mira abaixo)
--matrix=nomematr (Representa as columnas da matriz indicada)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
--input=nomeficheiro (Colle a entrada de datos desde un ficheiro especificado)
Exemplos: gnuplot y1 y2 x
gnuplot x --time-series --with-lines
gnuplot wages educ gender --dummy
gnuplot y x --fit=quadratic
gnuplot y1 y2 x --with-lines=y2
As variables da lista yvars debúxanse fronte a xvar. Para unha gráfica
dunha serie temporal podes ben propoñer time en lugar de xvar, ou ben
utilizar o indicador de opción --time-series.
Por defecto, os sitios dos datos amósanse con símbolos, pero podes anular
isto indicando unha das seguintes opcións: --with-lines, --with-lp,
--with-impulses ou --with-steps. Cando vas representar máis dunha variable
no eixe da y, podes limitar o efecto destas opcións a un subconxunto das
variables utilizando o parámetro varspec. Este deberá de ter o formato
dunha listaxe cos nomes ou números (ambos separados por comas) das
variables que se van representar de xeito alternativo. Poñamos por caso, no
último exemplo de arriba se amosa como representar y1 e y2 fronte a x, de
tal xeito que y2 represéntase cunha liña pero y1 con símbolos.
Cando selecciones a opción --dummy, debes de indicar exactamente tres
variables: unha variable y simple, unha variable x e dvar, unha variable
discreta. O efecto disto consiste en representar yvar fronte a xvar cos
puntos amosados con cores diferentes dependendo do valor de varficticia na
observación indicada.
Collendo datos dunha matriz
Xeralmente requírense os argumentos yvars e xvar que se refiren a series do
conxunto vixente de datos (indicados ben polo nome ou ben polo número ID).
Pero se mediante a opción --matrix, indicas unha matriz xa definida, estes
argumentos convértense en opcionais: se a matriz especificada ten k
columnas, por defecto trátanse as primeiras k - 1 columnas como as yvars e
as últimas columnas trátanse como xvar. Porén, cando indicas a opción
--time-series, todas as k columnas represéntanse fronte ao tempo. Se queres
representar columnas escollidas da matriz, debes de especificar yvars e xvar
co formato de números de columna enteiros positivos. Por exemplo, se queres
unha gráfica de dispersión da columna 2 da matriz M fronte á columna 1,
podes facer:
gnuplot 2 1 --matrix=M
Amosar a liña do mellor axuste
A opción --fit é só aplicable en gráficas de dispersión de dúas
variables e en gráficas de series temporais individuais. Por defecto, o
proceder nunha gráfica de dispersión consiste en amosar o axuste MCO se o
coeficiente da pendente é significativo a un nivel do 10 por cento, mentres
que o proceder para as series temporais é non amosar ningunha liña de
axuste. Podes solicitar un comportamento diferente utilizando esta opción
xunto con algún dos seguintes valores dos parámetros espaxuste. Ten en
conta que se a gráfica é para unha serie temporal individual, o lugar de x
o ocupa o tempo.
linear: Amosa o axuste MCO independentemente do nivel de significación
estatística.
none: Non amosa ningunha liña de axuste.
inverse, quadratic, cubic, semilog ou linlog: Amosan unha liña de axuste
baseada na regresión do tipo especificado. Con semilog queremos dicir
unha regresión do logaritmo de y sobre x; entón a liña axustada
representa a esperanza condicionada de y, obtida mediante a función
exponencial. Con linlog quérese dicir unha regresión de y sobre o
logaritmo de x.
loess: Amosa o axuste dunha regresión robusta localmente ponderada (que
tamén coñécese ás veces como "lowess").
Representando unha franxa
Podes utilizar a opción --band para representar cero ou máis series
acompañadas dunha "franxa" dalgún tipo (tipicamente representa un
intervalo de confianza). Esta opción require dous parámetros separados
cunha coma: o nome ou o número ID dunha serie que represente o centro da
franxa, e o nome ou ID dunha serie que indique o largo da franxa: o efecto
disto consiste en debuxar unha franxa con ordenadas y iguais ao centro
máis/menos o largo. Podes utilizar un terceiro parámetro opcional (de novo
separado cunha coma) co formato dunha constante numérica ou o nome dunha
variable escalar, para indicar un múltiplo da dimensión de largura. Así,
por exemplo, o seguinte caso permite representar y xunto cunha franxa de
máis/menos 1.96 veces se_y:
gnuplot y --time-series --band=y,se_y,1.96 --with-lines
Cando indicas a opción --band, podes usar a opción compañeira
--band-style para controlar a representación da franxa. Por defecto, os
límites superior e inferior amósanse con liñas sólidas, pero os
parámetros fill, dash, bars ou step provocan que a franxa se debuxe como
unha área sombreada, utilizando liñas con raias, utilizando barras de erro
ou utilizando pasos, respectivamente. Ademais, podes engadir (despois dunha
coma) ou substituír unha especificación da cor. Aquí tes algúns exemplos
de estilo:
gnuplot ... --band-style=fill
gnuplot ... --band-style=dash,0xbbddff
gnuplot ... --band-style=,black
gnuplot ... --band-style=bars,blue
O primeiro exemplo produce unha área sombreada na cor establecida por
defecto, o segundo cambia a liñas con raias cunha cor específica gris
azulada, o terceiro utiliza liñas negras sólidas, e o derradeiro amosa
barras azuis. Ten en conta que podes indicar as cores ben como valores RGB
hexadecimais ou ben polo nome; e podes acceder á lista de nomes de cores
recoñecidas por Gnuplot dando a instrución "show colornames" no propio
Gnuplot ou, na propia consola de Gretl, facendo
eval readfile("@gretldir/data/gnuplot/gpcolors.txt")
Controlando o resultado
En modo interactivo, a gráfica amósase inmediatamente, mais en modo de
procesamento por lotes, o modo de proceder por defecto consiste en escribir
un ficheiro de instrucións Gnuplot no cartafol de traballo do usuario, cun
nome co padrón gpttmpN.plt, comezando con N = 01. Podes xerar as gráficas
reais máis tarde utilizando gnuplot (baixo MS Windows, wgnuplot). E podes
modificar este proceder utilizando a opción --output=nomeficheiro. Esta
opción controla o nome de ficheiro utilizado, e ao mesmo tempo te permite
especificar un formato concreto para o resultado mediante a extensión de
tres letras do nome do ficheiro, do seguinte xeito: .eps da como resultado a
xénese dun ficheiro Encapsulated PostScript (EPS); .pdf produce un PDF;
.png xera un con formato PNG, .emf solicita que sexa EMF (Enhanced
MetaFile), .fig pide que sexa un ficheiro Xfig, e .svg que sexa un SVG
(Scalable Vector Graphics). Cando indicas o nome ficticio de ficheiro
"display", entón a gráfica amósase na pantalla, como no modo interactivo.
E cando indicas un nome de ficheiro con calquera extensión diferente ás
que acaban de mencionarse, escríbese un ficheiro de instrucións Gnuplot.
Especificando unha fonte
Podes utilizar a opción --font para especificar unha fonte concreta para a
gráfica. O parámetro espfonte debe de ter a forma do nome dunha fonte,
seguida opcionalmente por un número que indique o tamaño en puntos,
separado do nome por unha coma ou espazo, todo elo contornado entre
comiñas, como en
--font="serif,12"
Ten en conta que as fontes dispoñibles para Gnuplot varían dependendo da
plataforma, e se estás escribindo unha instrución de gráfica que
pretendes que sexa transportable, é mellor restrinxir o nome da fonte ás
xenéricas sans ou serif.
Engadindo instrucións Gnuplot
Dispós dunha opción engadida desta instrución pois a continuación da
especificación das variables que se van debuxar e do indicador de opción
(se hai algún), podes engadir instrucións literais de Gnuplot para
controlar a aparencia da gráfica (por exemplo, establecendo o título da
gráfica e/ou rangos dos eixes). Estas instrucións deben de estar
contornadas entre chaves, e debes de rematar cada instrución Gnuplot cun
punto e coma. Podes utilizar unha barra inversa para continuar un conxunto
de instrucións Gnuplot ao longo de máis dunha liña. Aquí tes un exemplo
da sintaxe:
{ set title 'Meu Título'; set yrange [0:1000]; }
Ruta do menú: /Ver/Gráfica de variables indicadas
Outro acceso: Fiestra principal: Menú emerxente, botón de gráficas na barra de ferramentas
# graphpg Graphs
Variantes: graphpg add
graphpg fontscale escala
graphpg show
graphpg free
graphpg --output=nomeficheiro
A sesión "Paxina de gráficas" vai funcionar só cando teñas instalado o
sistema de composición tipográfica LaTeX, e podas xerar e ver un resultado
PDF ou PostScript.
Na xanela de iconas da sesión, podes arrastrar ata 8 gráficas sobre a
icona de páxina de gráficas. Cando premas un dobre clic sobre a páxina de
gráficas (ou premas o botón dereito e elixas "Amosar"), vaise compoñer
unha páxina que contén as gráficas seleccionadas e vaise abrir cun visor
adecuado. Dende aí deberías de poder imprimir a páxina.
Para limpar a páxina de gráficas, preme o botón dereito do rato sobre a
súa icona e selecciona "Limpar".
Ten en conta que en sistemas diferentes a MS Windows, poderías ter que
axustar a configuración do programa utilizado para ver ficheiros PDF ou
PostScript. Atópao baixo a lapela "Programas" na caixa de diálogo das
Preferencias xerais de Gretl (baixo o menú Ferramentas da xanela
principal).
Tamén é posible traballar na páxina de gráficas mediante guión, ou
utilizando a consola (no programa de Interface Gráfica de Usuario, GUI).
Dáselle apoio ás seguintes instrucións e opcións:
Para engadir unha gráfica á páxina de gráficas, podes indicar a
instrución graphpg add logo de gardar unha gráfica definida, como en
grf1 <- gnuplot Y X
graphpg add
Para amosar a páxina de gráficas: graphpg show.
Para limpar a páxina de gráficas: graphpg free.
Para axustar a escala da fonte utilizada na páxina de gráficas, usa
graphpg fontscale escala, onde escala é un múltiplo (por defecto igual a
1.0). Deste xeito, para facer que o tamaño da fonte sexa un 50 por cento
maior ca o tamaño por defecto, podes facer
graphpg fontscale 1.5
Para solicitar a impresión da páxina da gráfica nun ficheiro, usa a
opción --output= máis un nome de ficheiro; este nome debería de ter a
extensión ".pdf", ".ps" ou ".eps". Por exemplo:
graphpg --output="myfile.pdf"
O ficheiro resultante vai escribirse no cartafol establecido nese momento
("workdir"), agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Neste contexto, para o resultado se utilizan liñas de cores por defecto;
para utilizar padróns punto/raia en vez de cores podes engadir a opción
--monochrome.
# hausman Tests
Opcións: --nerlove (Utiliza o método de Nerlove para efectos aleatorios)
--matrix_diff (Utiliza o método da matriz-diferenza para a proba de Hausman)
Esta proba está dispoñible unicamente despois de estimar un modelo con
datos de panel utilizando MCO (consulta tamén "setobs"). Comproba o modelo
combinado simple fronte ás principais alternativas, os modelos de efectos
fixos e de efectos aleatorios.
O modelo de efectos fixos permite que a ordenada na orixe da regresión
varíe dunha unidade de sección cruzada a outra. Preséntase unha proba F
para a hipótese nula de que as ordenadas na orixe non difiren. O modelo de
efectos aleatorios descompón a varianza de cada perturbación en dúas
partes, unha parte específica da unidade de sección cruzada e outra parte
específica de cada observación concreta. (Pódese calcular este estimador
só cando o número de unidades de sección cruzada no conxunto de datos
supera ao número de parámetros a estimar.) O estatístico de
Multiplicadores de Lagrange de Breusch-Pagan comproba a hipótese nula de
que o estimador combinado de MCO é axeitado fronte á alternativa de efecto
aleatorios.
O modelo combinado de MCO pode rexeitarse fronte a ambas as dúas
alternativas, a de efectos fixos e a de efectos aleatorios. En tanto que a
perturbación específica por unidade ou grupo non estea correlacionada coas
variables independentes, o estimador de efectos aleatorios será máis
eficiente que o estimador de efectos fixos; noutro caso, o estimador de
efectos aleatorios será inconsistente polo que prefírese o estimador de
efectos fixos. A hipótese nula da proba de Hausman indica que a
perturbación específica de grupo non está así correlacionada (e por iso
prefírese o modelo de efectos aleatorios). Un valor baixo da probabilidade
asociada (valor p) ao estatístico desta proba vai en contra do modelo de
efectos aleatorios e a favor do modelo de efectos fixos.
As dúas opcións desta instrución pertencen ao modelo de efectos
aleatorios. Por defecto, utilízase o método de Swamy e Arora, e calcúlase
o estatístico de proba de Hausman utilizando o método de regresión. As
opcións permiten utilizar o estimador alternativo da varianza de Nerlove, e
/ou a aproximación da matriz-diferenza ao estatístico de Hausman.
Ruta do menú: Xanela de modelo: Probas/Diagnósticos de panel
# heckit Estimation
Argumentos: depvar indepvars ; ecuaciondeseleccion
Opcións: --quiet (Non presenta os resultados)
--two-step (Realiza a estimación en 2 etapas)
--vcv (Presenta a matriz de covarianzas)
--opg (Desviacións padrón PEG (OPG))
--robust (Desviacións padrón CMV (QML))
--cluster=clustvar (Consulta "logit" para máis explicacións)
--verbose (Presenta resultados adicionais)
Exemplos: heckit y 0 x1 x2 ; ys 0 x3 x4
Mira tamén heckit.inp
Modelo de selección de tipo Heckman. Ao especificar esta instrución, a
lista antes do punto e coma representa as variables da ecuación resultante,
e a segunda lista representa as variables da ecuación de selección. A
variable dependente da ecuación de selección (ys no exemplo de arriba)
debe de ser unha variable binaria.
Por defecto, os parámetros estímanse polo método de máxima
verosimilitude. A matriz de covarianzas dos estimadores dos parámetros
calcúlase utilizando a inversa negativa da matriz Hessiana. Se queres facer
a estimación en 2 etapas, utiliza a opción --two-step. Neste caso, a
matriz de covarianzas dos estimadores dos parámetros da ecuación
resultante axústase de modo adecuado segundo Heckman (1979).
Ruta do menú: /Modelar/Variable Dependente Limitada/Heckit
# help Utilities
Variantes: help
help functions
help instrución
help función
Opción: --func (Escolle a axuda sobre as funcións)
Se non indicas ningún argumento, presenta a lista de instrucións
dispoñibles. Se indicas o argumento simple "functions", presenta a lista de
funcións dispoñibles (consulta "genr").
A expresión help instrución describe cada instrución indicada (e.g. help
smpl). A expresión help función describe cada función indicada (e.g. help
ldet). Algunhas funcións teñen os mesmos nomes que as instrucións
relacionadas (e.g. diff); nese caso, por defecto preséntase a axuda para a
instrución, pero podes obter axuda para a función utilizando a opción
--func.
Ruta do menú: /Axuda
# hfplot Graphs
Argumentos: listaaltafrec [ ; listabaixafrec ]
Opcións: --with-lines (Gráfica con liñas)
--time-series (Pon o tempo no eixe de abscisas)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Proporciona un medio de debuxar unha serie de alta frecuencia, tal vez xunto
a unha ou máis series observadas coa frecuencia base do conxunto de datos.
O primeiro argumento debe de ser unha "MIDAS list"; e os termos adicionais
listabaixafrec (opcionais) deberán de ser series habituais ("de baixa
frecuencia"), despois dun punto e coma.
Para obter máis detalles sobre o efecto da opción --output, consulta a
instrución "gnuplot".
# hsk Estimation
Argumentos: depvar indepvars
Opcións: --no-squares (Mira abaixo)
--vcv (Presenta a matriz de covarianzas)
Esta instrución é aplicable cando existe heterocedasticidade en forma
dunha función descoñecida dos regresores que pode aproximarse por medio
dunha relación cuadrática. Nese contexto, ofrece a posibilidade de obter
desviacións padrón consistentes e estimacións máis eficientes dos
parámetros en comparación con MCO.
O procedemento implica (a) a estimación MCO do modelo de interese, seguido
de (b) unha regresión auxiliar para xerar unha estimación da varianza da
perturbación, e finalmente (c) mínimos cadrados ponderados, utilizando
como ponderación a inversa da varianza estimada.
Na regresión auxiliar de (b), se regresa o logaritmo dos erros cadrados da
primeira estimación MCO sobre os regresores orixinais e os seus cadrados
(por defecto), ou só sobre os regresores orixinais (se indicas a opción
--no-squares). A transformación logarítmica realízase para asegurar que
as varianzas estimadas son todas non negativas. Denominando u^* aos valores
axustados por esta regresión, a serie coas ponderacións para a estimación
MCO (WLS) final fórmase entón como 1/exp(u^*).
Ruta do menú: /Modelar/Outros Modelos Lineais/Corrección de Heterocedasticidade
# hurst Statistics
Argumento: serie
Opción: --plot=modo-ou-nomeficheiro (Mira abaixo)
Calcula o expoñente de Hurst (unha medida de persistencia ou longa memoria)
para unha variable de tipo serie temporal que teña polo menos 128
observacións.
Mandelbrot (1983) discute sobre o expoñente de Hurst. En termos teóricos,
este é o expoñente (H) da relación
RS(x) = an^H
onde RS expresa o "rango que se volve a escalar" da variable x en mostras de
tamaño n e a é unha constante. O rango reescalado é o rango (valor
máximo menos mínimo) do valor acumulado ou suma parcial de x (logo da
subtracción da súa media mostral) no período da mostra, dividida pola
desviación padrón mostral.
Como punto de referencia, se x é unha variable ruído branco (con media e
persistencia nulas) entón o rango do seu "paseo" (forma un paseo aleatorio)
acumulado e escalado pola súa desviación típica, ten un crecemento igual
á raíz cadrada do tamaño da mostra, proporcionando un expoñente de Hurst
agardado de 0.5. Os valores do expoñente que estean significativamente por
encima de 0.5 indican persistencia, e os menores ca 0.5 indican
"antipersistencia" (autocorrelación negativa). En principio, o expoñente
está acoutado entre 0 e 1, aínda que en mostras finitas é posible obter
un expoñente estimado maior ca 1.
En Gretl, o expoñente estímase utilizando submostraxe binaria: comézase
co rango completo de datos, despois coas dúas metades do rango, despois cos
4 cuartos, etcétera. Para tamaños da mostra menores que o rango de datos,
o valor RS é a media entre as mostras dispoñibles. O expoñente estímase
así como o coeficiente da pendente nunha regresión do logaritmo de RS
sobre o logaritmo do tamaño da mostra.
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica do rango reescalado pero podes axustar isto mediante
a opción --plot. Os parámetros que se admiten para esta opción son none
(para suprimir a gráfica); display (para presentar unha gráfica mesmo en
caso de procesar por lotes); ou un nome de ficheiro. O efecto de indicar un
nome de ficheiro é como o descrito para a opción --output da instrución
"gnuplot".
Ruta do menú: /Variable/Expoñente de Hurst
# if Programming
Control de fluxo para a execución de instrucións. Admítense 3 tipos de
construción, como as indicadas deseguido.
# Forma simple
if (poñer a condición)
instrucións
endif
# Dúas ramas
if (poñer a condición)
instrucións 1
else
instrucións 2
endif
# Tres ou máis ramas
if (poñer a condición 1)
instrucións 1
elif (poñer a condición 2)
instrucións 2
else
instrucións 3
endif
A condición ("condition") debe de ser unha expresión booleana; para a súa
sintaxe consulta "genr". Podes incluír máis dun bloque "elif". Ademais,
podes aniñar os bloques if ... endif.
# include Programming
Argumento: nomeficheiro
Opción: --force (Forza a volver ler desde o ficheiro)
Exemplos: include myfile.inp
include sols.gfn
Ideado para utilizar nun guión de instrucións, principalmente para
incluír definicións de funcións. O nome do ficheiro (nomeficheiro)
debería de ter a extensión inp (un guión de texto plano) ou gfn (un
paquete de función de Gretl). As instrucións de nomeficheiro execútanse e
logo o control devólvese ao guión principal.
A opción --force é específica dos ficheiros gfn e o seu efecto consiste
en forzar a Gretl a que volva ler o paquete de función desde o ficheiro
mesmo aínda que xa estea cargado na memoria. (Os ficheiros de texto plano
inp sempre lense e procésanse en resposta a esta instrución.)
Consulta tamén "run".
# info Dataset
Presenta calquera información complementaria gardada co ficheiro vixente de
datos.
Ruta do menú: /Datos/Información do conxunto de datos
Outro acceso: Fiestras do procurador de datos
# install Utilities
Argumento: nomepaquete
Opcións: --local (Instala desde un ficheiro local)
--remove (Mira abaixo)
--purge (Mira abaixo)
Exemplos: install armax
install felogit.gfn
install /path/to/myfile.gfn --local
install http://foo.bar.net/gretl/myfile.gfn
Instalador de paquetes de funcións de Gretl (ficheiros gfn ou zip).
Cando indicas esta instrución co nome "plano" dun paquete de funcións de
Gretl (como nos dous primeiros exemplos), o efecto da instrución consiste
en descargar o paquete que se especifica do servidor de Gretl, e instalalo
na máquina local. Neste caso, non é necesario ofrecer unha extensión no
nome de ficheiro.
Cando indicas a opción --local, o argumento nomepaquete debe de ser a ruta
a un ficheiro de paquete con extensión correcta, que aínda non estea
instalado na máquina local. O efecto da instrución consiste en copiar o
ficheiro no lugar (gfn), ou descomprimilo no lugar (zip), querendo dicir con
"no lugar" onde o atopará a instrución "include".
Cando non indicas ningunha opción, se nomepaquete comeza con http://, o
efecto da instrución consiste en descargar un ficheiro de paquete do
servidor especificado e instalalo localmente.
Coa opción --remove ou --purge, realízase a operación inversa; é dicir,
quítase un paquete xa instalado. Cando só indicas --remove, o paquete
especificado bótase da memoria e elimínase do menú da Interface Gráfica
de Usuario (GUI) á que está anexado, de existir. Cando indicas a opción
--purge, entón ademais das accións que se acaban de mencionar, elimínase
o ficheiro de paquete. (Se o paquete está instalado no seu propio
subcartafol, elimínase o subcartafol enteiro.)
Ruta do menú: /Ficheiro/Paquetes de funcións/No servidor
# intreg Estimation
Argumentos: minvar maxvar indepvars
Opcións: --quiet (Non presenta os resultados)
--verbose (Presenta os detalles das iteracións)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para máis explicacións)
Exemplos: intreg lo hi const x1 x2
Mira tamén wtp.inp
Estima un modelo de regresión por intervalos. Este modelo xurde cando a
variable dependente está imperfectamente observada para algunhas
observacións (posiblemente todas). Noutras palabras, asúmese que o proceso
xerador de datos é
y* = x b + u
pero só observamos m <= y* <= M (o intervalo pode non ter límite pola
esquerda ou pola dereita). Cae na conta de que para algunhas observacións m
pode ser igual a M. As variables minvar e maxvar deben de conter NAs para as
observacións sen límite pola esquerda ou pola dereita, respectivamente.
O modelo estímase mediante Máxima Verosimilitude, asumindo a distribución
Normal do termo de perturbación aleatoria.
Por defecto, as desviacións padrón calcúlanse utilizando a inversa
negativa da matriz Hessiana. Cando especificas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimada é un "emparedado"
entre a inversa da matriz Hessiana estimada e o produto externo do vector
gradiente.
Ruta do menú: /Modelar/Variable Dependente Limitada/Regresión por intervalos
# join Dataset
Argumentos: nomeficheiro nomevar
Opcións: --data=nomecolumna (Mira abaixo)
--filter=expresión (Mira abaixo)
--ikey=claveinterna (Mira abaixo)
--okey=claveexterna (Mira abaixo)
--aggr=metodo (Mira abaixo)
--tkey=nomecoluma,cadeaformato (Mira abaixo)
--verbose (Informe en marcha)
Esta instrución importa unha serie co nome nomevar con datos, desde a orixe
nomeficheiro (que debe de ser ben un ficheiro de datos co texto delimitado,
ou ben un ficheiro de datos "propio" de Gretl). Para obter máis detalles,
consulta o Guía de usuario de Gretl (Capítulo 7) pois aquí damos só un
breve resumo das opcións dispoñibles.
Podes utilizar a opción --data para especificar o encabezamento dos datos
do ficheiro de orixe, se difire do nome polo que os datos deberan de
coñecerse no Gretl.
Podes usar a opción --filter para especificar un criterio para filtrar os
datos de orixe (é dicir, para escoller un subconxunto das observacións).
Podes utilizar as opcións --ikey e --okey para especificar unha
equivalencia entre as observacións do conxunto vixente de datos e as
observacións da fonte de datos (por exemplo, os individuos poden compararse
co fogar ao que pertencen).
A opción --aggr utilízase cando a equivalencia entre as observacións do
conxunto vixente de datos e as da orixe non é de unha a unha.
A opción --tkey aplícase só cando o conxunto vixente de datos ten unha
estrutura de serie temporal. Podes usala para especificar ben o nome dunha
columna que conteña datas que van ser emparelladas co conxunto de datos
e/ou ben o formato no que as datas se representan nesa columna.
Consulta tamén "append" para as operacións máis sinxelas de anexión.
# kpss Tests
Argumentos: nivel listavariables
Opcións: --trend (Inclúe unha tendencia)
--seasonals (Inclúe variables ficticias estacionais)
--verbose (Presenta os resultados da regresión)
--quiet (Non presenta os resultados)
--difference (Utiliza a primeira diferenza da variable)
Exemplos: kpss 8 y
kpss 4 x1 --trend
Para utilizar esta instrución con datos de panel, consulta a sección final
desta anotación.
Calcula a proba de estacionariedade KPSS (Kwiatkowski et al, Journal of
Econometrics, 1992) para cada unha das variables indicadas (ou para as súas
primeiras diferenzas, se escolles a opción --difference). A hipótese nula
é que a variable en cuestión é estacionaria, ben arredor dun nivel ou, se
marcas a opción --trend, arredor dunha tendencia linear determinística.
O argumento nivel determina o tamaño da xanela utilizada para o suavizado
de Bartlett. Cando indicas un valor negativo, iso tómase como sinal para
que se utilice unha xanela automática de tamaño 4(T/100)^0.25, onde T é o
tamaño da mostra.
Se escolles a opción --verbose, preséntanse os resultados da regresión
auxiliar xunto coa varianza estimada da compoñente de paseo aleatorio da
variable.
Os puntos críticos amosados para o estatístico de proba baséanse en
superficies de resposta estimadas do xeito establecido por Sephton
(Economics Letters, 1995), que son máis fiables para mostras pequenas ca os
valores indicados no artigo orixinal de KPSS. Cando o estatístico de proba
cae entre os puntos críticos do 1 e do 10 por cento, amósase unha
probabilidade asociada (valor p) que se obtén mediante interpolación
linear e non debe de tomarse demasiado literalmente. Consulta a función
"kpsscrit" para ver un medio de obter eses puntos críticos coa axuda do
programa.
Panel data
Cando se utiliza a instrución kpss con datos de panel, para realizar unha
proba de raíz unitaria de panel, as opcións aplicables e os resultados
amosados son algo diferentes. Mentres que no caso habitual de series
temporais, podes indicar unha lista de variables para comprobar, con datos
de panel só podes comprobar unha variable por cada instrución. E a opción
--verbose ten un significado diferente pois xera unha breve presentación da
proba para cada serie temporal individual (pois por defecto só se amosa o
resultado global).
Cando é posible, calcúlase a proba global (Hipótese nula: A serie en
cuestión é estacionaria para todas unidades do panel) utilizando para elo
o método de Choi (Journal of International Money and Finance, 2001). Isto
non sempre é sinxelo pois a dificultade está en que mentres que a proba de
Choi se basea nas probabilidades asociadas das probas sobre as series
individuais, non temos actualmente un xeito de calcular as probabilidades
asociadas para o estatístico de proba KPSS; debemos de apoiarnos nuns
poucos puntos críticos.
Se o estatístico de proba para unha determinada serie, cae entre os puntos
críticos do 1 e do 10 por cento, podemos interpolar unha probabilidade
asociada. Pero se o valor do estatístico da proba cae por debaixo do
correspondente ao 10 por cento ou excede ao do 1 por cento, non se pode
interpolar e como moito pódese establecer un límite sobre a proba de Choi
global. Se o valor do estatístico de proba individual cae por debaixo do
correspondente ao 10 por cento para unhas unidades e excede ao do 1 por
cento para outras, nin sequera se pode calcular un límite para a proba
global.
Ruta do menú: /Variable/Probas de raíz unitaria/Proba KPSS
# labels Dataset
Variantes: labels [ listavariables ]
labels --to-file=nomeficheiro
labels --from-file=nomeficheiro
labels --delete
Coa primeira forma, se presentan as etiquetas informativas (se existen) das
series de listavariables, ou de todas as series do conxunto de datos cando
non especificas listavariables.
Coa opción --to-file se escriben no ficheiro indicado, as etiquetas de
todas as series do conxunto de datos, unha etiqueta por cada liña. Se non
hai ningunha etiqueta, amósase un fallo; e se algunhas series teñen
etiqueta e outras non, preséntase unha liña en branco para as series sen
etiqueta. O ficheiro resultante vaise escribir no cartafol "workdir" vixente
nese momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Coa opción --from-file, lese o ficheiro especificado (que debe de ser de
texto plano) e asígnanse etiquetas ás series do conxunto de datos,
léndose unha etiqueta por liña e usando liñas en branco para indicar
etiquetas en branco.
A opción --delete fai o que cabería agardar pois elimina todas as
etiquetas das series do conxunto de datos.
Ruta do menú: /Datos/Etiquetas de variables
# lad Estimation
Argumentos: depvar indepvars
Opción: --vcv (Presenta a matriz de covarianzas)
Calcula unha regresión que minimiza a suma das desviacións absolutas dos
valores axustados respecto aos valores observados da variable dependente. As
estimacións dos coeficientes derívanse utilizando o algoritmo do simplex
de Barrodale-Roberts; e preséntase unha advertencia se a solución non é
única.
As desviacións padrón dedúcense utilizando o procedemento 'bootstrap' con
500 extraccións. A matriz de covarianzas dos estimadores dos parámetros,
que se presenta cando indicas --vcv, baséase no mesmo 'bootstrap'.
Ruta do menú: /Modelar/Estimación Robusta/Mínima Desviación Absoluta
# lags Transformations
Argumentos: [ nivel ; ] listaretardos
Opción: --bylag (Ordena os termos por retardo)
Exemplos: lags x y
lags 12 ; x y
lags 4 ; x1 x2 x3 --bylag
Xera novas series que conteñen os valores retardados de cada unha das
series de listavariables. Por defecto, o número de retardos que se crean é
igual á periodicidade dos datos. Por exemplo, se a periodicidade é 4
(trimestral), a instrución "lags x" xera
x_1 = x(t-1)
x_2 = x(t-2)
x_3 = x(t-3)
x_4 = x(t-4)
Podes controlar o número de retardos xerados mediante o primeiro parámetro
opcional (que, se existe, debe de estar seguido dun punto e coma).
A opción --bylag ten sentido só cando listavariables contén máis dunha
serie e o nivel máximo de retardos é maior ca 1. Por defecto, engádense
os termos retardados ao conxunto de datos por variable: primeiro todos os
retardos da primeira serie da lista, despois todos os retardos da segunda
serie, etcétera. Pero cando indicas --bylag, a ordenación faise por
retardos: primeiro o retardo 1 de todas as series da lista, despois o
retardo 2 de todas as series da lista, etcétera.
Ruta do menú: /Engadir/Retardos das variables seleccionadas
# ldiff Transformations
Argumento: listavariables
Obtense a primeira diferenza do logaritmo natural de cada unha das series de
listavariables, e o resultado gárdase nunha nova serie co prefixo ld_. Así
"ldiff x y" xera as novas variables
ld_x = log(x) - log(x(-1))
ld_y = log(y) - log(y(-1))
Ruta do menú: /Engadir/Diferenzas de logaritmos das variables seleccionadas
# leverage Tests
Opcións: --save (Garda as series resultantes)
--quiet (Non presenta os resultados)
--plot=modo-ou-nomeficheiro (Mira abaixo)
Debe de ir despois dunha instrución de MCO ("ols"). Calcula o pancamento
(h, que debe de caer no rango entre 0 e 1) para cada punto de datos da
mostra sobre a que se estimou o modelo previo. Amosa o erro (u) para cada
observación xunto co seu pancamento e unha medida da súa influencia nas
estimacións, uh/(1 - h). Os "puntos de Leverage" para os que o valor de h
supera 2k/n (onde k é o número de parámetros que se estiman e n é o
tamaño da mostra) destácanse mediante un asterisco. Para obter máis
detalles sobre os conceptos de pancamento e influencia, consulta o capítulo
2 do libro de Davidson e MacKinnon (1993).
Tamén se calculan os valores DFFITS: estes son iguais aos "erros
tipificados" (erros de predición divididos polas súas desviacións
padrón) multiplicados por sqrt[h/(1 - h)]. Para unha discusión sobre erros
tipificados e DFFITS consulta o capítulo 12 do libro de Maddala
Introduction to Econometrics ou Belsley, Kuh e Welsch (1980).
Abreviadamente, un "erro de predición" é a diferenza entre o valor
observado da variable dependente na observación t, e o valor axustado para
esa observación t que se obtén da regresión na que se omite esa
observación (ou na que se engade unha variable ficticia cun valor 1 só na
observación t); o erro tipificado obtense dividindo o erro de predición
pola súa desviación padrón.
Cando especificas a opción --save con esta instrución, os valores de
pancamento, influencia e DFFITS engádense ao conxunto vixente de datos;
neste contexto, podes utilizar a opción --quiet para eliminar a
presentación dos resultados. Os nomes por defecto das series gardadas son
lever, influ e dffits, respectivamente. Porén, se xa existen series con
eses nomes, os das series gardadas recentemente axústanse para garantir a
unicidade; en calquera caso, estas serán as 3 series con números ID máis
grandes do conxunto de datos.
Logo da execución, o accesorio "$test" devolve o criterio de validación
cruzada, que se define como a suma das desviacións cadradas da variable
dependente con relación aos seus valores de predición, estando a
predición para cada observación baseada nunha mostra da que se exclúe esa
observación. (Este é o coñecido como estimador deixar-un-fóra). Para
unha discusión máis ampla sobre o criterio de validación cruzada,
consulta o libro de Davidson e MacKinnon Econometric Theory and Methods,
páxinas 685-686, e as referencias que contén.
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica cos valores de pancamento e influencia. Podes axustar
isto mediante a opción --plot. Os parámetros que se admiten para esta
opción son none (para suprimir a gráfica), display (para amosar unha
gráfica mesmo ao estar en modo de procesamento por lotes), ou un nome de
ficheiro. O efecto de indicar un nome de ficheiro é como o descrito para a
opción --output da instrución "gnuplot".
Ruta do menú: Xanela de modelo: Análise/Observacións influentes
# levinlin Tests
Argumentos: nivel serie
Opcións: --nc (Sen constante)
--ct (Con constante e tendencia)
--quiet (Non presenta os resultados)
Exemplos: levinlin 0 y
levinlin 2 y --ct
levinlin {2,2,3,3,4,4} y
Realiza a proba de raíz unitaria para panel descrita por Levin, Lin e Chu
(2002). A hipótese nula é que todas as series temporais individuais
presentan unha raíz unitaria, e a alternativa é que ningunha das series
ten unha raíz unitaria. (É dicir, asúmese un mesmo coeficiente común de
AR(1), aínda que noutros aspectos se permite que as propiedades
estatísticas das series varíen duns individuos a outros.)
Por defecto, as regresións da proba ADF inclúen unha constante. Para
eliminar a constante utiliza a opción --nc e para incluíla xunto cunha
tendencia linear utiliza a opción --ct. (Consulta a instrución "adf" para
unha explicación das regresións do ADF.)
Podes indicar o nivel de retardo con nivel (non negativo) para facer a proba
(controlando así o número de retardos da variable dependente a incluír
nas regresións do ADF) cunha forma de dúas. Cando indicas un valor
escalar, isto aplícase a tódolos individuos do panel. A alternativa é
proporcionar unha matriz que conteña un nivel específico de retardos para
cada individuo; esta debe de ser un vector con tantos elementos como
individuos haxa no rango da mostra vixente. Podes especificar esa matriz co
nome ou construíla utilizando chaves como se explicou no último exemplo de
arriba.
Ruta do menú: /Variable/Probas de raíz unitaria/Proba de Levin-Lin-Chu
# logistic Estimation
Argumentos: depvar indepvars
Opcións: --ymax=máximo (Especifica o máximo da variable dependente)
--vcv (Presenta a matriz de covarianzas)
Exemplos: logistic y const x
logistic y const x --ymax=50
Regresión loxística: Leva a cabo unha regresión MCO utilizando a
transformación loxística da variable dependente,
log(y/(y* - y))
A variable dependente debe de ser estritamente positiva. Se todos os seus
valores están entre 0 e 1, por defecto utilízase un valor de y^* (o
máximo asintótico da variable dependente) igual a 1; se os seus valores
están entre 0 e 100, entón y^* é 100 por defecto.
Se queres establecer un máximo diferente, utiliza a opción --ymax. Ten en
conta que o valor que indiques debe de ser maior ca todos os valores
observados da variable dependente.
Os valores axustados e os erros da regresión transfórmanse automaticamente
utilizando
y = y* / (1 + exp(-z))
onde z representa un valor axustado ou un erro, obtidos da regresión MCO
que utiliza a variable dependente transformada. Deste xeito podes comparar
os valores que se presentan cos da variable dependente orixinal.
Ten en conta que se a variable dependente é binaria, debes de utilizar no
seu lugar a instrución "logit".
Ruta do menú: /Modelar/Variable Dependente Limitada/Loxístico
# logit Estimation
Argumentos: depvar indepvars
Opcións: --robust (Desviacións padrón robustas)
--cluster=clustvar (Desviacións padrón agrupadas)
--multinomial (Estima un logit multinomial)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--p-values (Amosa os valores p en vez das pendentes)
Se a variable dependente é unha variable binaria (todos os seus valores son
0 ou 1), obtéñense estimacións máximo verosímiles dos coeficientes das
variables de indepvars mediante o método de Newton-Raphson. Como o modelo
é non linear, as pendentes están condicionadas polos valores das variables
independentes. Por defecto, calcúlanse as pendentes con respecto a cada
unha das variables independentes (nas medias desas variables) e estas
pendentes substitúen os valores p habituais no resultado da regresión.
Podes prescindir deste proceder indicando a opción --p-values. O
estatístico khi-cadrado proba a hipótese nula de que todos os coeficientes
son cero, agás o da constante.
Por defecto, as desviacións padrón calcúlanse utilizando a inversa
negativa da matriz Hessiana. Se indicas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimadas é un
"emparedado" entre a inversa da matriz Hessiana estimada e o produto externo
do vector gradiente; consulta o capítulo 10 do libro de Davidson e
MacKinnon (2004). Pero cando indicas a opción --cluster, entón xéranse as
desviacións padrón "robustas por agrupación"; consulta o Guía de usuario
de Gretl (Capítulo 18) para obter máis detalles.
Se a variable dependente non é binaria senón discreta, entón por defecto
interprétase como unha resposta ordinal e obtéñense as estimacións cun
Logit Ordenado. Porén, cando indicas a opción --multinomial, a variable
dependente interprétase como unha resposta sen ordenar e xéranse as
estimacións cun Logit Multinomial. (En calquera caso, se a variable
escollida como dependente non é de tipo discreto, amósase un fallo.) No
caso multinomial, o accesorio $mnlprobs está dispoñible despois da
estimación, para conseguir unha matriz que conteña as probabilidades
estimadas dos posibles valores da variable dependente para cada observación
(coas observacións por filas e os posibles valores por columnas).
Se queres utilizar un Logit para a análise de proporcións, onde para cada
observación a variable dependente é a proporción de casos que teñen unha
determinada característica (máis que unha variable con 1 ou 0 para indicar
se está presente ou non a característica), non debes de utilizar a
instrución "logit", senón máis ben construír a variable logit, como en
series lgt_p = log(p/(1 - p))
e utilizar esta como a variable dependente dunha regresión MCO. Consulta o
capítulo 12 de Ramanathan (2002).
Ruta do menú: /Modelar/Variable Dependente Limitada/Logit
# logs Transformations
Argumento: listavariables
Permite obter o logaritmo natural de cada unha das series de listavariables
e o resultado gárdase nunha nova serie co prefixo l_ ("l" e barra baixa).
Por exemplo, "logs x y" xera as novas variables l_x = ln(x) e l_y = ln(y).
Ruta do menú: /Engadir/Logaritmos das variables seleccionadas
# loop Programming
Argumento: control
Opcións: --progressive (Permite formas especiais de certas instrucións)
--verbose (Amosa os detalles das instrucións genr)
--quiet (Non amosa o número de iteracións realizadas)
Exemplos: loop 1000
loop 1000 --progressive
loop while essdiff > .00001
loop i=1991..2000
loop for (r=-.99; r<=.99; r+=.01)
loop foreach i xlista
Esta instrución abre un modo especial no que o programa admite que as
instrucións se executen repetidas veces. Terminas o proceso de ir
introducindo as instrucións do bucle con "endloop" e neste punto
execútanse as instrucións apiñadas.
O parámetro "control" pode ter calquera das 5 formas seguintes, tal como se
amosa nos exemplos: (a) un número enteiro que indica as veces a repetir as
instrucións dun bucle; (b) a palabra "while" máis unha condición
booleana; (c) un rango de valores enteiros para o índice; (d) a palabra
"for" máis 3 expresións dentro dunha paréntese, separadas con punto e
comas (que imita a orde for na linguaxe de programación C); ou (e) a
palabra "foreach" máis unha variable índice e unha lista.
Consulta o Guía de usuario de Gretl (Capítulo 12) para obter outros
detalles e exemplos. Aí explícase o efecto da opción --progressive (que
está deseñada para utilizarse con simulacións de tipo Monte Carlo). Non
podes utilizar todas as instrucións de Gretl dentro dun bucle; entón as
instrucións dispoñibles neste contexto tamén se expoñen aí.
# mahal Statistics
Argumento: listavariables
Opcións: --quiet (Non presenta nada)
--save (Engade as distancias ao conxunto de datos)
--vcv (Presenta a matriz de covarianzas)
Calcula as distancias de Mahalanobis entre as series indicadas en
listavariables. A distancia de Mahalanobis é a distancia entre dous puntos
nun espazo de dimensión k, escalada pola variación estatística en cada
dimensión do espazo. Por exemplo, se p e q son dúas observacións dun
conxunto de k variables con matriz de covarianzas C, entón a distancia de
Mahalanobis entre as observacións ven dada por
sqrt((p - q)' * C-inverse * (p - q))
onde (p - q) é un vector de dimensión k. Isto redúcese á distancia
euclidiana en caso de que a matriz de covarianzas sexa unha matriz
identidade.
O espazo para o que se calculan as distancias defínese polas variables
seleccionadas. Para cada observación do rango vixente da mostra, a
distancia calcúlase entre a observación e o centroide das variables
escollidas. Esta distancia é a contrapartida multidimensional dunha
puntuación z estándar, e podes utilizala para xulgar se unha observación
dada "ten un sitio" xunto a un grupo doutras observacións.
Cando indicas a opción --vcv, preséntanse tanto a matriz de covarianzas
como a súa inversa. Cando indicas a opción --save, as distancias gárdanse
no conxunto de datos co nome mdist (ou mdist1, mdist2 e así sucesivamente,
se xa existe unha variable con ese nome).
Ruta do menú: /Ver/Distancias de Mahalanobis
# makepkg Programming
Argumento: nomeficheiro
Opcións: --index (Escribe o ficheiro índice auxiliar)
--translations (Escribe o ficheiro de cadeas de texto auxiliar)
Dá soporte á creación dun paquete de funcións de Gretl mediante a liña
de instrucións. O modo de funcionamento desta instrución depende da
extensión do nomeficheiro, que debe de ser ben .gfn ou ben .zip.
Modo gfn
Escribe un ficheiro gfn. Asúmese que pode accederse a un ficheiro de
especificación dun paquete, que ten o mesmo nome base ca nomeficheiro pero
coa extensión .spec, xunto con calquera ficheiro auxiliar ao que faga
referencia. Tamén asúmese que todas as funcións a empaquetar léronse na
memoria.
Modo zip
Escribe un ficheiro comprimido zip dun paquete (un gfn máis outros
elementos). En caso de acharse un ficheiro gfn co mesmo nome base que
nomeficheiro, Gretl comproba os ficheiros correspondentes inp e spec, e se
os atopa a ambos sendo polo menos un deles máis novo ca o ficheiro gfn,
entón vólvese xerar o gfn; noutro caso, utilízase o gfn existente. Cando
non se atopa ese ficheiro, Gretl tenta primeiro xerar o gfn.
Opcións de gfn
Os indicadores de opcións admiten a escritura de ficheiros auxiliares,
pensados para utilizar cos "engadidos" de Gretl. O ficheiro índice é un
curto documento XML que contén información básica sobre o paquete, e que
ten o seu mesmo nome como base e a extensión .xml. O ficheiro de
traducións contén as cadeas de texto do paquete (en formato C) que
poderían ser apropiadas para a tradución; para un paquete foo este
ficheiro chámase foo-i18n.c. Estes ficheiros non se xeran se a instrución
opera en modo zip e se utiliza un ficheiro gfn que xa existía.
Para obter máis detalles sobre todo isto, consulta o Manual de paquetes de
funcións de Gretl.
Ruta do menú: /Ficheiro/Paquetes de funcións/Novo paquete
# markers Dataset
Variantes: markers --to-file=nomeficheiro
markers --from-file=nomeficheiro
markers --delete
Coa opción --to-file, escribe no ficheiro indicado as cadeas de texto (unha
por cada liña) que son marcadores das observacións do conxunto vixente de
datos. Se este non presenta ningunha desas cadeas, amósase un fallo. O
ficheiro resultante vaise escribir no cartafol ("workdir") establecido nese
momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Coa opción --from-file, lese o ficheiro especificado (que debe de ser de
texto plano) e asígnanse os marcadores de observación contidos neste, un
por cada liña, ás filas do conxunto de datos. En xeral, debería de haber
como mínimo tantos marcadores no ficheiro como observacións no conxunto de
datos; pero se o conxunto de datos é de tipo panel, tamén se acepta que o
número de marcadores no ficheiro coincida co número de unidades de
sección cruzada (en cuxo caso os marcadores repítense para cada período
de tempo.)
A opción --delete fai o que xa agardarías, é dicir, eliminar as cadeas de
texto que marcan cada observación do conxunto de datos.
Ruta do menú: /Datos/Marcadores das observacións
# meantest Tests
Argumentos: serie1 serie2
Opción: --unequal-vars (Asume que as varianzas non son iguais)
Calcula o estatístico t para probar a hipótese nula de que as medias na
poboación son iguais para as variables serie1 e serie2, e amosa a súa
probabilidade asociada (valor p).
Por defecto, o estatístico de proba calcúlase baixo o suposto de que as
varianzas son iguais para as dúas variables.Coa opción --unequal-vars
asúmese que as varianzas son diferentes; e neste caso, os graos de
liberdade do estatístico de proba aproxímanse consonte a Satterthwaite
(1946).
Ruta do menú: /Ferramentas/Calculadora de probas
# midasreg Estimation
Argumentos: depvar indepvars ; termosMIDAS
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--quiet (Non presenta os resultados)
--levenberg (Mira abaixo)
Exemplos: midasreg y 0 y(-1) ; mds(X, 1, 9, 1, theta)
midasreg y 0 y(-1) ; mds(X, 1, 9, 0)
midasreg y 0 y(-1) ; mdsl(XL, 2, theta)
Mira tamén gdp_midas.inp
Leva a cabo a estimación por mínimos cadrados (ben MCNL ou ben MCO,
dependendo da especificación) dun modelo MIDAS (Mixed Data Sampling). Este
tipo de modelos inclúe unha ou máis variables independentes que se
observan cunha frecuencia maior que a variable dependente; para unha boa e
breve introdución consulta Armesto, Engemann e Owyang (2010).
As variables de indepvars deben de ter a mesma frecuencia que a variable
dependente. Esta lista normalmente debe incluír const ou 0 (ordenada na
orixe), e habitualmente inclúe un ou máis retardos da variable dependente.
Os termos de alta frecuencia indícanse despois dun punto e coma; cada un
ten o formato duns cuantos argumentos entre parénteses, separados con
comas, precedidos ben por mds ou ben por mdsl.
mds: Esta variante xeralmente require 5 argumentos, do xeito seguinte: o
nome dunha "MIDAS list", dous enteiros que indican os retardos mínimo e
máximo de alta frecuencia, un enteiro entre 0 e 4 que especifica o tipo de
disposición dos parámetros que se vai usar, e o nome dun vector que
contén os valores iniciais dos parámetros. O exemplo de abaixo solicita os
retardos do 3 ao 11 das series de alta frecuencia representadas na lista X,
utilizando para elo unha disposición dos parámetros de tipo 1 (Almon
exponencial, mira abaixo) co vector de inicio theta.
mds(X, 3, 11, 1, theta)
mdsl: Xeralmente require 3 argumentos: o nome dunha lista de retardos MIDAS,
un número enteiro para especificar o tipo de disposición dos parámetros e
o nome dun vector de inicio. Neste caso, os retardos máximo e mínimo
están implícitos no argumento inicial da lista. No exemplo de abaixo Xlags
debe de ser unha lista que xa conteña todos os retardos que se necesiten;
podes construír unha lista dese tipo utilizando a función "hflags".
mdsl(XLags, 1, theta)
Os tipos de disposición de parámetros que se admiten son os seguintes:
0 = "MIDAS non restrinxido" ou U-MIDAS, no que cada retardo ten o seu propio
coeficiente.
1 = Almon exponencial normalizada, que require polo menos un parámetro e
habitualmente utiliza dous.
2 = Beta normalizada cun derradeiro retardo nulo, que require exactamente
dous parámetros.
3 = Beta normalizada cun derradeiro retardo non nulo, que require
exactamente tres parámetros.
4 = Polinomio de Almon (non normalizada), que require polo menos un
parámetro.
Cando a disposición de parámetros é U-MIDAS, non é necesario o vector de
inicio do último argumento con mds nin mdsl. Noutros casos, podes solicitar
unha iniciación automática substituíndo o nome do vector de parámetros
inicial por algunha destas dúas formas:
A palabra chave null: isto só é admisible cando a disposición dos
parámetros ten un número fixo de termos (os casos Beta, o 2 ou 3).
Tamén se acepta no caso do Almon exponencial, o que implica que ese é o
valor por defecto dos dous parámetros.
Un valor enteiro que indica o número requirido de parámetros.
O método de estimación que utiliza esta instrución depende da
especificación dos elementos de alta frecuencia. No caso de U-MIDAS, o
método é MCO (OLS); noutro caso é mínimos cadrados non lineais (MCNL ou
NLS). Cando especificas as disposicións de parámetros Almon exponencial
normalizada ou Beta normalizada, o método MCNL por defecto é unha
combinación de BFGS restrinxido e MCO, pero podes indicar a opción
--levenverg para forzar que se utilice o algoritmo de Levenberg-Marquardt.
Ruta do menú: /Modelar/Series temporais/MIDAS
# mle Estimation
Argumentos: función logaritmo-verosimilitude [ derivadas ]
Opcións: --quiet (Non amosa o modelo estimado)
--vcv (Presenta a matriz de covarianzas)
--hessian (Basea a matriz de covarianzas na Hessiana)
--robust (Matriz de covarianzas CMV (QML))
--cluster=clustvar (Matriz de covarianzas robusta por agrupación)
--verbose (Presenta os detalles das iteracións)
--no-gradient-check (Mira abaixo)
--lbfgs (Utiliza L-BFGS-B en vez do BFGS habitual)
Exemplos: weibull.inp
Realiza a estimación de Máxima Verosimilitude (MV ou ML) utilizando ben o
algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno) ou ben o método de
Newton. Debes de especificar a función logaritmo de verosimilitude. E debes
de expresar os parámetros desta función e asignarlles valores iniciais
antes da estimación. Opcionalmente, o usuario pode especificar as derivadas
da función logaritmo de verosimilitude con respecto a cada un dos
parámetros; se non indicas as derivadas analíticas, calcúlase unha
aproximación numérica.
Exemplo sinxelo: Supón que temos unha serie X con valores 0 ou 1, e
queremos obter a estimación máximo verosímil da probabilidade (p) de que
X = 1. (Neste caso sinxelo, pódese adiantar que a estimación MV de p será
simplemente equivalente á proporción de Xs iguais a 1 na mostra.)
Débese primeiro engadir o parámetro p ao conxunto de datos e indicar o seu
valor inicial. Por exemplo, scalar p = 0.5.
A continuación, configúrase o bloque de instrucións de estimación EMV:
mle loglik = X*log(p) + (1-X)*log(1-p)
deriv p = X/p - (1-X)/(1-p)
end mle
A primeira liña de arriba especifica a función logaritmo de
verosimilitude. Comeza coa palabra chave mle, logo especifícase a variable
dependente e indícase unha expresión para o logaritmo da verosimilitude
(usando a mesma sintaxe que na instrución "genr"). A seguinte liña (que é
opcional) comeza coa palabra chave deriv e proporciona a derivada da
función logaritmo de verosimilitude con respecto ao parámetro p. Se non
indicas as derivadas, debes de incluír unha orde utilizando a palabra chave
params que identifique os parámetros libres: estes enuméranse nunha liña,
separados por espazos e poden ser ben escalares, ben vectores, ou ben
calquera combinación dos dous. Por exemplo, podes mudar o de arriba en:
mle loglik = X*log(p) + (1-X)*log(1-p)
params p
end mle
en cuxo caso utilizaríanse derivadas numéricas.
Ten en conta que calquera indicador de opción debe de engadirse á liña
final do bloque EMV (MLE).
As desviacións padrón estimadas baséanse no Produto Externo do vector
Gradiente, por defecto. Se indicas a opción --hessian, baséanse en troques
na inversa negativa da matriz Hessiana (que se aproxima numericamente). Se
indicas a opción --robust, utilízase un estimador CMV (QML, un
"emparedado" entre a inversa negativa da matriz Hessiana e a matriz de
covarianzas do vector gradiente, en concreto).
Se proporcionas as derivadas analíticas, por defecto Gretl executa unha
verificación numérica da súa credibilidade. Algunhas veces isto pode
producir falsos positivos, por situacións nas que as derivadas correctas
semellan ser incorrectas e a estimación rexéitase. Para ter isto en conta
ou para acadar unha pouca velocidade adicional, podes indicar a opción
--no-gradient-check. Obviamente, debes de facer isto só cando teñas
certeza de que o vector gradiente que especificaches é correcto.
Nomes de parámetros
Ao estimar un modelo non linear, con frecuencia é conveniente nomear os
parámetros de forma sucinta. Agora ben, ao presentar os resultados, pode
que desexes utilizar etiquetas máis informativas. Isto o podes lograr
mediante a palabra chave adicional param_names dentro do bloque de
instrucións. Para un modelo con k parámetros, o argumento que sigue a esta
palabra chave debe de ser ben unha cadea de texto literal contornada entre
comiñas que conteña k nomes separados por espazos, ou ben o nome dunha
variable de cadea que conteña k deses nomes.
Para unha descrición máis en profundidade da estimación "mle", consulta o
Guía de usuario de Gretl (Capítulo 22).
Ruta do menú: /Modelar/Máxima Verosimilitude
# modeltab Utilities
Variantes: modeltab add
modeltab show
modeltab free
modeltab --output=nomeficheiro
Permite manexar a "Táboa de modelos" de Gretl; consulta o Guía de usuario
de Gretl (Capítulo 3) para obter máis detalles. As instrucións
subordinadas teñen os seguintes efectos: "add" engade o derradeiro modelo
estimado á táboa de modelos, cando sexa posible; "show" amosa a táboa de
modelos nunha xanela; e "free" limpa a táboa.
Para solicitar que se garde a táboa de modelos, usa a opción --output=
máis un nome de ficheiro. Cando o nome do ficheiro teña o sufixo ".tex", o
resultado vai estar en formato TeX; cando o sufixo sexa ".rtf", o resultado
terá formato RTF; e noutro caso, vai estar en texto plano. No caso dun
resultado TeX, por defecto xérase un "anaco" axeitado para incluír nun
documento; en cambio, se queres un documento independente, usa a opción
--complete, como por exemplo
modeltab --output="myfile.tex" --complete
Ruta do menú: Xanela de iconas de sesión: icona de Táboa de modelos
# modprint Printing
Argumentos: matrizcoef nomes [ estatadicionais ]
Opción: --output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Presenta a táboa de coeficientes e estatísticos adicionais optativos para
un modelo estimado "á man"; é útil sobre todo para funcións escritas
polo usuario.
O argumento matrizcoef debe de ser unha matriz de dimensión k por 2, que
contén k coeficientes e k desviacións padrón asociadas. O argumento nomes
debe de proporcionar polo menos k nomes para etiquetar os coeficientes.
Podes indicalo co formato: (a) dunha cadea de texto literal (contornada
entre comiñas) ou dunha variable de cadea, que conteña os nomes separados
por comas ou espazos, ou (b) un arranxo xa definido de cadeas de texto.
O argumento estatadicionais (opcional) é un vector que contén p
estatísticos adicionais que se amosan debaixo da táboa de coeficientes. Se
indicas este argumento, entón nomes debe de conter k + p nomes, de forma
que os p nomes agregados se asocien aos estatísticos adicionais.
Para colocar o resultado nun ficheiro, utiliza a opción --output= máis un
nome de ficheiro. Cando o nome de ficheiro teña o sufixo ".tex", o
resultado vai estar en formato TeX; cando o sufixo sexa ".rtf", o resultado
terá formato RTF; e noutro caso, vai estar en texto plano. No caso dun
resultado TeX, por defecto xérase un "anaco" axeitado para incluír nun
documento; en cambio, se queres un documento independente, usa a opción
--complete.
O ficheiro resultante escríbese no cartafol ("workdir") establecido nese
momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
# modtest Tests
Argumento: [ nivel ]
Opcións: --normality (Normalidade das perturbacións)
--logs (Non linearidade: logaritmos)
--autocorr (Autocorrelación)
--arch (ARCH)
--squares (Non linearidade: cadrados)
--white (Heterocedasticidade: proba de White)
--white-nocross (Proba de White: só cadrados)
--breusch-pagan (Heterocedasticidade: proba de Breusch-Pagan)
--robust (Estimación con varianzas robustas para Breusch-Pagan)
--panel (Heterocedasticidade: por grupos)
--comfac (Restrición de factor común: só modelos AR1)
--xdepend (Dependencia de sección cruzada: só con datos de panel)
--quiet (Non presenta os detalles)
--silent (Non presenta nada)
Debe de seguir inmediatamente a unha instrución de estimación. A
discusión de abaixo aplícase á utilización desta instrución a
continuación da estimación dun modelo dunha única ecuación; consulta o
Guía de usuario de Gretl (Capítulo 28) para unha exposición de como opera
"modtest" despois da estimación dun VAR.
Dependendo da opción que indiques, esta instrución efectúa unha destas: a
proba de Normalidade da perturbación de Doornik-Hansen; unha proba de non
linearidade (logaritmos ou cadrados) con multiplicadores de Lagrange; a
proba de heterocedasticidade de White (con ou sen produtos cruzados) ou a de
Breusch-Pagan (Breusch e Pagan, 1979); a proba LMF de autocorrelación
(Kiviet, 1986); unha proba de ARCH (Heterocedasticidade Condicional
Autorregresiva; consulta tamén a instrución "arch"); unha proba da
restrición de factor común implícita na estimación AR(1); ou unha proba
de dependencia de sección cruzada en modelos con datos de panel. Coa
excepción das probas de Normalidade, de factor común e de dependencia de
sección cruzada, a meirande parte das opcións destas probas só están
dispoñibles para modelos estimados mediante MCO, pero mira máis abaixo
para obter máis detalles en relación con Mínimos Cadrados en 2 Etapas.
O argumento nivel (opcional) é importante só no caso de que escollas as
opcións --autocorr ou --arch. Por defecto, estas probas execútanse
utilizando un nivel de retardos igual á periodicidade dos datos, pero podes
axustar isto indicando un nivel de retardos específico.
A opción --robust aplícase unicamente cando seleccionas a proba de
Breusch-Pagan; o seu efecto consiste en que se utiliza o estimador robusto
da varianza proposto por Koenker (1981), facendo a proba menos sensible ao
suposto de Normalidade.
A opción --panel está dispoñible só cando o modelo se estima con datos
de panel; e neste caso, realízase unha proba de heterocedasticidade por
grupos (é dicir, de varianzas diferentes das perturbacións entre as
unidades de sección cruzada).
A opción --comfac está dispoñible só cando o modelo se estima mediante
un método AR(1) tal como o de Hildreth-Lu. A regresión auxiliar toma a
forma dun modelo dinámico relativamente non restrinxido, que se utiliza
para probar a restrición de factor común implícita na especificación
AR(1).
A opción --xdepend está dispoñible só para modelos estimados con datos
de panel. O estatístico de proba é o desenvolvido por Pesaran (2004). A
hipótese nula é que a perturbación distribúese independentemente entre
as unidades atemporais ou os individuos.
Por defecto, o programa presenta a regresión auxiliar na que se basea o
estatístico de proba, sé é aplicable. Podes eliminar isto utilizando a
opción --quiet (presentación mínima de resultados) ou a opción --silent
(non presenta ningún resultado). Podes recuperar o estatístico de proba e
a súa probabilidade asociada (valor p) utilizando os accesorios "$test" e
"$pvalue", respectivamente.
Cando un modelo se estima por Mínimos Cadrados en 2 Etapas (consulta
"tsls"), ráchase o principio de Máxima Verosimilitude e Gretl ofrece
algúns equivalentes: a opción --autocorr calcula o estatístico de Godfrey
para probar autocorrelación (Godfrey, 1994) mentres que a opción --white
produce o estatístico da proba HET1 de heterocedasticidade (Pesaran e
Taylor, 1999).
Ruta do menú: Fiestra de modelo: Probas
# mpols Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--simple-print (Non presenta os estatísticos auxiliares)
--quiet (Non presenta os resultados)
Calcula as estimacións de MCO para o modelo especificado, utilizando
aritmética de punto flotante con precisión múltiple, coa axuda da
biblioteca Gnu Multiple Precision (GMP). Por defecto, utilízanse 256 bits
de precisión nos cálculos, pero podes aumentar isto mediante a variable de
contorna GRETL_MP_BITS. Por exemplo, cando utilizas o intérprete Bash se te
podería ocorrer a seguinte instrución para establecer unha precisión de
1024 bits antes de comezar Gretl.
export GRETL_MP_BITS=1024
Dispós dunha opción (máis ben rebuscada) para esta instrución,
principalmente co propósito de facer probas: cando a lista indepvars vai
seguida dun punto e coma, máis dunha lista posterior de números, eses
números tómanse como potencias de x que se engaden á regresión, onde x
é a última variable de indepvars. Estes termos adicionais calcúlanse e
gárdanse con precisión múltiple. No seguinte exemplo, faise a regresión
de y sobre x máis a segunda, terceira e cuarta potencias dese x:
mpols y 0 x ; 2 3 4
Ruta do menú: /Modelar/Outros Modelos Lineais/MCO lineais de alta precisión
# negbin Estimation
Argumentos: depvar indepvars [ ; exposición ]
Opcións: --model1 (Utiliza o modelo NegBin 1)
--robust (Matriz de covarianzas CMV (QML))
--cluster=clustvar (Consulta "logit" para unha explicación)
--opg (Mira abaixo)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
Estima un modelo Binomial Negativo. Tómase a variable dependente para
representar un reconto do número de veces que ocorre un suceso dalgún
tipo, e debe de ter só valores enteiros non negativos. Por defecto,
utilízase o modelo NegBin 2 no que a varianza condicionada do reconto ven
determinada por mu(1 + αmu), onde mu denota a media condicionada. Pero se
indicas a opción --model1, a varianza condicionada é mu(1 + α).
A serie de exposición (offset, opcional) funciona do mesmo xeito que para a
instrución "poisson". O modelo de Poisson é unha forma restrinxida da
Binomial Negativa na que α = 0 por construción.
Por defecto, as desviacións padrón calcúlanse utilizando unha
aproximación numérica á matriz Hessiana na converxencia. Pero se indicas
a opción --opg, a matriz de covarianzas baséase no Produto Externo do
vector Gradiente, PEG (OPG), e se indicas a opción --robust, calcúlanse as
desviacións padrón CMV (QML), utilizando un "emparedado" entre a inversa
da matriz Hessiana e o PEG.
Ruta do menú: /Modelar/Variable Dependente Limitada/Datos de Reconto
# nls Estimation
Argumentos: función [ derivadas ]
Opcións: --quiet (Non presenta o modelo estimado)
--robust (Desviacións padrón robustas)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--no-gradient-check (Mira abaixo)
Exemplos: wg_nls.inp
Realiza a estimación de Mínimos Cadrados Non Lineais (MCNL ou NLS)
utilizando unha versión modificada do algoritmo de Levenberg-Marquardt.
Debes de indicar a especificación dunha función e de enunciar os
parámetros desta, ademais de darlles os seus valores iniciais antes da
estimación. Como opción, podes especificar as derivadas da función de
regresión con respecto a cada un dos parámetros. Se non proporcionas as
derivadas, no seu lugar debes de indicar unha lista dos parámetros que se
van estimar (separados por espazos ou comas), precedida pola palabra chave
params. Neste último caso, calcúlase unha aproximación numérica ao
Xacobiano.
Resulta máis doado amosar o que se require mediante un exemplo. O que segue
é un guión completo para estimar a función non linear de consumo
establecida no libro Econometric Analysis (capítulo 11 da 4a edición ou
capítulo 9 da 5a) de William Greene. Os números á esquerda das liñas son
só para tomar como referencia e non son parte das instrucións. Ten en
conta que calquera indicador de opción, como sería --vcv para presentar a
matriz de covarianzas dos estimadores dos parámetros, deberías de engadilo
á instrución final, end nls.
1 open greene11_3.gdt
2 ols C 0 Y
3 scalar alfa = $coeff(0)
4 scalar beta = $coeff(Y)
5 scalar gamma = 1.0
6 nls C = alfa + beta * Y^gamma
7 deriv alfa = 1
8 deriv beta = Y^gamma
9 deriv gamma = beta * Y^gamma * log(Y)
10 end nls --vcv
Con frecuencia é conveniente iniciar os parámetros cunha referencia a un
modelo linear relacionado; isto lógrase aquí coas liñas da 2 á 5. Os
parámetros alfa, beta e gamma poden establecerse con calquera valor inicial
(non necesariamente baseados nun modelo estimado con MCO), aínda que a
converxencia do procedemento de MCNL non está garantida para calquera punto
de inicio que se te antolle.
As auténticas instrucións MCNL ocupan as liñas da 6 ata a 10. Na liña 6
indícase a instrución "nls" na que se declara a variable dependente, cun
signo de igualdade a continuación, e seguido este da especificación dunha
función. A sintaxe para o lado dereito da expresión é a mesma que a da
instrución "genr". As seguintes 3 liñas especifican as derivadas da
función de regresión con respecto a cada un dos parámetros, de un en un.
Cada liña comeza coa palabra chave "deriv", establece o nome dun
parámetro, un signo de igualdade e unha expresión pola que pode calcularse
a derivada. En lugar de proporcionar as derivadas numéricas, como
alternativa podes substituír as liñas da 7 á 9 polo seguinte:
params alfa beta gamma
A liña 10, "end nls", completa a instrución e solicita a estimación.
Calquera opción deberás de engadila a esta liña.
Se proporcionas as derivadas analíticas, por defecto Gretl executa unha
verificación numérica da súa credibilidade. Algunhas veces isto pode
producir falsos positivos, por situacións nas que as derivadas correctas
semellan ser incorrectas e a estimación rexéitase. Para ter isto en conta
ou para acadar unha pouca velocidade adicional, podes indicar a opción
--no-gradient-check. Obviamente, debes de facer isto só cando teñas
certeza de que o vector gradiente que especificaches é correcto.
Nomes de parámetros
Ao estimar un modelo non linear, con frecuencia é conveniente nomear os
parámetros de forma sucinta. Agora ben, ao presentar os resultados, pode
que desexes utilizar etiquetas máis informativas. Isto o podes lograr
mediante a palabra chave adicional param_names dentro do bloque de
instrucións. Para un modelo con k parámetros, o argumento que sigue a esta
palabra chave debe de ser ben unha cadea de texto literal contornada entre
comiñas que conteña k nomes separados por espazos, ou ben o nome dunha
variable de cadea que conteña k deses nomes.
Para obter outros detalles sobre a estimación MCNL (NLS), consulta o Guía
de usuario de Gretl (Capítulo 21).
Ruta do menú: /Modelar/Mínimos Cadrados Non Lineais
# normtest Tests
Argumento: serie
Opcións: --dhansen (Proba de Doornik-Hansen, por defecto)
--swilk (Proba de Shapiro-Wilk)
--lillie (Proba de Lilliefors)
--jbera (Proba de Jarque-Bera)
--all (Fai todas as probas)
--quiet (Non presenta os resultados)
Realiza unha proba de normalidade para a serie indicada. O tipo de proba en
concreto contrólase polo indicador de opción (e execútase a proba de
Doornik-Hansen cando non indicas ningunha opción). Advertencia: As probas
de Doornik-Hansen e Shapiro-Wilk son máis recomendables que as outras,
tendo en conta as súas mellores propiedades en mostras pequenas.
Mediante os accesorios "$test" e "$pvalue" podes recuperar o estatístico de
proba e a súa probabilidade asociada (valor p), respectivamente. Ten en
conta que cando indicas a opción --all, o resultado gardado é o da proba
de Doornik-Hansen.
Ruta do menú: /Variable/Probas de Normalidade
# nulldata Dataset
Argumento: lonxitude
Opción: --preserve (Retén as variables que non son series)
Exemplo: nulldata 500
Establece un conxunto de datos "en branco" que: inclúe só unha constante
máis unha variable índice, ten periodicidade 1 e contén o número de
observacións especificado no argumento. Podes utilizar isto coa intención
de facer simulacións, pois funcións coma "uniform()" e "normal()" xeran
series artificiais comezando polo principio, para reencher o conxunto de
datos. Esta instrución pode ser moi útil en combinación con "loop".
Consulta tamén a opción "semente" da instrución "set".
Por defecto, esta instrución libra todos os datos do espazo vixente de
traballo de Gretl, non só as series senón tamén as matrices, os
escalares, as cadeas de texto, etc. Agora ben, cando indicas a opción
--preserve, retense calquera variable que non sexa unha serie e estea
definida nese momento.
Ruta do menú: /Ficheiro/Novo conxunto de datos
# ols Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Desviacións padrón agrupadas)
--jackknife (Mira abaixo)
--simple-print (Non presenta estatísticos auxiliares)
--quiet (Non presenta os resultados)
--anova (Presenta unha táboa ANOVA)
--no-df-corr (Elimina a corrección dos graos de liberdade)
--print-final (Mira abaixo)
Exemplos: ols 1 0 2 4 6 7
ols y 0 x1 x2 x3 --vcv
ols y 0 x1 x2 x3 --quiet
Calcula as estimacións de mínimos cadrados ordinarios (MCO ou OLS) sendo
depvar a variable dependente e indepvars unha lista de variables
independentes. Podes especificar as variables co nome ou co número; e
utiliza o número cero para indicar o termo constante.
Aparte das estimacións dos coeficientes e das desviacións padrón, o
programa tamén presenta as probabilidades asociadas (valores p) aos
estatísticos t (con dúas colas) e F. Un 'valor p' por debaixo de 0.01
indica significación estatística a un nivel do 1 por cento, e márcase con
***. A marca ** indica niveles de significación entre 1 e 5 por cento, e a
marca * indica niveles entre 5 e 10 por cento. Tamén preséntanse os
estatísticos para elixir modelos (o Criterio de Información de Akaike ou
AIC, e o Criterio de Información Baiesiano de Schwarz). A fórmula
utilizada para o AIC é a proporcionada por Akaike (1974), en concreto,
menos dúas veces o logaritmo da verosimilitude maximizada máis dúas veces
o número de parámetros estimados.
Se indicas a opción --no-df-corr, non se aplica a corrección habitual dos
graos de liberdade ao calcular a varianza estimada da perturbación (e polo
tanto, tampouco as desviacións padrón dos estimadores dos parámetros).
A opción --print-final é aplicable só no contexto dun bucle ("loop"), e
dispón que a regresión se execute silandeiramente en todas as iteracións
do bucle, agás na derradeira. Consulta o Guía de usuario de Gretl
(Capítulo 12) para obter máis detalles.
Podes recuperar varias variables internas despois da estimación. Por
exemplo:
series uh = $uhat
garda os erros da estimación baixo o nome uh. Consulta a sección
"Accesorios" da Guía de funcións de Gretl para obter máis detalles.
Podes axustar a fórmula (versión "HC") específica que se vai utilizar
para xerar as desviacións padrón robustas cando indicas a opción
--robust, mediante a instrución "set". A opción --jackknife ten como
consecuencia a selección dunha hc_version de 3a. A opción --cluster anula
a selección da versión HC, e produce as desviacións padrón robustas
agrupando as observacións segundo os distintos valores de clustvar.
Consulta o Guía de usuario de Gretl (Capítulo 18) para obter máis
detalles.
Ruta do menú: /Modelar/Mínimos Cadrados Ordinarios
Outro acceso: Botón co símbolo beta na barra de ferramentas
# omit Tests
Argumento: listavariables
Opcións: --test-only (Non substitúe o modelo vixente)
--chi-square (Devolve a forma Khi-cadrado da proba de Wald)
--quiet (Presenta só os resultados básicos da proba)
--silent (Non presenta nada)
--vcv (Presenta a matriz de covarianzas do modelo reducido)
--auto[=alfa] (Eliminación secuencial, mira abaixo)
Exemplos: omit 5 7 9
omit seasonals --quiet
omit --auto
omit --auto=0.05
Esta instrución debe de ir despois dunha instrución de estimación.
Calcula o estatístico de proba de Wald para a significación conxunta das
variables de listavariables, que debe de ser un subconxunto das variables
independentes do último modelo estimado. Podes recuperar os resultados da
proba utilizando os accesorios "$test" e "$pvalue".
Por defecto, estímase o modelo restrinxido e este substitúe ao orixinal
como "modelo vixente" se tes intención, por exemplo, de recuperar os erros
con $uhat ou facer probas posteriores. Podes impedir este comportamento
mediante a opción --test-only.
Por defecto, rexístrase a forma F da proba de Wald; pero podes utilizar a
opción --chi-square para recoller a a forma khi-cadrado no seu lugar.
Se ben estimas como tamén representas o modelo restrinxido, a opción --vcv
ten o efecto de presentar a súa matriz de covarianzas; noutro caso, esta
opción ignórase.
Como alternativa, cando indicas a opción --auto, lévase adiante a
eliminación secuencial por pasos. En cada etapa exclúese a variable ligada
á maior probabilidade asociada (valor p), ata que todas as que queden
estean ligadas a valores p que non sexan maiores ca algún valor de corte.
Por defecto, este é do 10 por cento (con 2 colas) e podes axustalo
engadindo "=" e un valor entre 0 e 1 (sen espazos), como no cuarto exemplo
de arriba. Se indicas listavariables, este proceso limítase só ás
variables da lista; noutro caso, todas as variables se tratan como
candidatas á exclusión. Cae na conta de que as opcións --auto e
--test-only non podes combinalas.
Ruta do menú: Xanela de modelo: Probas/Excluír variables
# open Dataset
Argumento: nomeficheiro
Opcións: --quiet (Non presenta a lista das series)
--preserve (Retén as variables que non son series)
--frompkg=nomepaquete (Mira abaixo)
--www (Utiliza un banco de datos do servidor de Gretl)
Mira abaixo para opcións adicionais especiais
Exemplos: open data4-1
open voter.dta
open fedbog --www
Abre un ficheiro de datos ou un banco de datos. Se xa hai aberto un ficheiro
de datos, este substitúese polo que se vai abrir. Para engadir datos ao
conxunto vixente, consulta "append" e (para ter maior flexibilidade) "join".
Se non indicas unha ruta completa, o programa busca nalgunhas rutas
destacadas para tratar de atopar o ficheiro, das que o cartafol vixente
("workdir") é a primeira elección. Se non indicas o sufixo no nome de
ficheiro (como no primeiro exemplo de arriba), Gretl asume que é un
ficheiro de datos propio con sufixo .gdt. Baseándose no nome do ficheiro e
varias regras heurísticas, Gretl tratará de detectar o formato do ficheiro
de datos (propio, texto plano, CSV, MS Excel, Stata, SPSS, etc.).
Cando se utiliza a opción --frompkg, Gretl vai procurar o ficheiro
especificado de datos no subcartafol asociado ao paquete de función
especificado por nomepaquete.
Se o argumento nomeficheiro toma a forma dun identificador de recursos
uniforme (URI) que comeza por http://, entón Gretl tratará de descargar o
ficheiro de datos indicado antes de abrilo.
Por defecto, ao abrir un novo ficheiro de datos líbrase a sesión vixente
de Gretl, o que inclúe a eliminación de todas as variables definidas,
incluíndo matrices, escalares e cadeas de texto. Se queres manter as
variables que teñas definidas nese momento (as que non sexan series, pois
estas elimínanse obrigatoriamente), utiliza a opción --preserve.
Tamén podes utilizar a instrución open para abrir un banco de datos (de
Gretl, RATS 4.0 ou PcGive) para lelo. Nese caso, deberá de ir seguida da
instrución "data" para extraer series concretas do banco de datos. Cando
indicas a opción www, o programa vai tratar de acceder ao banco de datos do
nome indicado no servidor de Gretl (por exemplo, o banco de datos dos tipos
de interese da Reserva Federal do terceiro exemplo de arriba).
Ao abrir un ficheiro de folla de cálculo (Gnumeric, Open Document ou MS
Excel), podes facilitar tres parámetros adicionais despois do nome do
ficheiro. Primeiro, podes escoller unha folla de cálculo concreta dentro do
ficheiro. Isto faise ben indicando o número de folla por medio da sintaxe
(e.g., --sheet=2), ou ben indicando o nome da folla (se o sabes) entre
comiñas, como en --sheet="MacroData" pois, por defecto, vaise ler a
primeira folla de cálculo do ficheiro. Tamén podes especificar un
desprazamento de columna e/ou de fila dentro da folla de cálculo mediante,
e.g.,
--coloffset=3 --rowoffset=2
o que vai provocar que Gretl ignore as 3 primeiras columnas e as 2 primeiras
filas. Por defecto, hai un desprazamento de 0 en ambas dimensións, é
dicir, comézase a ler na cela de arriba á esquerda.
Con ficheiros de texto plano, Gretl xeralmente agarda atopar as columnas de
datos delimitadas dalgún xeito estándar. Pero tamén hai un recurso
especial para ler ficheiros de "formato fixo", nos que non hai delimitadores
pero hai unha especificación coñecida da forma, e.g., "a variable k ocupa
8 columnas comezando na columna 24". Para ler ese tipo de ficheiros, debes
de engadir unha cadea de texto con --fixed-cols=colspec, onde colspec
componse de números enteiros separados por comas. Estes enteiros se
interpretan coma un conxunto de pares. O primeiro elemento de cada par
denota unha columna de comezo, medida en bytes desde o principio da liña,
na que o 1 indica o primeiro byte; e o segundo elemento de cada par indica
cantos bytes se deben de ler para o campo indicado. Así, por exemplo, se
indicas
open fixed.txt --fixed-cols=1,6,20,3
entón Gretl vai ler 6 bytes comezando na columna 1 para a variable 1; e
para a variable 2, vai ler 3 bytes comezando na columna 20. As liñas que
están en branco, ou que comezan con # ignóranse; pero en caso contrario
aplícase o padrón de lectura de columnas, e cando se atopa algo distinto a
un valor numérico válido, amósase un fallo. Cando se len os datos
satisfactoriamente, as variables vanse designar como v1, v2, etc. Está nas
mans do usuario o facilitar nomes con significado e/ou descricións,
utilizando para elo as instrucións "rename" e/ou "setinfo".
Ruta do menú: /Ficheiro/Abrir ficheiro de datos
Outro acceso: Arrastrar un ficheiro de datos ata a xanela principal de Gretl
# orthdev Transformations
Argumento: listavariables
Aplicable só con datos de panel. Obtense unha serie con desviacións
ortogonais adiantadas para cada variable de listavariables e gárdase nunha
nova variable co prefixoo_. Deste xeito "orthdev x y" xera as novas
variables o_x e o_y.
Os valores gárdanse un paso por diante da súa localización temporal
verdadeira (é dicir, o_x na observación t vai conter a desviación que
pertence a t - 1, falando estritamente). Isto é por compatibilidade coas
primeiras diferenzas pois así vaise perder a primeira observación de cada
serie temporal, non a última.
# outfile Printing
Variantes: outfile nomeficheiro opción
outfile --close
Opcións: --append (Engade ao ficheiro)
--write (Sobrescribe o ficheiro)
--quiet (Mira abaixo)
--buffer (Mira abaixo)
Exemplos: outfile regress.txt --write
outfile --close
Desvía o resultado a nomeficheiro, ata ter un aviso posterior. Utiliza a
opción --append para engadir o resultado a un ficheiro xa existente, ou
--write para empezar un ficheiro novo (ou sobrescribir un xa existente co
mesmo nome).
A opción --close se usa para pechar un ficheiro de resultados que xa
abriches como se indica arriba. Os resultados entón van volver ao proceso
por defecto. Ten en conta que dado que só podes abrir un único ficheiro
mediante outfile nun momento calquera (agás o indicado máis abaixo), non
necesitas indicar (nin debes facelo) ningún argumento de nome de ficheiro
con esta variante da instrución.
O ficheiro resultante vaise escribir no cartafol ("workdir") establecido
nese momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Na primeira instrución de exemplo indicada arriba, ábrese o ficheiro
regress.txt para escribilo, e na segunda péchase. Isto podería ter sentido
como unha secuencia só se algunhas instrucións se propoñen antes de
--close. Por exemplo, cando se interpón unha instrución de estimación, o
seu resultado iría a regress.txt en lugar de ir á pantalla.
Dispós de 3 variantes especiais do exposto arriba. Cando indicas a palabra
chave null en vez dun nome real de ficheiro xunto coa opción --write, a
consecuencia é que se eliminan todos os resultados presentados ata que a
redirección remate. Se indicas algunha das palabras chave stdout ou stderr
en lugar dun nome típico de ficheiro, o seu efecto consiste en volver a
dirixir o resultado a un resultado estándar ou a un resultado de erro
estándar, respectivamente.
A opción --quiet é para utilizar con --write ou --append, e o seu efecto
consiste tanto en eliminar a repetición visual das instrucións como a
presentación de mensaxes auxiliares mentres o resultado se volve a dirixir.
Isto é equivalente a facer
set echo off
set messages off
agás que cando remata a redirección, os valores orixinais das variables
echo e messages vólvense a restaurar.
En xeral, podes abrir un só ficheiro deste xeito en calquera momento dado,
polo que non podes aniñar as solicitudes desta instrución. Porén,
permítese a utilización desta instrución dentro das funcións que escribe
o usuario (posto que o ficheiro de resultados tamén se pecha desde dentro
da mesma función), de xeito que podes derivar temporalmente ese resultado e
logo devolvelo a un ficheiro de resultados orixinal, no caso de que o
solicitante estea utilizando nese momento a instrución outfile. Por
exemplo, o código
function void f (string s)
outfile inner.txt --write
print s
outfile --close
end function
outfile outer.txt --write --quiet
print "Fóra"
f("Dentro")
print "Fóra de novo"
outfile --close
vai xerar un ficheiro denominado "outer.txt" que contén as dúas liñas
Fóra
Fóra de novo
e un ficheiro denominado "inner.txt" que contén a liña
Dentro
Como se describiu arriba, o uso principal desta instrución é o de desviar
resultados ao ficheiro designado. Porén, podes utilizar a opción --buffer
para acadar un efecto distinto; en concreto dirixir os resultados a unha
variable indicada de cadea. Esta opción implica --write e non é compatible
con --append. A posición do argumento nomeficheiro ocúpase co nome dunha
variable de cadea (que, por suposto, debe de axustarse aos requirimentos dun
identificador válido de Gretl). Cando xa existe unha variable de cadea co
nome indicado, o seu valor vaise sobrescribir; e cando non existe esa
variable, vaise xerar automaticamente. Aquí tes un exemplo sinxelo de
utilización:
open data4-1
outfile mybuf --buffer --quiet
labels
outfile --close
printf "mybuf = \n'%s'\n", mybuf
Neste caso, a variable mybuf captura o resultado da instrución labels. Esta
prestación pode resultar de utilidade para os redactores de paquetes de
función.
# panel Estimation
Argumentos: depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--fixed-effects (Estima con efectos fixos por grupo)
--random-effects (Efectos aleatorios ou modelo MCX (GLS))
--nerlove (Utiliza a transformación de Nerlove)
--between (Estima o modelo entre-grupos)
--robust (Desviacións padrón robustas; mira abaixo)
--time-dummies (Inclúe variables ficticias temporais)
--unit-weights (Mínimos Cadrados Ponderados)
--iterate (Estimación iterativa)
--matrix-diff (Calcula a proba de Hausman mediante a matriz-diferenza)
--unbalanced=método (Só efectos aleatorios; mira abaixo)
--quiet (Resultados menos detallados)
--verbose (Resultados máis detallados)
Estima un modelo de panel. Por defecto, utilízase o estimador de efectos
fixos; isto ponse en práctica restándolles as medias de grupo ou unidade,
aos datos orixinais.
Cando indicas a opción --random-effects, calcúlanse as estimacións de
efectos aleatorios, utilizando por defecto o método de Swamy e Arora
(1972). Unicamente neste caso, a opción --matrix-diff forza o uso do
método da matriz-diferenza (en contraposición ao método de regresión)
para levar adiante a proba de Hausman sobre a consistencia do estimador de
efectos aleatorios. Tamén específica do estimador de efectos aleatorios é
a opción --nerlove , que escolle o método de Nerlove (1971) en
contraposición ao de Swamy e Arora.
Como alternativa, cando indicas a opción --unit-weights, o modelo estímase
mediante mínimos cadrados ponderados, coas ponderacións baseadas na
varianza residual para as unidades respectivas de sección cruzada da
mostra. Unicamente neste caso, podes engadir a opción --iterate para xerar
estimacións iterativas e se a iteración converxe, as estimacións
resultantes son Máximo Verosímiles.
Como posterior alternativa, se indicas a opción --between, estímase o
modelo entre-grupos (é dicir, faise unha regresión MCO utilizando as
medias dos grupos).
O procedemento por defecto para calcular desviacións padrón robustas en
modelos con datos de panel, é o estimador HAC de Arellano HAC, pero podes
escoller as "Desviacións Padrón Corrixidas de Panel" de Beck-Katz mediante
a instrución set pcse on. Cando especificas a opción robusta, execútase a
proba conxunta F sobre os efectos fixos utilizando o método robusto de
Welch (1951).
A opción --unbalanced está dispoñible só para modelos con efectos
aleatorios e podes usala para elixir o método ANOVA que empregar cun panel
desequilibrado. Por defecto, Gretl emprega o método de Swamy-Arora igual
que se fai para os paneis equilibrados, agás que utiliza a media armónica
das longuras das series de tempo individuais en vez da T habitual. Baixo
esta opción podes especificar ben bc para usar o método de Baltagi e Chang
(1994), ou ben usar stata para emular a opción sa da instrución xtreg de
Stata.
Para obter máis detalles sobre a estimación dun panel, consulta o Guía de
usuario de Gretl (Capítulo 19).
Ruta do menú: /Modelar/Panel
# pca Statistics
Argumento: listavariables
Opcións: --covariance (Utiliza a matriz de covarianzas)
--save[=n] (Garda as compoñentes máis importantes)
--save-all (Garda todas as compoñentes)
--quiet (Non presenta os resultados)
Análise de Compoñentes Principais. Agás cando indicas a opción --quiet,
presenta os valores propios da matriz de correlacións (ou da matriz de
covarianzas cando indicas a opción --covariance) para as variables que
forman listavariables, xunto coa proporción da varianza conxunta
representada por cada compoñente. Tamén presenta os correspondentes
autovectores ou "pesos das compoñentes".
Se indicas a opción --save-all, entón gárdanse tódalas compoñentes como
series no conxunto de datos, cos nomes PC1, PC2, etcétera. Estas variables
artificiais fórmanse como a suma dos produtos de (o peso da compoñente)
por (X_i tipificada), onde X_i denota a variable i-ésima de listavariables.
Se indicas a opción --save sen un valor do parámetro, gárdanse as
compoñentes con valores propios maiores ca media (o que significa maiores
ca 1.0 cando a análise se basea na matriz de correlacións) no conxunto de
datos, tal como se describiu arriba. Se indicas un valor para n con esta
opción, entón gárdanse as n compoñentes máis importantes.
Consulta tamén a función "princomp".
Ruta do menú: /Ver/Compoñentes principais
Outro acceso: Xanela principal: Menú emerxente (selección múltiple)
# pergm Statistics
Argumentos: serie [ anchobanda ]
Opcións: --bartlett (Utiliza a xanela de retardo de Bartlett)
--log (Utiliza a escala logarítmica)
--radians (Amosa a frecuencia en radiáns)
--degrees (Amosa a frecuencia en graos)
--plot=modo-ou-nomeficheiro (Mira abaixo)
Calcula e amosa o espectro da serie especificada. Por defecto, indícase o
periodograma da mostra, pero utilízase opcionalmente unha xanela de retardo
de Bartlett ao estimar o espectro, (consulta por exemplo, o libro de Greene
Econometric Analysis para ver unha discusión sobre isto). A longura por
defecto da xanela de Bartlett é dúas veces a raíz cadrada do tamaño da
mostra pero se pode establecer isto de xeito manual utilizando o parámetro
anchobanda, ata un máximo da metade do tamaño da mostra.
Cando indicas a opción --log, represéntase o espectro nunha escala
logarítmica.
As opcións (mutuamente excluíntes) --radians e --degrees afectan ao
aspecto do eixe de frecuencias cando se debuxa o periodograma. Por defecto,
a frecuencia escálase polo número de períodos da mostra, pero esas dúas
opcións provocan que o eixe se etiquete desde 0 ata pi radiáns ou desde 0
a 180degrees, respectivamente.
Por defecto, se o programa non está en modo de procesamento por lotes,
amósase unha gráfica do periodograma. Podes axustar isto mediante a
opción --plot. Os parámetros admisibles para esta opción son none (para
suprimir a gráfica), display (para representar unha gráfica mesmo en modo
de procesamento por lotes), ou un nome de ficheiro. O efecto de indicar un
nome de ficheiro é como se describe para a opción --output da instrución
"gnuplot".
Ruta do menú: /Variable/Periodograma
Outro acceso: Xanela principal: Menú emerxente (selección única)
# plot Graphs
Argumento: datos
Opcións: --with-lines[=varspec] (Utiliza liñas, non puntos)
--with-lp[=varspec] (Utiliza liñas e puntos)
--with-impulses[=varspec] (Utiliza liñas verticais)
--with-steps[=varspec] (Utiliza segmentos de liña horizontais e verticais)
--time-series (Representa fronte ao tempo)
--single-yaxis (Forza o uso dun único eixe de ordenadas)
--dummy (Mira abaixo)
--fit=espaxuste (Mira abaixo)
--band=espfranxa (Mira abaixo)
--band-style=estilofranxa (Mira abaixo)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
O bloque plot proporciona unha alternativa á instrución "gnuplot" que pode
ser máis conveniente cando estás xerando unha gráfica complicada (con
varias opcións e/ou instrucións Gnuplot para que se insiran no ficheiro
gráfico).
Un bloque plot comeza coa palabra de instrución plot seguida polo argumento
datos esixido, que especifica os datos que se van representar e que debe de
ser o nome dunha lista, dunha matriz ou dunha única serie.
Cando indicas unha lista (ou unha matriz), asúmese que o último termo (ou
a última columna da matriz) é a variable do eixe x e que os(as) outros(as)
son as variables do eixe y, agás cando indicas a opción --time-series, en
cuxo caso todos os datos especificados van no eixe y.
A opción de proporcionar o nome dunha soa serie restrínxese aos datos de
series temporais, en cuxo caso asúmese que se quere unha gráfica de series
temporais; noutro caso, amósase un fallo.
A liña de comezo pódese preceder da expresión "savename <-" para que se
garde unha gráfica como icona no programa de Interface Gráfica de Usuario
(GUI). O bloque remata con end plot.
Dentro do bloque tes cero ou máis liñas dos seguintes tipos, identificadas
pola palabra chave inicial:
option: Especifica unha opción simple.
options: Especifica múltiples opcións nunha soa liña, separadas por
espazos.
literal: Unha instrución que se vai pasar literalmente a Gnuplot.
printf: Un enunciado printf cuxo resultado se pasará literalmente a
Gnuplot.
Ten en conta que cando especificas unha opción utilizando as palabras chave
option ou options, non é necesario proporcionar o habitual dobre guión
antes do indicador de opción. Para obter máis detalles sobre os efectos
das distintas opcións, consulta "gnuplot" (pero mira abaixo para algúns
detalles específicos de utilizar a opción --band no contexto plot).
A intención de utilizar o bloque plot ilústrase mellor co exemplo:
string title = "Meu título"
string xname = "Miña variable X"
plot plotmat
options with-lines fit=none
literal set linetype 3 lc rgb "#0000ff"
literal set nokey
printf "set title \"%s\"", title
printf "set xlabel \"%s\"", xname
end plot --output=display
Este exemplo asume que plotmat é o nome dunha matriz que ten 2 columnas
polo menos (ou unha lista que ten 2 elementos polo menos). Cae na conta de
que se considera unha boa praxe colocar (unicamente) a opción --output na
derradeira liña do bloque.
Debuxar unha franxa con datos de matrices
As opcións --band e --band-style funcionan a maioría das veces como se
describe na axuda para "gnuplot", coa seguinte excepción: cando se
proporcionan os datos a representar en forma dunha matriz, o primeiro
parámetro para --band debe de indicarse co nome dunha matriz de 2 columnas
(que conteñan o centro e o largo da franxa, respectivamente). Este
parámetro ocupa o lugar dos dous primeiros valores (nomes de series,
números ID ou columnas de matriz) que require a versión gnuplot desta
opción (o terceiro é un factor multiplicador). A continuación tes un
exemplo:
scalar n = 100
matrix x = seq(1,n)'
matrix y = x + filter(mnormal(n,1), 1, {1.8, -0.9})
matrix B = y ~ muniform(n,1)
plot y
options time-series with-lines
options band=B,10 band-style=fill
end plot --output=display
# poisson Estimation
Argumentos: depvar indepvars [ ; exposición ]
Opcións: --robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para máis explicacións)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
Exemplos: poisson y 0 x1 x2
poisson y 0 x1 x2 ; S
Estima unha regresión de Poisson. Cóllese a variable dependente para
representar o acaecemento de sucesos dalgún tipo, e debe de ter só valores
enteiros non negativos.
Se unha variable aleatoria discreta Y segue unha distribución de Poisson,
entón
Pr(Y = y) = exp(-v) * v^y / y!
para y = 0, 1, 2,.... A media e a varianza da distribución son ambas iguais
a v. No modelo de regresión de Poisson, o parámetro v está representado
como unha función dunha ou máis variables independentes. A versión máis
habitual (e a única que admite Gretl) cumpre
v = exp(b0 + b1*x1 + b2*x2 + ...)
ou, noutras palabras, o logaritmo de v é unha función linear das variables
independentes.
Como opción, podes engadir unha variable de exposición ("offset") á
especificación. Esta é unha variable de escala, e o logaritmo dela
engádese á función linear de regresión (implicitamente, cun coeficiente
de 1.0). Isto ten sentido se agardas que o número de ocorrencias do evento
en cuestión é proporcional (manténdose o demais constante) a algún
factor coñecido. Por exemplo, podes supoñer que o número de accidentes de
tráfico é proporcional ao volume de tráfico (manténdose o demais
constante) e, nese caso, o volume de tráfico pode expresarse como unha
variable "de exposición" nun modelo de Poisson do cociente de accidentes. A
variable de exposición debe de ser estritamente positiva.
Por defecto, calcúlanse as desviacións padrón utilizando a inversa
negativa da matriz Hessiana. Se especificas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimada é un "emparedado"
entre a inversa da matriz Hessiana estimada e o produto externo do vector
gradiente.
Consulta tamén "negbin".
Ruta do menú: /Modelar/Variable Dependente Limitada/Datos de reconto
# print Printing
Variantes: print listavariables
print
print nomesobxectos
print cadealiteral
Opcións: --byobs (Por observacións)
--no-dates (Utiliza simples números de observación)
--midas (Mira abaixo)
Exemplos: print x1 x2 --byobs
print my_matrix
print "Isto é unha cadea"
print hflist --midas
Ten en conta que print é máis ben unha instrución "básica" (coa
intención principal de presentar os valores das series). Consulta "printf"
e "eval" para outras alternativas máis avanzadas e menos restritivas.
Na primeira variante amosada arriba (consulta o primeiro exemplo tamén),
listavariables debe de ser unha lista de series (ben unha lista xa definida,
ou ben unha lista especificada mediante os nomes ou números ID das series,
separados por espazos). Neste caso, esta instrución presenta os valores das
series da lista. Por defecto, os datos preséntanse "por variable", pero se
engades a opción --byobs preséntanse por observación. Cando se presentan
por observación, por defecto amósase a data (con datos de series
temporais) ou a cadea de texto do marcador de observación (en caso de que o
haxa) ao comezo de cada liña. Mediante a opción --no-dates elimínase a
presentación das datas ou dos marcadores; no seu lugar amósase un simple
número de observación. Consulta o parágrafo final destes comentarios para
ver o efecto da opción --midas (que se aplica só a unha lista xa definida
de series).
Cando non indicas ningún argumento (a segunda variante amosada arriba)
entón o efecto é similar ao primeiro caso excepto que se van presentar
todas as series do conxunto vixente de datos. As opcións que se admiten son
como se describiron máis arriba.
A terceira variante (co argumento nomesobxectos; mira o segundo exemplo)
agarda unha lista de nomes separados por espazos, de obxectos fundamentais
de Gretl que non sexan series (escalares, matrices, cadeas de texto, feixes,
arranxos); e amósase o valor destes obxectos. Neste caso, non se admiten
indicadores de opción.
Na cuarta forma (terceiro exemplo), cadealiteral debe de ser unha cadea de
texto contornada entre comiñas (e non debe de haber nada máis seguindo á
liña de instrución). Preséntase a cadea de texto en cuestión, seguida
dun carácter de liña nova.
A opción --midas é especial para presentar unha lista de series e, máis
aínda, é específica para conxuntos de datos que conteñen unha ou máis
series de alta frecuencia, cada unha representada por unha "MIDAS list".
Cando indicas unha desas listas como argumento e agregas esta opción, a
serie preséntase por observación da súa frecuencia "orixinal".
Ruta do menú: /Datos/Amosar valores
# printf Printing
Argumentos: formato , elementos
Presenta valores escalares, series, matrices ou cadeas de texto baixo o
control dunha cadea de texto para dar formato (ofrecendo unha parte da
función printf da linguaxe de programación C). Os formatos numéricos
recoñecido son %e, %E, %f, %g, %G e %d, en cada caso cos diversos
reguladores dispoñibles en C. Exemplos: o formato %.10g presenta un valor
con 10 cifras significativas, e %12.6f presenta un valor cun largo de 12
caracteres dos que 6 son decimais. Porén, ten en conta que en Gretl o
formato %g é unha boa elección por defecto para todos os valores
numéricos, e non tes necesidade de complicarte demasiado. Debes de utilizar
o formato %s para as cadeas de texto.
A propia cadea de formato debe de estar contornada entre comiñas, e os
valores que se van presentar deben de ir despois desa cadea de formato,
separados por comas. Estes valores deben de ter a forma de ou ben (a) os
nomes das variables, ben (b) expresións que xeran algunha clase de
resultado que é presentable, ou ben (c) as funcións especiais varname() ou
date(). O seguinte exemplo presenta os valores de dúas variables máis o
dunha expresión que se calcula:
ols 1 0 2 3
scalar b = $coeff[2]
scalar se_b = $stderr[2]
printf "b = %.8g, Desviación padrón %.8g, t = %.4f\n",
b, se_b, b/se_b
As seguintes liñas ilustran o uso das funcións varname e date, que
presentan respectivamente o nome dunha variable (indicado polo seu número
ID) e unha cadea de texto cunha data (dada por un número natural positivo
que indica unha observación).
printf "O nome da variable %d é %s\n", i, varname(i)
printf "A data da observación %d é %s\n", j, date(j)
Cando indicas un argumento matricial asociado a un formato numérico,
preséntase a matriz enteira utilizando o formato especificado para cada
elemento. O mesmo aplícase ás series, agás que o rango de valores
presentados se rexe pola configuración vixente da mostra.
A lonxitude máxima dunha cadea de formato é de 127 caracteres.
Recoñécense as secuencias de escape \n (nova liña), \t (tabulación), \v
(tabulación vertical) e \\ (barra inclinada á esquerda literal). Para
presentar un signo por cento literal, utiliza %%.
Como en C, podes indicar os valores numéricos que forman parte do formato
(o largo e/ou a precisión) directamente como números, como en %10.4f, ou
como variables. Neste último caso, póñense asteriscos na cadea de formato
e proporciónanse os argumentos correspondentes por orde. Por exemplo:
scalar width = 12
scalar precision = 6
printf "x = %*.*f\n", width, precision, x
# probit Estimation
Argumentos: depvar indepvars
Opcións: --robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para máis explicacións)
--vcv (Presenta a matriz de covarianzas)
--verbose (Presenta os detalles das iteracións)
--p-values (Amosa os valores p en vez das pendentes)
--random-effects (Estima un modelo Probit de panel con efectos aleatorios, EA)
--quadpoints=k (Número de puntos de cuadratura para a estimación con EA)
Exemplos: ooballot.inp, oprobit.inp, reprobit.inp
Se a variable dependente é unha variable binaria (todos os seus valores son
0 ou 1), obtéñense estimacións máximo verosímiles dos coeficientes das
variables de indepvars mediante o método de Newton-Raphson. Como o modelo
é non linear, as pendentes están condicionadas polos valores das variables
independentes. Por defecto, calcúlanse as pendentes con respecto a cada
unha das variables independentes (nas medias desas variables) e estas
pendentes substitúen os valores p habituais no resultado da regresión.
Podes prescindir deste proceder indicando a opción --p-values. O
estatístico khi-cadrado proba a hipótese nula de que todos os coeficientes
son cero, agás o da constante.
Por defecto, as desviacións padrón calcúlanse utilizando a inversa
negativa da matriz Hessiana. Se indicas a opción --robust, entón
calcúlanse no seu lugar as desviacións padrón CMV (QML) ou de
Huber-White. Neste caso, a matriz de covarianzas estimadas é un
"emparedado" entre a inversa da matriz Hessiana estimada e o produto externo
do vector gradiente. Para obter máis detalles, consulta o capítulo 10 do
libro de Davidson e MacKinnon (2004).
Se a variable dependente non é binaria senón discreta, entón se obteñen
as estimacións dun Probit Ordenado. (Se a variable elixida como dependente
non é discreta, amósase un fallo.)
Probit para datos de panel
Coa opción --random-effects, asúmese que cada perturbación está composta
por dúas compoñentes Normalmente distribuídas: (a) un termo invariante no
tempo que é específico da unidade de sección cruzada ou "individuo" (e
que se coñece como efecto individual), e (b) un termo que é específico da
observación concreta.
A avaliación da verosimilitude deste modelo implica utilizar a cuadratura
de Gauss-Hermite para aproximar o valor das esperanzas de funcións de
variables Normais. Podes escoller o número de puntos de cuadratura
utilizados mediante a opción --quadpoints (por defecto é de 32).
Utilizando máis puntos mellórase a precisión dos resultados, pero co
custo de máis tempo de cálculo; así con moitos puntos de cuadratura, a
estimación cun conxunto de datos moi grande pode consumir tempo de máis.
Amais das estimacións habituais dos parámetros (e dos estatísticos
asociados) relacionados cos regresores incluídos, preséntase algunha
información adicional sobre a estimación desta clase de modelo:
lnsigma2: A estimación máximo verosímil do logaritmo da varianza do
efecto individual;
sigma_u: A estimación da desviación padrón do efecto individual; e
rho: A estimación da parte do efecto individual na varianza composta da
perturbación (tamén coñecida como a correlación intra-clase).
A proba de Razón de Verosimilitudes respecto á hipótese nula de que rho
é igual a cero, proporciona un xeito de avaliar se é necesaria a
especificación de efectos aleatorios. Se a hipótese nula non se rexeita,
iso suxire que é axeitada unha simple especificación Probit combinada.
Ruta do menú: /Modelar/Variable Dependente Limitada/Probit
# pvalue Utilities
Argumentos: distribución [ parámetros ] xvalor
Exemplos: pvalue z zscore
pvalue t 25 3.0
pvalue X 3 5.6
pvalue F 4 58 fval
pvalue G shape scale x
pvalue B bprob 10 6
pvalue P lambda x
pvalue W shape scale x
Calcula a área que queda á dereita do valor xvalor na distribución
especificada (z para a Normal, t para a t de Student, X para a Khi-cadrado,
F para a F, G para a Gamma, B para a Binomial, P para a Poisson, exp para
Exponencial, ou W para a Weibull).
Dependendo do tipo de distribución, debes de indicar a seguinte
información antes do valor xvalor: para as distribucións te khi-cadrado,
os graos de liberdade; para a F, os graos de liberdade de numerador e
denominador; para a Gamma, os parámetros de forma e de escala; para a
distribución Binomial, a probabilidade de "éxito" e o número de intentos;
para a distribución de Poisson, o parámetro lambda (que é tanto a media
como a varianza); para a Exponencial, un parámetro de escala; e para a
distribución de Weibull, os parámetros de forma e de escala. Como se
amosou nos exemplos de arriba, podes indicar os parámetros numéricos en
formato numérico ou como nomes de variables.
Os parámetros para a distribución Gamma indícanse ás veces como media e
varianza en lugar de forma e escala. A media é o produto da forma e a
escala; a varianza é o produto da forma e o cadrado da escala. Deste xeito,
podes calcular a escala dividindo a varianza entre a media, e podes calcular
a forma dividindo a media entre a escala.
Ruta do menú: /Ferramentas/Buscador do valor P
# qlrtest Tests
Opcións: --limit-to=lista (Limita a proba a un subconxunto de regresores)
--plot=modo-ou-nomeficheiro (Mira abaixo)
--quiet (Non presenta os resultados)
Para un modelo estimado con datos de series temporais mediante MCO, realiza
a proba da razón de verosimilitude de Quandt (QLR) para un cambio
estrutural nun punto descoñecido no tempo, cun 15 por cento de recorte ao
comezo e ao final do período da mostra.
Para cada punto potencial de cambio dentro do 70 por cento central das
observacións, realízase unha proba de Chow. Consulta "chow" para obter
máis detalles; pois de igual xeito que coa proba común de Chow, esta é
unha proba robusta de Wald cando o modelo orixinal se estima coa opción
--robust, e unha proba F noutro caso. Entón o estatístico QLR é o máximo
dos estatísticos de proba particulares.
Obtense unha probabilidade asociada (valor p) asintótica utilizando o
método de Bruce Hansen (1997).
Ademais dos accesorios "$test" e "$pvalue" típicos das probas de
hipóteses, podes utilizar "$qlrbreak" para recuperar o índice da
observación na que o estatístico de proba se maximiza.
Podes utilizar a opción --limit-to para limitar o conxunto de interaccións
coa variable ficticia de corte nas probas de Chow, a un subconxunto dos
regresores orixinais. O parámetro para esta opción debe de ser unha lista
xa definida na que todos os seus elementos se atopen entre os regresores
orixinais, e na que non debes de incluír a constante.
Cando executas de xeito interactivo (unicamente) esta instrución, amósase
por defecto unha gráfica do estatístico de proba de Chow pero podes
axustar isto mediante a opción --plot. Os parámetros que se admiten nesta
opción son none (para eliminar a gráfica), display (para amosar unha
gráfica mesmo cando non se está en modo interactivo), ou un nome de
ficheiro. O efecto de proporcionar un nome de ficheiro é como o descrito
para a opción --output da instrución "gnuplot".
Ruta do menú: Fiestra de modelo: Probas/Proba QLR
# qqplot Graphs
Variantes: qqplot y
qqplot y x
Opcións: --z-scores (Mira abaixo)
--raw (Mira abaixo)
--output=nomeficheiro (Envía a gráfica ao ficheiro especificado)
Indicando como argumento unha única serie, amosa unha gráfica dos cuantís
empíricos da serie seleccionada (indicada polo seu nome ou o seu número
ID) fronte aos cuantís da distribución Normal. A serie debe de incluír
cando menos 20 observacións válidas no rango vixente da mostra. Por
defecto, os cuantís empíricos debúxanse fronte aos cuantís dunha
distribución Normal que ten as mesmas media e varianza que os datos da
mostra, pero dispós de dúas alternativas: se indicas a opción --z-scores,
os datos se tipifican; mentres que se indicas a opción --raw, debúxanse os
cuantís empíricos "en bruto" fronte aos cuantís da distribución Normal
estándar.
A opción --output ten como efecto o envío do resultado ao ficheiro
especificado; utiliza "display" para forzar que o resultado se presente na
pantalla. Consulta a instrución "gnuplot" para obter máis detalles sobre
esta opción.
Dadas dúas series como argumentos, y e x, amósase unha gráfica dos
cuantís empíricos de y fronte aos de x. Os valores dos datos non se
tipifican.
Ruta do menú: /Variable/Gráfica Q-Q normal
Ruta do menú: /Ver/Gráfica de variables indicadas/Gráfica Q-Q
# quantreg Estimation
Argumentos: tau depvar indepvars
Opcións: --robust (Desviacións padrón robustas)
--intervals[=level] (Calcula os intervalos de confianza)
--vcv (Presenta a matriz de covarianzas)
--quiet (Non presenta os resultados)
Exemplos: quantreg 0.25 y 0 xlista
quantreg 0.5 y 0 xlista --intervals
quantreg 0.5 y 0 xlista --intervals=.95
quantreg tauvec y 0 xlista --robust
Mira tamén mrw_qr.inp
Regresión de cuantís. O primeiro argumento (tau) é o cuantil condicionado
para o que se quere a estimación. Podes indicalo ben cun valor numérico ou
ben co nome dunha variable escalar definida previamente; e o valor debe de
estar no rango de 0.01 a 0.99. (Como alternativa, podes indicar un vector de
valores para tau; mira abaixo para obter máis detalles.) O segundo e
subseguintes argumentos compoñen unha lista de regresión co mesmo padrón
ca "ols".
Sen a opción --intervals, preséntanse as desviacións padrón para as
estimacións dos cuantís. Por defecto, estas calcúlanse de acordo coa
fórmula asintótica indicada por Koenker e Bassett (1978), pero cando
indicas a opción --robust, calcúlanse as desviacións padrón que son
robustas con respecto á heterocedasticidade utilizando o método de Koenker
e Zhao (1994).
Cando escolles a opción --intervals, preséntanse os intervalos de
confianza para as estimacións dos parámetros en vez das desviacións
padrón. Estes intervalos calcúlanse usando o método da inversión do
rango e, en xeral, son asimétricos a respecto das estimacións puntuais. As
especificidades do cálculo están mediatizadas pola opción --robust: sen
esta, os intervalos calcúlanse baixo o suposto de perturbacións IID
(Koenker, 1994); e con ela se utiliza o estimador robusto desenvolvido por
Koenker e Machado (1999).
Por defecto, xéranse intervalos de confianza do 90 por cento. Podes trocar
isto engadindo un nivel de confianza (expresado como unha fracción decimal)
á opción de intervalos, como en --intervals=0.95.
Vector tau de valores: en vez de proporcionar un escalar, podes indicar o
nome dunha matriz definida previamente. Neste caso, as estimacións
calcúlanse para todos os valores tau indicados e os resultados preséntanse
nun formato especial, amosando a secuencia das estimacións de cuantís para
cada regresor de un en un.
Ruta do menú: /Modelar/Estimación Robusta/Regresión de cuantís
# quit Utilities
Sae do programa, ofrecéndote a opción de gardar os resultados da sesión
ao saír.
Ruta do menú: /Ficheiro/Saír
# rename Dataset
Argumentos: serie novonome
Cambia o nome de serie (identificado polo seu nome ou seu número ID) a
novonome. O novo nome debe de ter 31 caracteres como máximo, comezar cunha
letra e estar formado só por letras, díxitos e o carácter de barra baixa.
Ademais, non debe de ser o nome dun obxecto de calquera tipo que xa exista.
Ruta do menú: /Variable/Editar atributos
Outro acceso: Fiestra principal: Menú emerxente (selección única)
# reset Tests
Opcións: --quiet (Non presenta a regresión auxiliar)
--silent (Non presenta nada)
--squares-only (Calcula a proba usando só os cadrados)
--cubes-only (Calcula a proba usando só os cubos)
Debe de seguir a estimación dun modelo mediante MCO. Leva a cabo a proba
RESET de Ramsey sobre a especificación (non linear) dun modelo,
engadíndolle á regresión o cadrado e/ou o cubo dos valores axustados, e
calculando o estatístico F para probar a hipótese nula de que os
parámetros dos termos engadidos son cero.
Engádense tanto os cadrados como os cubos, agás que indiques unha das
opcións --squares-only ou --cubes-only.
A opción --silent pode ter sentido se tes intención de facer uso dos
accesorios "$test" e/ou "$pvalue" para gardar os resultados da proba.
Ruta do menú: Fiestra de modelo: Probas/Proba RESET de Ramsey
# restrict Tests
Opcións: --quiet (Non presenta as estimacións restrinxidas)
--silent (Non presenta nada)
--wald (Só estimadores de sistema, mira abaixo)
--bootstrap (Cálculo da proba con remostraxe automática, se é posible)
--full (Só MCO e VECMs, mira abaixo)
Impón un conxunto de restricións (habitualmente lineais) sobre: (a) o
último modelo estimado ou (b) un sistema de ecuacións que se definiu e
nomeou previamente. En todos os casos, debes de comezar o conxunto de
restricións coa palabra chave "restrict" e rematalo con "end restrict".
No caso dunha única ecuación, as restricións sempre se aplican
implicitamente ao último modelo, e avalíanse tan pronto como se peche o
bloque restrict.
No caso dun sistema de ecuacións (definido mediante a instrución
"system"), podes poñer o nome do sistema de ecuacións definido previamente
despois do "restrict" inicial. Cando omites iso e o último modelo foi un
sistema, entón as restricións aplícanse a ese derradeiro modelo. Por
defecto, as restricións avalíanse cando o sistema acaba de estimarse,
usando a instrución "estimate". Pero cando indicas a opción --wald, a
restrición compróbase inmediatamente a través da proba khi-cadrado de
Wald en relación á matriz de covarianzas. Ten en conta que esta opción
vai xerar un fallo se xa definiches un sistema, pero aínda non o
estimaches.
Dependendo do contexto, podes expresar de varios xeitos as restricións que
queiras probar. O máis simple é como se indica deseguido: cada restrición
exprésase como unha ecuación, cunha combinación linear de parámetros á
esquerda do signo de igualdade e un valor escalar á dereita (ben unha
constante numérica ou ben o nome dunha variable escalar).
No caso dunha única ecuación, podes referirte aos seus parámetros co
formato b[i], onde i representa a posición na lista de regresores
(comezando no 1), ou co formato b[nomevar], onde nomevar é o nome do
regresor en cuestión. No caso dun sistema, a referencia aos parámetros
faise utilizando a letra b xunto con dous números colocados entre
corchetes. O primeiro número representa a posición da ecuación dentro do
sistema e o segundo número indica a posición do regresor dentro da lista
deles. Por exemplo, b[2,1] denota o primeiro parámetro da segunda
ecuación, mentres que b[3,2] denota o segundo parámetro da terceira
ecuación. Podes antepoñer multiplicadores numéricos aos elementos b da
ecuación que representa unha restrición, por exemplo 3.5*b[4].
Aquí tes un exemplo dun conxunto de restricións para un modelo estimado
previamente:
restrict
b[1] = 0
b[2] - b[3] = 0
b[4] + 2*b[5] = 1
end restrict
E aquí tes un exemplo dun conxunto de restricións para aplicar a un
sistema xa definido. (Se o nome do sistema non contén espazos, as comiñas
que o contornan non fan falta.)
restrict "Sistema 1"
b[1,1] = 0
b[1,2] - b[2,2] = 0
b[3,4] + 2*b[3,5] = 1
end restrict
No caso dunha única ecuación, as restricións avalíanse por defecto por
medio da proba de Wald, usando a matriz de covarianzas do modelo en
cuestión. Se estimaches o modelo orixinal con MCO, entón preséntanse as
estimacións dos coeficientes restrinxidos; para eliminar isto, engade a
opción --quiet á instrución restrict inicial. Como alternativa á proba
de Wald, para modelos estimados mediante MCO ou MCP unicamente, podes
indicar a opción --bootstrap para realizar a a proba da restrición con
remostraxe automática (bootstrap).
No caso dun sistema, o estatístico de proba depende do estimador elixido:
un estatístico de Razón de Verosimilitudes cando o sistema se estima
utilizando un método de Máxima Verosimilitude, ou un estatístico F
asintótico, noutro caso.
Tes 2 alternativas ao método para expresar as restricións que se discutiu
máis arriba. Primeiro, podes escribir de forma compacta un conxunto de g
restricións lineais sobre o vector cos k parámetros (beta), como Rbeta - q
= 0, onde R é unha matriz de dimensión g x k e q é un vector de
dimensión g. Podes expresar unha restrición indicando os nomes de matrices
definidas previamente, cómodas para utilizar como R e q, como en
restrict
R = Rmat
q = qvec
end restrict
En segundo lugar, se queres probar unha restrición non linear (o que
actualmente só está dispoñible para modelos dunha única ecuación),
debes de indicar a restrición como o nome dunha función precedida por
"rfunc = ", como en
restrict
rfunc = myfunction
end restrict
A función de restrición debe de ter un único argumento const matrix, e
isto complétase automaticamente co vector de parámetros. E debera de
devolver un vector que é cero baixo a hipótese nula, e non nulo noutro
caso. A dimensión do vector é igual ao número de restricións. Esta
función utilízase como unha "chamada de volta" da rutina numérica para o
Jacobiano de Gretl, que calcula o estatístico de proba de Wald mediante o
método delta.
Aquí tes un exemplo sinxelo dunha función apropiada para comprobar unha
restrición non linear, concretamente que dous pares de valores dos
parámetros teñen unha razón común.
function matrix restr (const matrix b)
matrix v = b[1]/b[2] - b[4]/b[5]
return v
end function
Cando se completa con éxito a instrución restrict, os accesorios "$test" e
"$pvalue" proporcionan o estatístico de proba e a súa probabilidade
asociada (valor p), respectivamente.
Cando se proban restricións sobre un modelo dunha única ecuación que foi
estimado mediante MCO ou sobre un Modelo de Vectores de Corrección do Erro
(VECM), podes utilizar a opción --full para dispoñer que as estimacións
restrinxidas sexan o "último modelo" coa intención de facer probas máis
adiante ou de usar accesorios como $coeff e $vcv. Cae na conta de que se
aplican algúns detalles especiais no caso de que probes restricións sobre
un VECM. Consulta o Guía de usuario de Gretl (Capítulo 29) para obter
máis detalles.
Ruta do menú: Fiestra de modelo: Probas/Restricións lineais
# rmplot Graphs
Argumento: serie
Opcións: --trim (Mira abaixo)
--quiet (Non presenta os resultados)
--output=nomeficheiro (Mira abaixo)
Gráfica Rango-Media: Esta instrución xera unha gráfica sinxela para
axudar a decidir se unha serie temporal, y(t), ten unha varianza constante
ou non. Cóllese a mostra completa (t=1,...,T) e divídese en pequenas
submostras de tamaño arbitrario k. A primeira submostra está composta por
y(1),...,y(k), a segunda por y(k+1), ..., y(2k), etcétera. Para cada
submostra, calcúlase a media da mostra e o rango (= máximo menos mínimo),
e constrúese unha gráfica coas medias no eixe horizontal e os rangos no
vertical. Así cada submostra se representa mediante un punto neste plano.
Se a varianza das series é constante, agardaríase que o rango da submostra
sexa independente da media da submostra; por iso se observamos que os puntos
se aproximan a unha liña con pendente positiva, isto suxire que a varianza
das series aumenta a medida que o fai a media; e se os puntos se aproximan a
unha liña con pendente negativa, isto suxire que a varianza decrece ao
aumentar a media.
Ademais da gráfica, Gretl amosa as medias e rangos para cada submostra,
xunto co coeficiente da pendente dunha regresión MCO do rango sobre a
media, e coa probabilidade asociada ao estatístico para probar a hipótese
nula de que esta pendente é cero. Se o coeficiente da pendente é
significativo cun nivel de significación do 10 por cento, entón amósase
na gráfica a liña axustada da regresión do rango sobre a media. Se
rexistran tanto o estatístico t para probar a hipótese nula como a
probabilidade asociada correspondente, e podes recuperalos usando os
accesorios "$test" e "$pvalue", respectivamente.
Cando indicas a opción --trim, descártanse os valores mínimo e máximo de
cada submostra antes de calcular a media e o rango. Isto fai que sexa menos
probable que os valores atípicos provoquen unha distorsión na análise.
Cando indicas a opción --quiet, non se amosa a gráfica nin se presenta o
resultado; só se indican o estatístico t e a súa probabilidade asociada
(valor p). Noutro caso, podes controlar o formato da gráfica mediante a
opción --output; e isto funciona como se describe en conexión coa
instrución "gnuplot".
Ruta do menú: /Variable/Gráfica Rango-Media
# run Programming
Argumento: nomeficheiro
Executa as instrucións de nomeficheiro e logo devolve o control ao
indicador interactivo. Esta instrución está pensada para que a utilices co
programa de liñas de instrución gretlcli ou coa "consola de Gretl" no
programa de Interface Gráfica de Usuario (GUI).
Consulta tamén "include".
Ruta do menú: Icona 'Executar' na xanela do editor de guións
# runs Tests
Argumento: serie
Opcións: --difference (Utiliza as primeiras diferenzas da variable)
--equal (Os valores positivos e negativos son equiprobables)
Realiza a proba non paramétrica "de ringleiras" para comprobar o carácter
aleatorio da serie indicada, onde as ringleiras defínense como secuencias
de valores consecutivos positivos ou negativos. Se queres probar o carácter
aleatorio das desviacións respecto á mediana, para unha variable chamada
x1 que ten unha mediana non nula, podes facer o seguinte:
series signx1 = x1 - median(x1)
runs signx1
Cando indicas a opción --difference, vanse calcular as primeiras diferenzas
da serie antes da análise, polo que as ringleiras se interpretarían como
secuencias de aumentos ou de diminucións consecutivas do valor da variable.
Cando indicas a opción --equal, a hipótese nula tamén incorpora o suposto
de que os valores positivos e negativos son igual de probables; noutro caso,
o estatístico de proba resulta invariante con respecto á "neutralidade" do
proceso que xerou a secuencia de valores, e a proba céntrase unicamente na
independencia.
Ruta do menú: /Ferramentas/Probas non paramétricas
# scatters Graphs
Argumentos: yvar ; xvars ou yvars ; xvar
Opcións: --with-lines (Xera gráficas de liñas)
--matrix=nomematr (Representa as columnas da matriz indicada)
--output=nomeficheiro (Envía o resultado ao ficheiro especificado)
Exemplos: scatters 1 ; 2 3 4 5
scatters 1 2 3 4 5 6 ; 7
scatters y1 y2 y3 ; x --with-lines
Xera gráficas de dúas variables, ben de yvar fronte a todas as variables
de xvars, ou ben de todas as variables de yvars fronte a xvar. No primeiro
exemplo de arriba, se coloca a variable 1 no eixe y e se debuxan 4
gráficas: a primeira que ten a variable 2 no eixe x, a segunda coa variable
3 no eixe x, etcétera. O segundo exemplo representa cada unha das variables
da 1 á 6, fronte á variable 7 no eixe x. Repasar un conxunto desas
gráficas pode ser un paso conveniente na análise exploratoria de datos. O
número máximo de gráficas é de 16, polo que vaise ignorar calquera
variable adicional na lista.
Por defecto, as gráficas son de dispersión, pero se indicas a opción
--with-lines serán gráficas de liñas.
Para obter máis detalles sobre o uso da opción --output, consulta a
instrución "gnuplot".
Se especificas unha matriz xa definida como orixe dos datos, debes de
expresar as listas x e y con números naturais positivos que indiquen a
columna; ou en caso contrario, se non indicas eses números, represéntanse
todas as columnas fronte ao tempo ou a unha variable índice.
Cando o conxunto de datos é de series temporais, entón podes omitir a
segunda lista, pois nese caso vaise tomar implicitamente ao 'tempo' como
tal, polo que podes debuxar varias series temporais en gráficas separadas.
Ruta do menú: /Ver/Gráficas múltiples
# sdiff Transformations
Argumento: listavariables
Obtense a diferenza estacional de cada unha das variables de listavariables,
e gárdase o resultado nunha nova variable co prefixo sd_. Esta instrución
está dispoñible só para series de tempo estacionais.
Ruta do menú: /Engadir/Diferenzas estacionais das variables seleccionadas
# set Programming
Variantes: set variable valor
set --to-file=nomeficheiro
set --from-file=nomeficheiro
set stopwatch
set
Exemplos: set svd on
set csv_delim tab
set horizon 10
set --to-file=mysettings.inp
O uso máis común desta instrución é a primeira variante amosada arriba,
onde se utiliza para establecer o valor dun parámetro escollido do programa
(isto discútese en detalle máis abaixo). Os outros usos son: con --to-file
para escribir un ficheiro de guión que conteña todas as configuracións
actuais dos parámetros; con --from-file para ler un ficheiro de guión que
conteña as configuracións dos parámetros e para aplicalas á sesión
vixente; con stopwatch para poñer a cero o "cronómetro" de Gretl que podes
usar para medir o tempo de CPU (consulta os comentarios para o accesorio
"$stopwatch"); ou para presentar as configuracións actuais, cando indicas
só a palabra set.
Os valores establecidos mediante esta instrución seguen vixentes durante a
duración da sesión de Gretl, agás que os troques por medio dunha chamada
posterior a "set". Os parámetros que podes establecer deste xeito
enuméranse máis abaixo. Ten en conta que se utilizan as configuracións de
hc_version, hac_lag e hac_kernel cando indicas a opción --robust nunha
instrución de estimación.
As configuracións dispoñibles agrúpanse baixo as seguintes categorías:
interacción e comportamento do programa, métodos numéricos, xeración de
números aleatorios, estimación robusta, filtrado, estimación de series
temporais e interacción con GNU R.
Interacción e comportamento do programa
Estas configuracións utilízanse para controlar diversos aspectos do xeito
no que Gretl interactúa co usuario.
workdir: path. Establece o cartafol por defecto para escribir e ler
ficheiros nos casos nos que non se especifican as rutas completas.
use_cwd: on ou off (por defecto). Manexa a configuración do cartafol de
traballo (workdir) inicial: se está en on, hérdase o cartafol de
traballo desde o intérprete; noutro caso, establécese onde queira que se
seleccionou na sesión previa de Gretl.
echo: off ou on (por defecto). Elimina (ou acurta) a resonancia dos textos
das instrucións nos resultados de Gretl.
messages: off ou on (por defecto). Elimina (ou acurta) a presentación de
mensaxes sen fallo asociados a diversas instrucións, por exemplo cando se
xera unha nova variable ou cando se cambia o rango da mostra.
verbose: off ou on (por defecto). Funciona como un "interruptor mestre"
para echo e messages (mira máis abaixo), apagando ou acendendo os dous
simultaneamente.
warnings: off ou on (por defecto). Elimina (ou acurta) a presentación de
mensaxes de advertencia que xorden cando as operacións aritméticas
producen valores non finitos.
csv_delim: comma (coma, por defecto), space (espazo), tab (tabulación) ou
semicolon (punto e coma). Establece o delimitador de columnas que se usa
cando se gardan datos nun ficheiro con formato CSV.
csv_write_na: A cadea de texto que se utiliza para representar os valores
ausentes cando se escriben datos a un ficheiro con formato CSV. Máximo =
7 caracteres; por defecto é NA.
csv_read_na: A cadea de texto que se colle para representar valores
ausentes (NAs) cando se len datos co formato CSV (máximo 7 caracteres). A
cadea por defecto depende de que se atope unha columna de datos que
conteña datos numéricos (a maioría das veces) ou valores de cadea. Para
datos numéricos, considérase que o seguinte indica NAs: unha cela
baldeira ou calquera das cadeas NA, N.A., na, n.a., N/A, #N/A, NaN, .NaN,
., .., -999, e -9999. Para datos en forma de cadeas de texto con valores,
tan só se conta como NA unha cela en branco ou unha cela que conteña
unha cadea baldeira. Podes volver a impoñer eses valores por defecto
indicando default como o valor para csv_read_na. Para especificar que tan
só se len as celas baldeiras como NAs, indica o valor "". Ten en conta
que as celas baldeiras sempre se len como NAs con independencia de como
estea configurada esta variable.
csv_digits: Un enteiro positivo que especifica o número de díxitos
significativos a usar cando se escriben datos en formato CSV. Por defecto,
utilízanse ata 15 díxitos dependendo da precisión dos datos orixinais.
Ten en conta que o resultado CSV emprega a función fprintf da librería
de C coa conversión "%g" , o que significa que se prescinde dos ceros que
quedan atrás.
display_digits: Un enteiro de 3 a 6 que especifica o número de díxitos
significativos a usar cando se amosan os coeficientes da regresión e as
desviacións padrón (sendo 6 por defecto). Tamén podes utilizar esta
configuración para limitar o número de díxitos que se amosan coa
instrución "summary"; sendo neste caso 5 por defecto (e tamén como
máximo) ou 4 cando indicas a opción --simple.
mwrite_g: on ou off (por defecto). Cando se escribe unha matriz como texto
nun ficheiro, Gretl por defecto utiliza notación científica con 18
díxitos de precisión, asegurando deste xeito que os valores gardados son
unha representación fiable dos números en memoria. Cando se escriben
datos básicos con non máis ca 6 díxitos de precisión, podes preferir
utilizar o formato %g para ter un ficheiro máis compacto e doado de ler;
podes facer este cambio mediante set mwrite_g on.
force_decpoint: on ou off (por defecto). Forza a Gretl a utilizar o
carácter de punto decimal, nun escenario onde outro carácter
(probablemente a coma) é o separador decimal estándar.
loop_maxiter: Un valor enteiro non negativo (por defecto é 100000).
Establece o número máximo de iteracións que se lle permiten a un bucle
while, antes de parar (consulta "loop"). Cae na conta de que esta
configuración só afecta á variante while; a súa intención é
protexerse ante infinitos bucles que xurdan de forma inadvertida.
Establecer que este valor sexa 0 ten o efecto de inhabilitar o límite;
utilízao con precaución.
max_verbose: on ou off (por defecto). Conmuta o resultado máis cumprido
para as funcións BFGSmax e NRmax (consulta o Manual de Usuario para obter
máis detalles).
debug: 1, 2 ou 0 (por defecto). Isto utilízase coas funcións definidas
polo usuario. Establecer debug igual a 1 equivale a activar messages
dentro de todas esas funcións, e establecer esta variable igual a 2 ten o
efecto adicional de activar max_verbose dentro de todas as funcións.
shell_ok: on ou off (por defecto). Permite executar programas externos
desde Gretl mediante o intérprete de sistema. Isto non está habilitado
por defecto por razóns de seguridade, e só podes habilitalo mediante a
Interface Gráfica de Usuario (Ferramentas/Preferencias/Xeral). Porén,
unha vez activada, esta configuración permanecerá activa para sesións
futuras ata que se desactive explicitamente.
bfgs_verbskip: Un enteiro. Esta configuración afecta ao comportamento da
opción --verbose naquelas instrucións que utilizan BFGS como algoritmo
de optimización e se usa para compactar o resultado. Se bfgs_verbskip se
establece en 3, por exemplo, entón a opción --verbose vai provocar que
se presenten as iteracións 3, 6, 9, etcétera.
skip_missing: on (por defecto) ou off. Controla o comportamento de Gretl
cando se constrúe unha matriz a partir de series de datos: por defecto
sáltanse as filas de datos que conteñen un ou máis valores ausentes
pero cando se pon skip_missing en off, os valores ausentes convértense en
NaNs.
matrix_mask: O nome dunha serie ou a palabra chave null. Ofrece un maior
control ca skip_missing cando se constrúen matrices a partir de series:
as filas de datos seleccionadas para as matrices son aquelas con valores
non nulos (e non ausente) das series especificadas. A careta escollida
permanece en vigor ata que se substitúe, ou se elimina mediante a palabra
chave null.
huge: Un número positivo moi grande (por defecto, 1.0E100). Esta
configuración controla o valor que devolve o accesorio "$huge".
Métodos numéricos
Estas configuracións utilízanse para controlar os algoritmos numéricos
que utiliza Gretl para a estimación.
optimizer: ben auto (por defecto), BFGS ou newton. Establece o algoritmo
de optimización utilizado para varios estimadores Máximo Verosímiles,
nos casos onde ambos BFGS e o de Newton-Raphson se poden aplicar. Por
defecto utilízase o de Newton-Raphson cando se dispoña dunha matriz
Hessiana analítica; noutro caso, BFGS.
bhhh_maxiter: Un enteiro, o número máximo de iteracións para a rutina
interna BHHH de Gretl, que se utiliza na instrución "arma" para a
estimación MV condicional. Se a converxencia non se acada logo de
bhhh_maxiter, o programa devolve un fallo. Por defecto, establécese en
500.
bhhh_toler: Un valor de punto flotante ou a cadea default. Isto utilízase
na rutina interna BHHH de Gretl para verificar se a converxencia se
acadou. O algoritmo remata de repetirse tan pronto como o incremento no
logaritmo da verosimilitude entre iteracións sexa menor ca bhhh_toler. O
valor por defecto é 1.0E-06, pero podes volver a establecer este valor
tecleando default en lugar dun valor numérico.
bfgs_maxiter: Un enteiro, o número máximo de iteracións para a rutina
BFGS de Gretl, que se utiliza para "mle" (EMV), "gmm" (MXM) e varios
estimadores específicos. Se non se acada a converxencia no número
indicado de iteracións, o programa devolve un fallo. O valor por defecto
depende do contexto, pero habitualmente é da orde de 500.
bfgs_toler: Un valor de punto flotante ou a cadea default. Isto utilízase
na rutina interna BFGS de Gretl para verificar se a converxencia se
acadou. O algoritmo remata de repetirse tan pronto como a melloría
relativa na función obxectivo entre iteracións sexa menor ca bfgs_toler.
O valor por defecto é igual á precisión de máquina elevada a 3/4, pero
podes volver a establecer este valor tecleando default en lugar dun valor
numérico.
bfgs_maxgrad: Un valor de punto flotante. Isto utilízase na rutina
interna BFGS de Gretl para verificar se a norma do vector gradiente está
razoablemente preto do cero cando se acada o criterio bfgs_toler. Vaise
presentar unha advertencia cando a norma do vector gradiente exceda de 1;
e amósase un fallo se a norma excede bfgs_maxgrad. Actualmente, por
defecto o valor de tolerancia é de 5.0.
bfgs_richardson: on ou off (por defecto). Utiliza a extrapolación de
Richardson cando calcula as derivadas numéricas no contexto da
maximización BFGS.
initvals: Ben auto (por defecto) ou ben o nome dunha matriz especificada
previamente. Permite establecer manualmente as estimacións iniciais dos
parámetros para problemas de optimización numérica (tales como a
estimación ARMA). Para obter máis detalles, consulta o Guía de usuario
de Gretl (Capítulo 27).
lbfgs: on ou off (por defecto). Utiliza a versión de memoria limitada de
BFGS (L-BFGS-B) en vez do algoritmo habitual. Isto pode ser vantaxoso
cando a función que se maximiza non é globalmente cóncava.
lbfgs_mem: Un valor enteiro no rango de 3 a 20 (cun valor por defecto de
8). Isto determina o número de correccións que se utilizan na matriz de
memoria limitada cando se emprega L-BFGS-B.
nls_toler: Un valor de punto flotante. Establece a tolerancia que se
utiliza ao xulgar se a converxencia se acada ou non, nunha estimación de
mínimos cadrados non lineais utilizando a instrución "nls". O valor por
defecto é igual á precisión de máquina elevada a 3/4, pero podes
volver a establecer este valor tecleando default en lugar dun valor
numérico.
svd: on ou off (por defecto). Utiliza SVD en vez da descomposición de
Cholesky ou a QR nos cálculos de mínimos cadrados. Esta opción
aplícase á función mols así como a varios cálculos internos, pero non
á instrución "ols" habitual.
force_qr: on ou off (por defecto). Isto aplícase á instrución "ols".
Por defecto, esta instrución calcula as estimacións de MCO utilizando a
descomposición de Cholesky (o método máis rápido), con QR como último
recurso se os datos semellan demasiado mal condicionados. Podes utilizar
force_qr para saltarte o paso de Cholesky, pois nos casos "dubidosos" isto
pode asegurar unha maior precisión.
fcp: on ou off (por defecto). Utiliza o algoritmo de Fiorentini, Calzolari
e Panattoni en vez do código propio de Gretl cando se calculan as
estimacións GARCH.
gmm_maxiter: Un enteiro, o número máximo de iteracións da instrución
"gmm" de Gretl cando se está en modo iterativo (en contraposición ao dun
paso ou ao de dous pasos). O valor por defecto é 250.
nadarwat_trim: Un enteiro, o parámetro de recorte utilizado na función
"nadarwat".
fdjac_quality: Un enteiro entre 0 e 2, que indica o algoritmo utilizado
pola función "fdjac".
Xénese de números aleatorios
seed: Un número natural positivo. Establece a semente para o xerador de
números pseudoaleatorios. Por defecto, isto establécese a partir do
tempo do sistema; pero se queres xerar secuencias repetibles de números
aleatorios debes de establecer a semente manualmente.
Estimación robusta
bootrep: Un enteiro. Establece o número de repeticións da instrución
"restrict" coa opción --bootstrap.
garch_vcv: unset, hessian, im (matriz de información), op (matriz de
produto externo), qml (estimador CMV) ou bw (Bollerslev-Wooldridge).
Especifica a variante que se vai utilizar para estimar a matriz de
covarianzas dos coeficientes para modelos GARCH. Cando indicas unset (caso
por defecto) entón utilízase a matriz Hessiana agás que se indique a
opción "robust" para a instrución garch, en cuxo caso utilízase CMV
(QML).
arma_vcv: hessian (caso por defecto) ou op (matriz de produto externo).
Especifica a variante que se vai utilizar cando se calcula a matriz de
covarianzas para modelos ARIMA.
force_hc: off (por defecto) ou on. Por defecto, con datos de series
temporais e cando indicas a opción--robust con ols (MCO), utilízase o
estimador HAC. Se pos force_hc en "on", isto forza o cálculo da Matriz de
Covarianzas Consistente ante Heterocedasticidade (HCCM) habitual, que non
ten en conta a autocorrelación. Cae na conta de que os VARs trátanse
como un caso especial pois cando indicas a opción --robust o método por
defecto é o da HCCM habitual, pero podes utilizar a opción --robust-hac
para forzar que se empregue un estimador HAC.
robust_z: off (por defecto) ou on. Isto controla a distribución que se
utiliza cando se calculan as probabilidades asociadas (valores p) baseadas
nas desviacións padrón robustas no contexto dos estimadores de mínimos
cadrados. Por defecto, Gretl utiliza a distribución t de Student pero se
activas robust_z, utilízase unha distribución Normal.
hac_lag: nw1 (por defecto), nw2, nw3 ou un enteiro. Establece o valor do
retardo máximo ou largo de banda (p) utilizado cando se calculan as
desviacións padrón HAC (Consistentes ante Heterocedasticidade e
Autocorrelación) utilizando o enfoque de Newey-West, para datos de series
temporais. As opcións nw1 e nw2 representan dúas variantes de cálculo
automático baseadas no tamaño da mostra T: para nw1, p = 0.75 * T^(1/3),
e para nw2, p = 4 * (T/100)^(2/9). nw3 solicita unha elección do largo de
banda que se basea nos datos. Consulta tamén máis abaixo qs_bandwidth e
hac_prewhiten.
hac_kernel: bartlett (por defecto), parzen ou qs (Espectral cadrado).
Establece o 'kernel', ou padrón de ponderacións, que se utiliza cando se
calculan as desviacións padrón HAC.
hac_prewhiten: on ou off (por defecto). Utiliza o 'branqueo' previo e a
volta a colorear de Andrews-Monahan cando se calculan as desviacións
padrón HAC. Isto tamén implica utilizar unha elección do largo de banda
que se basea nos datos.
hc_version: 0 (por defecto), 1, 2, 3 ou 3a. Establece a variante que se
utiliza ao calcular as desviacións padrón Consistentes ante
Heterocedasticidade (HC) con datos de sección cruzada. As 4 primeiras
opcións correspóndense a HC0, HC1, HC2 e HC3 discutidas por Davidson e
MacKinnon no capítulo 5 de Econometric Theory and Methods. HC0 produce as
"desviacións padrón de White", como se denominan habitualmente. A
variante 3a é o procedemento da "navalla" de MacKinnon-White.
pcse: off (por defecto) ou on. Por defecto, cando se estima un modelo
utilizando MCO combinados con datos de panel coa opción --robust,
utilízase o estimador de Arellano para a matriz de covarianzas. Cando pos
pcse en "on", isto forza que se utilicen as Desviacións Padrón
Corrixidas de Panel de Beck e Katz (que non teñen en conta a
autocorrelación).
qs_bandwidth: Largo de banda para a estimación HAC no caso de que
selecciones o kernel Espectral Cadrado (QS). (A diferenza dos 'kernels' de
Bartlett e de Parzen, o largo de banda QS non require ser un enteiro.)
Series temporais
horizon: Un enteiro (por defecto baséase na frecuencia dos datos).
Establece o horizonte para as respostas ao impulso e as descomposicións
da varianza de predición no contexto de autorregresións de vectores.
vecm_norm: phillips (por defecto), diag, first ou none. Usada no contexto
da estimación VECM mediante a instrución "vecm" para identificar os
vectores de cointegración. Consulta o Guía de usuario de Gretl
(Capítulo 29) para obter máis detalles.
Interacción con R
R_lib: on (por defecto) ou off. Cando se envían instrucións para que as
execute R, utiliza a biblioteca compartida R mellor ca o executable R, se
a biblioteca está dispoñible.
R_functions: off (por defecto) ou on. Recoñece funcións definidas en R
como se foran funcións propias (para iso requírese o prefixo de
asignación de nomes "R."). Consulta o Guía de usuario de Gretl
(Capítulo 38) para obter máis detalles sobre este elemento e o anterior.
# setinfo Dataset
Argumento: serie
Opcións: --description=cadea (Establece a descrición)
--graph-name=cadea (Establece o nome da gráfica)
--discrete (Marca a serie como discreta)
--continuous (Marca a serie como continua)
--coded (Marca como unha codificación)
--numeric (Marca como non codificación)
--midas (Marca como compoñente de datos de alta frecuencia)
Exemplos: setinfo x1 --description="Descrición de x1"
setinfo y --graph-name="Algunha cadea"
setinfo z --discrete
Se activas as opcións --description ou --graph-name, o argumento debe de
ser unha única serie; noutro caso, poderá ser unha lista de series en cuxo
caso a instrución funciona sobre todos os elementos da lista. Esta
instrución configura 4 atributos como se indica deseguido.
Cando indicas a opción --description seguida dunha cadea de texto entre
comiñas, esa cadea utilízase para establecer a etiqueta descritiva da
variable. Esta etiqueta amósase en resposta á instrución "labels" e
tamén amósase na xanela principal do programa de Interface Gráfica de
Usuario (GUI).
Cando especificas a opción --graph-name seguida dunha cadea de texto entre
comiñas, esa cadea vaise utilizar nas gráficas en lugar do nome da
variable.
Cando indicas un dos dous indicadores de opción --discrete ou --continuous,
o carácter numérico da variable establécese en consonancia con iso. Por
defecto, trátanse todas as series como continuas, entón determinar que
unha serie sexa discreta vai afectar ao xeito no que se manexa a variable
nas gráficas de frecuencia.
Cando indicas algunha das dúas opcións --coded ou --numeric, o status da
serie indicada establécese dacordo con iso. Por defecto, trátanse todos os
valores numéricos como que teñen sentido coma tales, polo menos na
acepción habitual; pero establecer que unha serie é coded quere dicir que
os valores numéricos son unha codificación arbitraria de características
cualitativas.
A opción --midas establece unha indicación que alude a que unha
determinada serie contén datos dunha frecuencia maior que a frecuencia base
do conxunto de datos; por exemplo, se o conxunto de datos é trimestral, e
as series conteñen valores para o mes 1, 2 ou 3 de cada trimestre. (MIDAS =
Mixed Data Sampling.)
Ruta do menú: /Variable/Editar atributos
Outro acceso: Xanela principal: Menú emerxente
# setmiss Dataset
Argumentos: valor [ listavariables ]
Exemplos: setmiss -1
setmiss 100 x2
Permite que o programa interprete algún valor específico de dato numérico
(o primeiro parámetro da instrución) como un código para "ausente", no
caso de importar datos. Cando este valor é o único parámetro (como no
primeiro exemplo de arriba), esa interpretación vaise aplicar a todas as
series do conxunto de datos. Cando "valor" vai seguido dunha lista de
variables (indicadas por nome ou número), a interpretación limítase á(s)
variable(s) especificada(s). Así, no segundo exemplo, o valor 100 dos datos
interprétase como un código para "ausente", pero só para a variable x2.
Ruta do menú: /Datos/Establecer código de valor ausente
# setobs Dataset
Variantes: setobs periodicidade obsinicio
setobs varunidades vartempo --panel-vars
Opcións: --cross-section (Interpreta como de sección cruzada)
--time-series (Interpreta como serie temporal)
--special-time-series (Mira abaixo)
--stacked-cross-section (Interpreta como datos de panel)
--stacked-time-series (Interpreta como datos de panel)
--panel-vars (Utiliza variables índice, mira abaixo)
--panel-time (Mira abaixo)
--panel-groups (Mira abaixo)
Exemplos: setobs 4 1990:1 --time-series
setobs 12 1978:03
setobs 1 1 --cross-section
setobs 20 1:1 --stacked-time-series
setobs unit year --panel-vars
Esta instrución forza ao programa a que interprete que o conxunto de datos
ten unha estrutura específica.
Na primeira forma da instrución, debes de indicar a periodicidade mediante
un enteiro que represente a frecuencia no caso de que os datos sexan series
temporais (1 = anuais; 4 = trimestrais; 12 = mensuais; 52 = semanais; 5, 6,
ou 7 = diarios; 24 = horarios). No caso de datos de panel, a periodicidade
indica o número de liñas por bloque de datos; polo tanto isto expresa o
número de unidades consecutivas cando indicas que son 'seccións cruzadas
amontoadas', ou o número de períodos de tempo consecutivos cando indicas
'series de tempo amontoadas'. No caso de datos simples de sección cruzada,
a periodicidade debe de establecerse en 1.
A observación de inicio representa a data inicial no caso de tratarse de
datos de series temporais. Podes indicar os anos mediante 2 ou 4 díxitos; e
debes de separar os subperíodos (por exemplo, trimestres ou meses) do ano
mediante dous puntos. No caso de datos de panel, debes de indicar a
observación inicial como 1:1, e no caso de datos de sección cruzada, como
1. Debes de indicar as observacións iniciais para datos diarios ou semanais
co formato YYYY-MM-DD (ou simplemente como 1 para datos sen datar).
Algunhas periodicidades de series temporais teñen interpretacións
estándar (por exemplo, 12 = mensuais e 4 = trimestrais). Pero se tes datos
pouco habituais de series temporais para as que non se aplica a
interpretación estándar, podes sinalar isto indicando a opción
--special-time-series. Nese caso, Gretl non vai advertir de que os teus
datos de (por exemplo) frecuencia igual a 12 sexan mensuais.
Cando non seleccionas un indicador de opción explícito para determinar a
estrutura dos datos, o programa vai tratar de adiviñar a estrutura a partir
da información proporcionada.
A segunda forma da instrución (que require que indiques a opción
--panel-vars) pode utilizarse para impoñer unha interpretación de panel
cando o conxunto de datos contén variables que identifican de forma
inequívoca as unidades de sección cruzada e os períodos de tempo. O
conxunto de datos vaise ordenar como series de tempo amontoadas, en función
dos valores ascendentes da variable de unidades (varunidades).
Opcións específicas de Panel
Podes usar opcións --panel-time e --panel-groups unicamente cun conxunto de
datos que xa foi definido previamente como un panel.
A intención da opción --panel-time é determinar información adicional
relacionada coa dimensión temporal do panel. Debes de indicar esta seguindo
o padrón do primeiro formato de setobs apuntado máis arriba. Por exemplo,
podes utilizar a seguinte forma para indicar que a dimensión temporal dun
panel é trimestral, comezando no primeiro trimestre de 1990:
setobs 4 1990:1 --panel-time
A intención da opción --panel-groups é crear unha serie con valores en
cadeas de texto que conteña os nomes dos grupos (individuos, unidades
atemporais) do panel. (Isto vaise utilizar cando sexa adecuado en gráficas
de panel.) Con esta opción indicas un ou dous argumentos, como se indica
deseguido.
Primeiro caso: Un único argumento é o nome dunha serie con valores en
cadeas de texto. Se o número de valores diferentes é igual ao número de
grupos do panel, esa serie utilízase para definir os nomes dos grupos. Se
resulta necesario, o contido numérico da serie vaise axustar de forma que
os valores sexan todos 1 para o primeiro grupo, todos 2 para o segundo
grupo, etcétera. Cando o número de valores diferentes en cadeas de texto
non coincide co número de grupos, amósase un fallo.
Segundo caso: O primeiro argumento é o nome dunha serie, e o segundo é
unha cadea de texto literal ou unha variable de cadea que contén un nome
para cada grupo. As series vanse xerar se non existen xa. Cando o segundo
argumento é unha cadea de texto literal ou unha variable de cadea, os nomes
dos grupos deben de estar separados por espazos; pero se un nome inclúe
espazos, debe de contornarse con comiñas precedidas (cada unha) de barra
inversa. Alternativamente, o segundo argumento pode ser un arranxo de cadeas
de texto.
Por exemplo, o seguinte código xera unha serie que se vai chamar Estado na
que os nomes da cadea cstrs repítense cada un T veces, e sendo T a longura
das series de tempo do panel.
string cstrs = sprintf("Francia Alemaña Italia \"Reino Unido\"")
setobs Estado cstrs --panel-groups
Ruta do menú: /Datos/Estrutura do conxunto de datos
# setopt Programming
Argumentos: instrución [ acción ] opcións
Exemplos: setopt mle --hessian
setopt ols persist --quiet
setopt ols clear
Esta instrución permite a configuración previa de opcións para unha
instrución concreta. Normalmente isto non fai falta, pero pode ser útil
para os autores de funcións en Hansl cando queren facer que algunhas
opcións das instrucións estean condicionadas ao valor dun argumento que
proporcione o que as solicita.
Por exemplo, supón que unha función ofrece un interruptor booleano
"quiet", cuxa intención é a de que se suprima a presentación de
resultados dunha determinada regresión que se executa dentro da propia
función. Nese caso, poderíase escribir:
if quiet
setopt ols --quiet
endif
ols ...
Entón, a opción --quiet vaise aplicar á vindeira instrución ols
unicamente se a variable quiet ten un valor non nulo.
Por defecto, as opcións que se establecen deste xeito só se aplican á
seguinte acaecemento da instrución; polo que non son persistentes. Porén,
se indicas persist como valor para acción, as opcións se continuarán
aplicando á instrución indicada ata novo aviso. O 'antídoto' á acción
persist é clear, pois este elimina calquera configuración gardada para a
instrución especificada.
Debes de ter en conta que as opcións establecidas mediante setopt
combínanse con calquera opción anexada directamente á instrución
apuntada. Así, por exemplo, pódese engadir a opción --hessian a unha
instrución mle de forma incondicional, pero utilizar setopt para engadir
--quiet de forma condicional.
# shell Utilities
Argumento: instrucshell
Exemplos: ! ls -al
! notepad
launch notepad
Un signo de exclamación ("!") ou a palabra clave "launch", ao comezo dunha
liña de instrución se interpreta como unha escapada do intérprete de
usuario. Así podes executar instrucións do intérprete ao teu antollo
desde dentro de Gretl. Se utilizas "!", a instrución externa execútase de
forma síncrona; é dicir, Gretl agarda a que se complete a instrución
antes de proseguir. Cando queiras comezar outro programa desde dentro de
Gretl e non ter que agardar a que se complete (operación asíncrona ),
utiliza no seu lugar "launch".
Por razóns de seguridade, esta prestación non se permite por defecto. Para
activala, marca o cadriño "Permitir instrucións do intérprete" baixo o
menú Ferramentas/Preferencias/Xeral no programa de Interface Gráfica de
Usuario (GUI). Isto tamén fai que estean dispoñibles as instrucións do
intérprete no programa de instrucións en liñas (e resulta o único xeito
de facelo).
# smpl Dataset
Variantes: smpl obsinicio obsfin
smpl +i -j
smpl varficticia --dummy
smpl condición --restrict
smpl --no-missing [ listavariables ]
smpl --no-all-missing [ listavariables ]
smpl --contiguous [ listavariables ]
smpl n --random
smpl full
Opcións: --dummy (O argumento é unha variable ficticia)
--restrict (Aplica unha restrición booleana)
--replace (Substitúe calquera restrición booleana existente)
--no-missing (Limitarse a observacións válidas)
--no-all-missing (Omite observacións baleiras (mira abaixo))
--contiguous (Mira abaixo)
--random (Xera unha submostra aleatoria)
--permanent (Mira abaixo)
--balanced (Datos de panel: trata de manter o panel equilibrado)
Exemplos: smpl 3 10
smpl 1960:2 1982:4
smpl +1 -1
smpl x > 3000 --restrict
smpl y > 3000 --restrict --replace
smpl 100 --random
Restablece o rango da mostra. Podes definir o novo rango de varios xeitos.
Na primeira alternativa (e nos dous primeiros exemplos) de arriba, obsinicio
e obsfin deben de ser consistentes coa periodicidade dos datos. Podes
substituír calquera dos dous mediante un punto e coma para deixar ese valor
sen cambiar. Na segunda forma, os números enteiros i e j (poden ser
positivos ou negativos, e deben de ter o seu signo) considéranse como
variacións en relación ao rango da mostra existente. Na terceira forma,
varficticia debe de ser unha variable de sinalización con valores 0 ou 1 en
cada observación; así a mostra vaise restrinxir ás observacións nas que
o valor é 1. A cuarta forma, que utiliza --restrict, restrinxe a mostra ás
observacións que cumpren a condición booleana que se indica (e que se
especifica de acordo coa sintaxe da instrución "genr").
Podes empregar as opcións --no-missing e --no-all-missing para excluír da
mostra aquelas observacións para as que hai ausencia de datos. A primeira
variante exclúe aquelas filas do conxunto de datos para as que polo menos
unha variable ten un valor ausente, mentres que a segunda variante exclúe
unicamente aquelas filas nas que todas as variables teñen valores ausentes.
En cada caso, a comprobación limítase ás variables de listavariables
cando indicas este argumento; noutro caso, aplícase a todas as series (coa
reserva de que no caso de non ter listavariables e indicar --no-all-missing,
as variables xenéricas index e time ignóranse).
A opción --contiguous de smpl está pensada para usar con datos de series
temporais. O seu efecto consiste en recortar calquera observación ao comezo
e ao final do rango da mostra vixente que conteña valores ausentes (ben
para as variables de listavariables, ou ben para todas as series de datos se
non indicas listavariables). Entón realízase unha verificación para ver
se hai algún valor ausente no rango que queda; e se é así, amósase un
fallo.
Coa opción --random, o número de casos especificado escóllese
aleatoriamente do conxunto vixente de datos (sen substitución). Se queres
ser capaz de replicar esa selección, debes de establecer primeiro a semente
para o xerador de números aleatorios (consulta a instrución "set").
A forma final (smpl full) restablece o rango completo de datos.
Ten en conta que as restricións mostrais son, por defecto, acumulativas; é
dicir, o punto de partida de calquera instrución smpl é a mostra vixente.
Se queres que a instrución actúe substituíndo calquera restrición xa
existente, podes engadir o indicador de opción --replace ao final da
instrución. (Pero esta opción non é compatible coa opción --contiguous.)
Podes utilizar a variable interna obs xunto coa opción --restrict de smpl
para excluír observacións concretas da mostra. Por exemplo
smpl obs!=4 --restrict
vai prescindir unicamente da cuarta observación. Se os casos dos datos se
identifican mediante etiquetas,
smpl obs!="USA" --restrict
vai prescindir da observación coa etiqueta "USA".
Debe de apuntarse unha cuestión en relación ás opcións --dummy,
--restrict e --no-missing da instrución smpl: a información "estrutural"
do ficheiro de datos (relacionada coa natureza de series de tempo ou de
panel, dos datos) probablemente vaise perder cando se execute esta
instrución; pero podes volver impoñer a estrutura coa instrución
"setobs". Para utilizar con datos de panel, unha opción relacionada é
--balanced, que pide que se reconstrúa un panel equilibrado logo de extraer
unha submostra, mediante a inserción de "filas ausentes", se é necesario.
Pero ten en conta que non sempre é posible cumprir esta petición.
Por defecto, non podes establecer limitacións sobre o rango da mostra
vixente, e executando smpl full podes restaurar o conxunto de datos
completo. Porén, podes utilizar a opción --permanent para substituír o
conxunto de datos restrinxido en lugar do orixinal. Esta opción só está
dispoñible cando se aplica ao mesmo tempo que as opcións --restrict,
--dummy, --no-missing, --no-all-missing ou --random da instrución smpl.
Consulta o Guía de usuario de Gretl (Capítulo 5) para obter outros
detalles.
Ruta do menú: /Mostra
# spearman Statistics
Argumentos: serie1 serie2
Opción: --verbose (Presenta os datos por rangos)
Presenta o coeficiente da correlación por rangos de Spearman para as series
serie1 e serie2. Non tes que xerarquizar manualmente as variables por
adiantado, pois a función xa ten conta diso.
A forma automática de xerarquizar é de maior a menor (i.e. o valor máis
grande dos datos acada o rango 1). Se necesitas inverter esta forma de
xerarquizar, xera unha nova variable que sexa a negativa da orixinal. Por
exemplo:
series altx = -x
spearman altx y
Ruta do menú: /Ferramentas/Probas non paramétricas/Correlación
# sprintf Printing
Argumentos: varcadea formato , args
Esta instrución funciona exactamente como a instrución "printf" e presenta
os argumentos que se indican, baixo o control da cadea de formato, coa
excepción de que o resultado escríbese na cadea de texto indicada en
varcadea.
# square Transformations
Argumento: listavariables
Opción: --cross (Xera os produtos cruzados así como os cadrados)
Xera novas series que son os cadrados das series de listavariables (ademais
das variables cos produtos cruzados entre cada dúas, cando indicas a
opción --cross). Por exemplo, "square x y" vai xerar as variables sq_x = x
ao cadrado, sq_y = y ao cadrado e (opcionalmente) x_y = x por y. Cando unha
determinada variable é unha variable ficticia, non se calcula o seu cadrado
pois obteríamos a mesma variable.
Ruta do menú: /Engadir/Cadrados das variables seleccionadas
# store Dataset
Argumentos: nomeficheiro [ listavariables ]
Opcións: --csv (Utiliza o formato CSV)
--omit-obs (Mira abaixo, sobre o formato CSV)
--no-header (Mira abaixo, sobre o formato CSV)
--gnu-octave (Utiliza o formato GNU Octave)
--gnu-R (Formato tratable con read.table)
--gzipped[=nivel] (Aplica a compresión gzip)
--jmulti (Utiliza o formato ASCII JMulti)
--dat (Utiliza o formato ASCII PcGive)
--decimal-comma (Utiliza a coma como carácter decimal)
--database (Utiliza o formato de banco de datos de Gretl)
--overwrite (Mira abaixo, sobre o formato de banco de datos)
--comment=cadea (Mira abaixo)
Garda os datos en nomeficheiro. Por defecto, gárdanse todas as series xa
definidas nese momento pero podes utilizar o argumento listavariables
(opcional) para escoller un subconxunto de series. Se o conxunto de datos é
unha submostra, só se gardan as observacións do rango vixente da mostra.
O ficheiro resultante vai escribirse no cartafol ("workdir") establecido
nese momento, agás que a cadea nomeficheiro conteña unha especificación
completa da ruta.
Ata certo punto, podes controlar o formato no que se escriben os datos
mediante a extensión ou sufixo de nomeficheiro, como se indica deseguido:
.gdt (ou sen extensión): Formato de datos XML propio de Gretl. (Se non
indicas ningunha extensión, automaticamente engádese ".gdt")
.gtdb: Formato de datos binario propio de Gretl.
.csv: Valores Separados con Comas (CSV).
.txt ou .asc: valores separados con espazos.
.m: Formato matricial GNU Octave.
.dta: Formato dta de Stata (versión 113).
Podes usar os indicadores de opción relacionados co formato que se amosan
arriba para forzar a cuestión do formato cando se garda, con independencia
do nome do ficheiro (ou para lograr que Gretl escriba nos formatos de PcGive
ou JMulTi). Porén, se nomeficheiro ten unha extensión .gdt ou .gdtb, isto
implica utilizar necesariamente o formato propio e se engades un indicador
de opción conflitivo, vai xerar un fallo.
Cando gardas os datos no formato propio (unicamente), podes utilizar a
opción --gzipped para comprimir os datos, o que pode ser moi útil para
conxuntos grandes de datos. O parámetro (optativo) desta opción controla o
nivel de compresión (de 0 a 9): os niveles máis altos producen un ficheiro
máis pequeno, pero a compresión leva máis tempo. O nivel por defecto é
1, e un nivel igual a 0 significa que non se aplica ningunha compresión.
Os indicadores de opción --omit-obs e --no-header son só aplicables cando
se gardan datos no formato CSV. Por defecto, se os datos son series
temporais ou de panel, ou se o conxunto de datos inclúe marcadores
específicos de observación, o ficheiro CSV inclúe unha primeira columna
que identifica as observacións (e.g. por data). Cando indicas a opción
--omit-obs, esta columna omítese. A opción --no-header elimina a habitual
representación dos nomes das variables no encabezamento das columnas.
O indicador de opción --decimal-comma está tamén limitado ao caso de que
se garden os datos en formato CSV. O efecto desta opción consiste en
substituír o punto decimal coa coma decimal; e por engadido, fórzase a que
o separador de columnas sexa o punto e coma.
A posibilidade de gardar no formato de banco de datos de Gretl está pensada
para axudar a construír conxuntos longos de series, tal vez mesturando
frecuencias e rangos de observacións. Neste momento, esta opción só está
dispoñible para datos de series temporais de tipo anual, trimestral ou
mensual. Se gardas nun ficheiro que xa existe, o efecto por defecto consiste
en engadir as series recentemente gardadas ao contido existente no banco de
datos. Neste contexto, é un fallo que unha (ou máis) das variables que se
van gardar teña o mesmo nome ca unha variable que xa está presente no
banco de datos. A opción --overwrite ten como consecuencia que, se hai
nomes de variables en común, a variable recentemente gardada substitúe á
variable do mesmo nome no conxunto de datos orixinal.
A opción --comment está dispoñible cando se gardan datos como banco de
datos ou en formato CSV. O parámetro que se require é unha cadea nunha
liña, entre comiñas, ligada ao indicador de opción mediante un signo de
igualdade. A cadea de texto insírese como comentario no ficheiro índice do
banco de datos ou no encabezamento do resultado CSV.
A instrución store compórtase de xeito especial no contexto dun "bucle
progresivo". Consulta o Guía de usuario de Gretl (Capítulo 12) para obter
máis detalles.
Ruta do menú: /Ficheiro/Gardar datos; /Ficheiro/Exportar datos
# summary Statistics
Variantes: summary [ listavariables ]
summary --matrix=nomematr
Opcións: --simple (Só estatísticos básicos)
--weight=wvar (Variable de ponderación)
--by=byvar (Mira abaixo)
Na súa primeira forma, esta instrución presenta un resumo estatístico
para as variables de listavariables, ou para todas as variables do conxunto
de datos cando omites listavariables. Por defecto, o resultado consiste na
media, desviación padrón (sd), coeficiente de variación (= sd/media),
mediana, mínimo, máximo, coeficiente de asimetría e exceso de curtose.
Cando indicas a opción --simple, o resultado limítase á media, o mínimo,
o máximo e a desviación padrón.
Cando indicas a opción --by (en cuxo caso o parámetro byvar debe de ser o
nome dunha variable discreta), entón preséntanse os estatísticos para as
submostras que se corresponden cos diferentes valores que toma byvar. Por
exemplo, cando byvar é unha variable ficticia (binaria), preséntanse os
estatísticos para os casos nos que byvar = 0 e byvar = 1. Advertencia:
Neste momento, esta opción é incompatible coa opción --weight.
Cando indicas a forma alternativa, utilizando unha matriz xa definida,
entón preséntase o resumo estatístico para cada columna da matriz. Neste
caso, a opción --by non está dispoñible.
Ruta do menú: /Ver/Estatísticos principais
Outro acceso: Fiestra principal: Menú emerxente
# system Estimation
Variantes: system method=estimador
sysname <- system
Exemplos: "Klein Model 1" <- system
system method=sur
system method=3sls
Mira tamén klein.inp, kmenta.inp, greene14_2.inp
Comeza un sistema de ecuacións. Podes indicar unha das dúas formas da
instrución, dependendo de se queres gardar o sistema para estimalo de
varias formas, ou só estimar o sistema unha vez.
Para gardar o sistema debes de asignarlle un nome como no primeiro exemplo
(se o nome contén espazos, debes de contornalo entre comiñas). Neste caso,
estímase o sistema utilizando a instrución "estimate". Cun sistema de
ecuacións xa gardado, podes impoñer restricións (incluídas restricións
entre ecuacións) utilizando a instrución "restrict".
Como alternativa, podes especificar un estimador para o sistema utilizando
method= seguido dunha cadea que identifique un dos estimadores admitidos:
"ols" (Mínimos Cadrados Ordinarios), "tsls" (Mínimos Cadrados en 2 Etapas)
"sur" (Regresións Aparentemente Non Relacionadas), "3sls" (Mínimos
Cadrados en 3 Etapas), "fiml" (Máxima Verosimilitude con Información
Total) ou "liml" (Máxima Verosimilitude con Información Limitada). Neste
caso, o sistema estímase unha vez que estea completa a súa definición.
Un sistema de ecuacións remátase coa liña "end system". Dentro do sistema
poden indicarse 4 tipos de enunciado, como os seguintes.
"equation": Especifica unha ecuación do sistema. Como mínimo deben de
proporcionarse dous enunciados deste tipo.
"instr": Para estimar un sistema mediante Mínimos Cadrados en 3 etapas,
indícase unha lista de instrumentos (mediante o nome da variable ou seu
número). Alternativamente, podes poñer esta información na liña
"equation" usando a mesma sintaxe que na instrución "tsls".
"endog": Para un sistema de ecuacións simultáneas, indícase unha lista
de variables endóxenas. En principio, isto está pensado para utilizar
coa estimación FIML, pero podes utilizar este enfoque con Mínimos
Cadrados en 3 Etapas en substitución de indicar unha lista "instr"; e
entón todas as variables que non se identifiquen como endóxenas vanse
utilizar como instrumentos.
"identity": Para utilizar con Máxima Verosimilitude con Información
Completa (MVIC, FIML), indícase unha identidade que enlaza dúas ou máis
variables do sistema. Este tipo de enunciado se ignora cando se utiliza un
estimador diferente ao de MVIC.
Logo de facer a estimación utilizando as instrucións "system" ou
"estimate", podes usar os seguintes accesorios para recoller información
adicional:
$uhat: Matriz cos erros de estimación, cunha columna por ecuación.
$yhat: Matriz cos valores axustados, cunha columna por ecuación.
$coeff: Vector columna cos coeficientes das ecuacións (todos os
coeficientes da primeira ecuación, seguidos polos da segunda ecuación,
etcétera).
$vcv: Matriz coas covarianzas entre os coeficientes. Cando hai k elementos
no vector $coeff, esta matriz ten unha dimensión de k por k.
$sigma: Matriz coas covarianzas entre os erros de estimación das
ecuacións cruzadas.
$sysGamma, $sysA e $sysB: Matrices cos coeficientes na forma estrutural
(mira abaixo).
Se queres recuperar os erros de estimación ou os valores axustados para
unha ecuación en concreto, en forma de serie de datos, escolle unha columna
da matriz $uhat ou $yhat e asígnalle a serie, como en
series uh1 = $uhat[,1]
As matrices na forma estrutural correspóndense coa seguinte representación
dun modelo de ecuacións simultáneas:
Gamma y(t) = A y(t-1) + B x(t) + e(t)
Se hai n variables endóxenas e k variables esóxenas, Gamma é unha matriz
de dimensión n x n e B é n x k. Cando o sistema non contén ningún
retardo das variables endóxenas, entón a matriz A non está presente. Se o
retardo máximo dun regresor endóxeno é p, a matriz A é de dimensión n x
np.
Ruta do menú: /Modelar/Ecuacións Simultáneas
# tabprint Printing
Opcións: --output=nomeficheiro (Envía o resultado ao ficheiro especificado)
--format="f1|f2|f3|f4" (Especifica o formato TeX personalizado)
--complete (Relacionado con TeX, mira abaixo)
Debe de ir despois da estimación dun modelo e presenta ese modelo en
formato de táboa. O formato réxese pola extensión do nomeficheiro
especificado: ".tex" para LaTeX, ".rtf" para RTF (Microsoft's Rich Text
Format) ou ".csv" para o formato con separación mediante comas. O ficheiro
resultante vai escribirse no cartafol vixente ("workdir"), agás que a cadea
nomeficheiro conteña unha especificación completa da ruta.
Cando seleccionas o formato CSV, os valores sepáranse con comas agás que a
coma decimal estea vixente, en cuxo caso o separador é o punto e coma.
Opcións específicas de resultados en LaTeX
Cando indicas a opción --complete, o ficheiro LaTeX é un documento
completo, listo para procesar; noutro caso, debe de incluírse nun
documento.
Se queres modificar a aparencia do resultado tabular, podes especificar un
formato personalizado en filas utilizando a opción --format. A cadea de
formato debe de estar contornada entre comiñas e debe de estar ligada á
opción cun signo de igualdade. O padrón para as cadeas de formato é o
seguinte. Existen 4 campos que representan: o coeficiente, a desviación
padrón, a razón t e a probabilidade asociada, respectivamente. Debes de
separar estes campos mediante barras verticais; e ou ben poden ter unha
especificación de tipo printf para o formato do valor numérico en
cuestión, ou ben poden deixarse en branco para eliminar a presentación
desa columna (suxeito isto á condición de que non podes deixar todas as
columnas en branco). Aquí tes uns poucos exemplos:
--format="%.4f|%.4f|%.4f|%.4f"
--format="%.4f|%.4f|%.3f|"
--format="%.5f|%.4f||%.4f"
--format="%.8g|%.8g||%.4f"
A primeira destas especificacións presenta os valores de todas as columnas
usando 4 díxitos decimais. A segunda elimina a probabilidade asociada e
presenta as razóns t con 3 díxitos decimais. A terceira omite a razón t.
A derradeira tamén omite o t, e presenta tanto o coeficiente como a
desviación padrón con 8 cifras significativas.
Unha vez que estableces un formato personalizado deste xeito, este lémbrase
e utilízase ao longo do que dure a sesión de Gretl. Para reverter isto ao
formato por defecto, podes utilizar a variante especial --format=default.
Ruta do menú: Xanela de modelo: LaTeX
# textplot Graphs
Argumento: listavariables
Opcións: --time-series (Gráfica por observación)
--one-scale (Forza unha escala única)
--tall (Usa 40 filas)
Gráficas ASCII rápidas e sinxelas. Sen a opción --time-series,
listavariables debe de conter cando menos 2 series, a última delas tómase
como a variable para o eixe x, e xérase unha gráfica de dispersión. Neste
caso, podes utilizar a opción --tall para xerar unha gráfica na que o eixe
y se representa mediante 40 filas de caracteres (por defecto son 20 filas).
Coa opción --time-series, xérase unha gráfica por observación. Neste
caso, podes utilizar a opción --one-scale para forzar o uso dunha escala
única; noutro caso, se listavariables contén máis dunha serie, os datos
poden escalarse. Cada liña representa unha observación, cos valores dos
datos debuxados horizontalmente.
Consulta tamén "gnuplot".
# tobit Estimation
Argumentos: depvar indepvars
Opcións: --llimit=limesq (Especifica a cota da esquerda)
--rlimit=limder (Especifica a cota da dereita)
--vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Consulta "logit" para máis explicacións)
--verbose (Presenta os detalles das iteracións)
Estima un modelo Tobit, que pode ser o adecuado cando a variable dependente
está "censurada". Por exemplo, cando se observan valores positivos e nulos
na adquisición de bens duradeiros por parte dos fogares, e ningún valor
negativo, mesmo pode pensarse que as decisións sobre esas compras son o
resultado dunha disposición subxacente e inobservada a comprar que pode ser
negativa nalgúns casos.
Por defecto, asúmese que a variable dependente está 'censurada' no cero
pola esquerda, e que non está 'censurada' pola dereita. Porén, podes usar
as opcións --llimit e --rlimit para especificar un padrón diferente para
facer a 'censura'. Ten en conta que se especificas unicamente unha cota pola
dereita, entón o que se supón é que a variable dependente non está
'censurada' pola esquerda.
O modelo Tobit é un caso especial da regresión por intervalos,
executándose esta mediante a instrución "intreg".
Ruta do menú: /Modelar/Variable Dependente Limitada/Tobit
# tsls Estimation
Argumentos: depvar indepvars ; instrumentos
Opcións: --no-tests (Non fai probas de diagnose)
--vcv (Presenta a matriz de covarianzas)
--no-df-corr (Sen corrección dos graos de liberdade)
--robust (Desviacións padrón robustas)
--cluster=clustvar (Desviacións padrón agrupadas)
--liml (Utiliza Máxima Verosimilitude con Información Limitada)
--gmm (Utiliza o Método Xeneralizado dos Momentos)
Exemplo: tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6
Calcula as estimacións de Variables Instrumentais (VI), utilizando por
defecto Mínimos Cadrados en 2 Etapas (TSLS), pero mira máis abaixo para
outras opcións. A variable dependente é depvar, mentres que indepvars
expresa unha lista de regresores (presuponse que inclúe cando menos unha
variable endóxena) e instrumentos indica unha lista de instrumentos
(variables esóxenas e/ou predeterminadas). Se a lista instrumentos non é
cando menos tan longa como indepvars, o modelo non está identificado.
No exemplo de arriba, as ys son as variables endóxenas e as xs son as
variables esóxenas. Cae na conta de que os regresores esóxenos deben de
aparecer en ambas listas.
O resultado das estimacións de Mínimos Cadrados en 2 Etapas inclúen a
proba de Hausman e (se o modelo está sobreidentificado) a proba de
sobreidentificación de Sargan. Na proba de Hausman, a hipótese nula é que
as estimacións MCO son consistentes ou, noutras palabras, que a estimación
por medio de variables instrumentais en realidade non se necesita. Un modelo
desta clase está sobreidentificado se hai máis instrumentos dos que
estritamente se requiren. A proba de Sargan se basea nunha regresión
auxiliar dos erros da estimación do modelo por Mínimos Cadrados en 2
Etapas sobre a lista completa de instrumentos. A hipótese nula é que todos
os instrumentos son válidos, e sospéitase da validez desta hipótese se a
regresión auxiliar ten un grao de poder explicativo que é significativo.
Para unha boa explicación das dúas probas, consulta o capítulo 8 de
Davidson e MacKinnon (2004).
Tanto para MC2E (TSLS) como para a estimación MVIL (LIML), amósase o
resultado dunha proba adicional, posto que o modelo estímase baixo o
suposto de perturbacións IID (é dicir, non se escolle a opción --robust).
Esta é unha proba da debilidade dos instrumentos, pois instrumentos
débiles poden levar a serios problemas na regresión de VI: estimacións
nesgadas e/ou tamaño incorrecto das probas de hipóteses baseadas na matriz
de covarianzas, con taxas de rexeite que superan con moito o nivel de
significación nominal (Stock, Wright e Yogo, 2002). O estatístico é o da
proba F da primeira etapa se o modelo contén tan só un regresor endóxeno;
noutro caso, é o valor propio máis pequeno da matriz de contrapartida do F
da primeira etapa. Amósanse os puntos críticos baseados na análise Monte
Carlo de Stock e Yogo (2003), cando estean dispoñibles.
O valor de R-cadrado que se presenta para modelos estimados mediante
Mínimos Cadrados en 2 Etapas é o cadrado da correlación entre a variable
dependente e a variable cos valores axustados.
Para obter máis detalles en relación aos efectos das opcións --robust e
--cluster, consulta a axuda para "ols".
Como alternativas a MC2E, o modelo pode estimarse mediante Máxima
Verosimilitude con Información Limitada (opción --liml) ou mediante o
Método Xeneralizado dos Momentos (opción --gmm). Cae na conta de que, se o
modelo está simplemente identificado, estes métodos deberían xerar os
mesmos resultados que MC2E; pero se está sobreidentificado, os resultados
en xeral van diferir.
Cando se escolle a estimación MXM (GMM), as seguintes opcións adicionais
pasan a estar dispoñibles:
--two-step: Realiza MXM en 2 etapas en vez de facelo en 1 etapa (por
defecto).
--iterate: Reitera MXM ata a converxencia.
--weights=Wmat: Especifica unha matriz cadrada de ponderacións para
utilizar cando se calcula a función do criterio MXM. A dimensión desta
matriz debe de ser igual ao número de instrumentos. Por defecto, é unha
matriz identidade de dimensión axeitada.
Ruta do menú: /Modelar/Variables Instrumentais
# var Estimation
Argumentos: nivel ylista [ ; xlista ]
Opcións: --nc (Sen constante)
--trend (Con tendencia linear)
--seasonals (Con variables ficticias estacionais)
--robust (Desviacións padrón robustas)
--robust-hac (Desviacións padrón HAC)
--quiet (Non amosa os resultados das ecuacións individuais)
--silent (Non presenta nada)
--impulse-responses (Presenta as respostas ao impulso)
--variance-decomp (Presenta as descomposicións da varianza)
--lagselect (Amosa os criterios de selección de retardos)
Exemplos: var 4 x1 x2 x3 ; time mydum
var 4 x1 x2 x3 --seasonals
var 12 x1 x2 x3 --lagselect
Establece e estima (utilizando MCO) unha autorregresión de vectores (VAR).
O primeiro argumento especifica o nivel de retardos (ou o nivel máximo de
retardos no caso de que indiques a opción --lagselect, mira máis abaixo).
O nivel podes indicalo numericamente ou co nome dunha variable escalar
preexistente. A continuación segue a configuración da primeira ecuación.
Non inclúas retardos entre os elementos de ylista pois vanse engadir
automaticamente. O punto e coma vai separar as variables estocásticas (para
as que se vai incluír un nivel de retardos) de calquera variable esóxena
de xlista. Ten en conta que: (a) inclúese unha constante automaticamente
(agás que indiques a opción --nc), (b) podes engadir unha tendencia coa
opción --trend, e (c) podes engadir variables ficticias estacionais
utilizando a opción --seasonals.
Mentres que unha especificación VAR habitualmente inclúe tódolos retardos
desde 1 ata un máximo que indiques, tamén podes escoller un grupo de
retardos. Para facer isto, substitúe o argumento rutineiro nivel (escalar),
ben co nome dun vector xa definido previamente ou ben cunha lista de
retardos separados con comas, contornada entre chaves. Debaixo amósanse
dous xeitos de especificar que un VAR debe de incluír os retardos 1, 2 e 4
(pero non o 3):
var {1,2,4} ylista
matrix p = {1,2,4}
var p ylista
Devólvese unha regresión por separado para cada unha das variables de
ylista. Os resultados para cada ecuación inclúen as probas F para cero
restricións en todos os retardos de cada unha das variables, unha proba F
sobre a significación do retardo máximo e, cando especificas a opción
--impulse-responses, as descomposicións da varianza da predición e as
respostas ao impulso.
As descomposicións da varianza da predición e as respostas ao impulso
baséanse na descomposición de Cholesky da matriz de covarianzas
contemporánea e, neste contexto, ten importancia a orde na que indicas as
variables (estocásticas). Así, a primeira variable da lista asúmese que
é a "máis esóxena" dentro do período. Podes establecer o horizonte para
as descomposicións da varianza e as respostas ao impulso, utilizando a
instrución "set". Para recuperar unha función concreta de resposta ao
impulso en forma matricial, consulta a función "irf".
Cando indicas a opción --robust, as desviacións padrón corríxense do
efecto da heterocedasticidade. Como alternativa, podes indicar a opción
--robust-hac para dar lugar a desviacións padrón que sexan robustas con
respecto tanto á heterocedasticidade como á autocorrelación (HAC). En
xeral, esta última corrección non debera de ser necesaria se o VAR inclúe
un número suficiente de retardos.
Cando indicas a opción --lagselect, tómase o primeiro parámetro da
instrución var como o nivel máximo de retardos. O resultado consiste nunha
táboa que amosa os valores dos criterios de información de Akaike (AIC),
Schwarz (BIC) e Hannan-Quinn (HQC) calculados con VARs de niveis desde 1 ata
o máximo indicado. Isto trata de axudar na selección do nivel óptimo de
retardos. O resultado habitual do VAR non se presenta. Podes recuperar a
táboa cos criterios de información en forma de matriz mediante o accesorio
"$test".
Ruta do menú: /Modelar/Series temporais/Multivariante
# varlist Dataset
Opción: --type=nometipo (Eido da listaxe)
Por defecto, presenta unha listaxe das series do conxunto vixente de datos
(se hai algunha); e podes utilizar "ls" como alcume.
Cando indicas a opción --type, debe de ir seguida (tras dun signo de
igualdade) por un dos seguintes tipos: series, scalar, matrix, list, string,
bundle ou accessor. O seu efecto consiste en presentar os nomes de tódolos
obxectos do tipo indicado que estean definidos nese momento.
Como caso especial, se o tipo é accessor, os nomes que se presentan son
aqueles das variables internas dispoñibles nese momento como "accesorios",
como poden ser "$nobs" e "$uhat" (sexa cal sexa o seu tipo en concreto).
# vartest Tests
Argumentos: serie1 serie2
Calcula o estatístico F para probar a hipótese nula de que as varianzas
nas poboacións das variables serie1 e serie2 son iguais, e amosa a súa
probabilidade asociada (valor p).
Ruta do menú: /Ferramentas/Calculadora de probas
# vecm Estimation
Argumentos: nivel rango ylista [ ; xlista ] [ ; rxlista ]
Opcións: --nc (Sen constante)
--rc (Constante restrinxida)
--uc (Constante non restrinxida)
--crt (Constante e tendencia restrinxida)
--ct (Constante e tendencia non restrinxida)
--seasonals (Inclúe variables ficticias estacionais centradas)
--quiet (Non amosa os resultados das ecuacións individuais)
--silent (Non presenta nada)
--impulse-responses (Presenta as respostas ao impulso)
--variance-decomp (Presenta as descomposicións da varianza)
Exemplos: vecm 4 1 Y1 Y2 Y3
vecm 3 2 Y1 Y2 Y3 --rc
vecm 3 2 Y1 Y2 Y3 ; X1 --rc
Mira tamén denmark.inp, hamilton.inp
Un VECM é unha forma de autorregresión de vectores ou VAR (consulta
"var"), aplicable cando as variables do modelo son individualmente
integradas de orde 1 (polo tanto son paseos aleatorios, con ou sen deriva)
pero presentan cointegración. Esta instrución está intimamente
relacionada coa proba de cointegración de Johansen (consulta "coint2").
O parámetro nivel desta instrución representa o nivel de retardos do
sistema VAR. O número de retardos no propio VECM (onde a variable
dependente se indica como unha primeira diferenza) é de un menos ca nivel.
O parámetro rango representa o rango de cointegración ou, noutras
palabras, o número de vectores cointegrantes. Este debe de ser maior ca
cero, e menor ou igual (xeralmente menor) que o número de variables
endóxenas indicadas en ylista.
O argumento ylista proporciona a lista de variables endóxenas, expresadas
en niveis. A inclusión de termos de tipo determinístico no modelo,
contrólase cos indicadores de opción. Por defecto, cando non indicas
ningunha opción, inclúese unha "Constante non restrinxida", o que permite
que haxa unha ordenada na orixe non nula nas relacións de cointegración,
así como unha tendencia nos niveis das variables endóxenas. A literatura
derivada do traballo de Johansen (por exemplo, podes consultar o seu libro
de 1995) habitualmente refírese a isto como o "caso 3". As primeiras 4
opcións indicadas arriba (mutuamente excluíntes) xeran os casos 1, 2, 4 e
5, respectivamente. Os significados destes casos e os criterios que se usan
para escoller un caso, explícanse no Guía de usuario de Gretl (Capítulo
29).
As listas xlista e rxlista (opcionais) te permiten especificar conxuntos de
variables esóxenas que forman parte do modelo, ben sen restricións
(xlista) ou ben restrinxidas ao espazo de cointegración (rxlista). Estas
listas sepáranse de ylista e unhas das outras, mediante punto e coma.
A opción --seasonals, que podes combinar con calquera das outras opcións,
especifica a inclusión dun conxunto de variables ficticias estacionais
centradas. Esta opción unicamente está dispoñible para datos trimestrais
ou mensuais.
O primeiro exemplo de arriba especifica un VECM cun nivel de retardos de 4,
e un único vector de cointegración. As variables endóxenas son Y1, Y2 e
Y3. O segundo exemplo usa as mesmas variables pero especifica un nivel de
retardos de 3, e dous vectores de cointegración; tamén especifica unha
"Constante restrinxida", que é adecuada cando os vectores de cointegración
poden ter ordenada na orixe non nula pero as variables Y non teñen
tendencia.
A continuación da estimación dun VECM, tes dispoñibles algúns accesorios
especiais: $jalpha, $jbeta e $jvbeta recuperan as matrices α e beta, e a
varianza estimada de beta, respectivamente. Para recuperar a función de
resposta ante un impulso determinado, en forma de matriz, consulta a
función "irf".
Ruta do menú: /Modelar/Series temporais/Multivariante
# vif Tests
Debe de ir despois da estimación dun modelo que inclúa cando menos 2
variables independentes. Calcula e amosa os Factores de Inflación da
Varianza (FIV) para os regresores. O FIV do regresor j defínese como
1/(1 - Rj^2)
onde R_j é o coeficiente de correlación múltiple entre ese regresor j e
os demais regresores. O factor ten un valor mínimo de 1.0 cando a variable
en cuestión é ortogonal con respecto ás outras variables independentes.
Neter, Wasserman e Kutner (1990) suxiren revisar o valor máis grande dos
FIV para diagnosticar a multicolinearidade; así, un valor maior ca 10
considérase ás veces indicativo dun grao de multicolinearidade
problemático.
Ruta do menú: Fiestra de modelo: Análise/Multicolinearidade
# wls Estimation
Argumentos: varponder depvar indepvars
Opcións: --vcv (Presenta a matriz de covarianzas)
--robust (Desviacións padrón robustas)
--quiet (Non presenta os resultados)
Calcula as estimacións de mínimos cadrados ponderados (MCP ou WLS)
utilizando varponder como ponderación, depvar como variable dependente e
indepvars como lista de variables independentes. Sexa w a raíz cadrada
positiva de varponder, entón MCP é basicamente equivalente á regresión
MCO de w * depvar sobre w * indepvars. Porén, o R-cadrado calcúlase de
xeito especial, concretamente como
R^2 = 1 - ESS / WTSS
onde ESS é a suma de erros cadrados da regresión ponderada e WTSS denota a
"Suma de cadrados totais ponderados", que é igual á suma de erros cadrados
da regresión da variable dependente ponderada sobre unicamente a constante
ponderada.
Se varponder é unha variable ficticia, a estimación MCP é equivalente á
que resulta ao eliminar todas as observacións que teñen un valor cero para
varponder.
Ruta do menú: /Modelar/Outros Modelos Lineais/Mínimos Cadrados Ponderados
# xcorrgm Statistics
Argumentos: serie1 serie2 [ nivel ]
Opción: --plot=modo-ou-nomeficheiro (Mira abaixo)
Exemplo: xcorrgm x y 12
Presenta e debuxa o correlograma cruzado de serie1 con serie2, que podes
especificar mediante os seus nomes ou os seus números. Os valores son os
coeficientes de correlación na mostra entre o valor vixente de serie1 e os
sucesivos adiantos e retardos de serie2.
Se especificas un valor para nivel, a longura do correlograma cruzado
limítase a ese número de adiantos e retardos (cando menos); noutro caso, a
longura determínase de forma automática en función da frecuencia dos
datos e do número de observacións.
Por defecto, xérase unha gráfica do correlograma cruzado: unha gráfica
Gnuplot en modo interactivo ou unha gráfica ASCII en modo de procesamento
por lotes. Podes axustar isto mediante a opción --plot. Os parámetros
admisibles para esta opción son none (para omitir a gráfica), ascii (para
xerar unha gráfica de texto aínda que sexa en modo interactivo), display
(para xerar unha gráfica Gnuplot aínda que sexa en modo de procesamento
por lotes), ou un nome de ficheiro. O efecto de proporcionar un nome de
ficheiro é como se describiu para a opción --output da instrución
"gnuplot".
Ruta do menú: /Ver/Correlograma cruzado
Outro acceso: Xanela principal: Menú emerxente (selección múltiple)
# xtab Statistics
Argumentos: ylista [ ; xlista ]
Opcións: --row (Amosa as porcentaxes de fila)
--column (Amosa as porcentaxes de columna)
--zeros (Amosa un cero nas entradas nulas)
--matrix=nomematr (Usa as frecuencias da matriz indicada)
Amosa unha táboa de continxencia ou unha tabulación cruzada para cada
combinación das variables incluídas en ylista; e cando indicas unha
segunda lista (xlista), cada variable de ylista crúzase nunha táboa por
fila fronte a cada variable de xlista (por columna). Podes referirte ás
variables destas listas mediante os seus nomes ou os seus números. Ten en
conta que todas as variables teñen que estar marcadas como discretas. Como
alternativa, cando indicas a opción --matrix, se trata a matriz indicada
como un conxunto calculado previamente de frecuencias e se presenta isto
como unha tabulación cruzada.
Por defecto, a anotación de cada cela indica o reconto da frecuencia de
casos. As opcións --row e --column (que se exclúen mutuamente),
substitúen os recontos coas porcentaxes para cada fila ou columna,
respectivamente. Por defecto, as celas cun reconto de cero casos déixanse
en branco; mais a opción --zeros, que ten como efecto a presentación
explícita dos ceros, pode serche útil para importar a táboa con outro
programa tal como unha folla de cálculo.
A proba de independencia khi-cadrado de Pearson amósase se a frecuencia
agardada baixo independencia é cando menos de 1.0e-7 para todas as celas.
Unha regra xeral habitual da validez deste estatístico é que polo menos o
80 por cento das celas deben de ter frecuencias agardadas iguais a 5 ou
máis; e se este criterio non se cumpre, preséntase unha advertencia.
Se unha táboa de continxencia é 2 por 2, calcúlase a Proba Exacta de
independencia de Fisher. Cae na conta de que esta proba baséase no suposto
de que os totais por fila e por columna son fixos, o que pode ser ou non ser
adecuado dependendo de como se xeraron os datos. Debes de utilizar a
probabilidade asociada (valor p) da esquerda cando a alternativa á
independencia é a asociación negativa (os valores tenden a agruparse nas
celas de abaixo á esquerda e de arriba á dereita); e debes de utilizar o
valor p da dereita se a alternativa é a asociación positiva. O valor p de
dúas colas para esta proba calcúlase mediante o método (b) da sección
2.1 de Agresti (1992): isto é a suma das probabilidades de todas as táboas
posibles que teñan os totais de filas e columnas indicados, e que teñan
unha probabilidade menor ou igual á da táboa observada.
|