Modelo autorregresivo de media móbil

De testwiki
Saltar á navegación Saltar á procura

En estatística, os modelos autorregresivos de media móbil (AutoRegressive Moving Average models, ARMA en inglés), ás veces chamados modelos Box-Jenkins por George Box e F. M. Jenkins, son tipicamente aplicados a series temporais de datos.

Dada unha serie temporal de datos Xt, entón, o modelo ARMA é unha ferramenta para entender e, ó mellor, predicir futuros valores da serie. O modelo está formado por dúas partes, unha parte autorregresiva (AR) e outra de media móbil (MA). O modelo é normalmente referenciado como un modelo ARMA(p,q), onde p é a orde da parte autoregresiva, e q é a orde da parte de media móbil.

Modelo autorregresivo

A notación AR(p) refírese a un modelo autorregresivo de orde p. Un modelo AR(p) pode escribirse como

Xt=c+i=1pϕiXti+ϵt.

onde ϕ1,ϕp son os parámetros do modelo, c é unha constante e ϵt é un termo de erro. O termo constante é omitido por moitos autores por motivos de simplificación.

Un modelo autorregresivo é esencialmente un filtro IIR (infinite impulse response filter), cunha certa interpretación adicional.

Débese ter en conta que é necesario impor certas restricións aos valores dos parámetros deste modelo para que funcione correctamente estacionario. Por exemplo, nun modelo AR(1), se |φ1| > 1 o modelo non terá un bo comportamento.

Exemplo: Un proceso AR(1)

An AR(1)-Process is given by

Xt=c+ϕXt1+ϵt,

onde ϵt é un proceso de ruído branco con media cero e varianza σ2. (Nota: O subíndice en ϕ1 foi omitido.) O proceso é de covariaza estacionaria se |ϕ|<1. Se ϕ=1 entón Xt ten unha raíz unitaria. O cálculo da esperanza de Xt é directo. Asumindo a covarianza estacionaria temos

E(Xt)=E(c)+ϕE(Xt1)+E(ϵt)μ=c+ϕμ+0.

entón:

μ=c1ϕ,

onde μ é a media. A varianza é:

var(Xt)=E(Xt2)μ2=σ21ϕ2

A función de autocorrelación vén dada por:

Bn=E(Xt+nXt)μ2=σ21ϕ2ϕ|n|

Pódese ver que a función de autocorrelación decrece cun intervalo de decrecemento de τ=1/ln(ϕ). A función de densidade espectral é a transformada de Fourier da función de autocorrelación. En termos discretos esta sería a transformada de Fourier de tempo discreto:

Φ(ω)=12πn=Bneiωn=12π(σ21+ϕ22ϕcos(ω))

Esta expresión contén aliasing debido á natureza discreta de Xj. Se asumimos que o intervalo de mostraxe é moito menor que o intervalo de decrecemento (τ1), entón podemos utilizar unha aproximación continua a Bn:

B(t)σ21ϕ2ϕ|t|

que dá un perfil Lorentzian para a densidade espectral:

Φ(ω)==12πσ21ϕ2γπ(γ2+ω2)

onde γ=1/τ é a frecuencia angular asociada co intervalo de decrecemento τ.

Unha expresión alternativa para Xt pódese obter substituíndo primeiro c+ϕXt2+ϵt1 por Xt1 na ecuación de definición. Continuando este proceso N veces obtemos:

Xt=ck=0N1ϕk+ϕNXtN+k=0N1ϕkϵtk

Cando N tende a infinito, ϕN tende a cero e:

Xt=c1ϕ+k=0ϕkϵtk

Vese que Xt é ruído branco convolucionado con ϕk máis a constante da media. Polo teorema do límite central, Xt será distribuído normalmente como calquera mostra de Xt que é máis grande que o intervalo de decrecemento da función de autocorrelación.

Modelo de medias móbiles

A notación MA(q) refírese a un modelo de media móbil de orde q.

Xt=εt+i=1qθiεti

onde θ1, ..., θq son os parámetros do modelo e εt, εt-1,... son, de novo, os termos de erro. Un modelo de medias móbiles é esencialmente un filtro FIR (finite impulse response filter), con certa interpretación adicional.

Modelo autorregresivo de media móbil

A notación ARMA(p, q) refírese a un modelo con p termos autorregresivos e q termos de media móbil. Este modelo combina os modelos AR e MA,

Xt=εt+i=1pϕiXti+i=1qθiεti.

Nota sobre os termos de erro

Os termos de erro εt asúmese normalmente que son variables iid (variables aleatorias independentes identicamente-distribuídas) mostreadas dunha distribución normal con media cero: εt ~ N(0,σ2) onde σ2 é a varianza. Estas suposicións poden ser fráxiles e se non se cumpren poden cambiar as propiedades do modelo. De feito, un cambio na suposición da independencia e distribución idéntica podería dar lugar a unha substancial diferenza.

Especificación en termos do operador retardo (lag operator)

Nalgúns textos os modelos son especificados en termos do operador retardo L. Nestes termos, o modelo AR(p) vén dado por

εt=(1i=1pϕiLi)Xt=ϕXt

onde φ representa o polinomio

ϕ=1i=1pϕiLi.

Un modelo MA(q) vén dado por

Xt=(1+i=1qθiLi)εt=θεt

onde θ representa o polinomio

θ=1+i=1qθiLi.

Por último, o modelo combinatorio ARMA vén dado por

(1i=1pϕiLi)Xt=(1+i=1qθiLi)εt

ou de xeito máis conciso,

ϕXt=θεt.

Modelos de axuste (Fitting models)

Os modelos ARMA en xeral poden, tras escoller p e q, ser axustados mediante regresión de mínimos cadrados parar encontrar os valores dos parámetros que minimizan o termo de erro. Considérase xeralmente unha boa práctica encontrar os valores menores de p e q que proporcionan un ajuste aceptable aos datos. Para un modelo puro AR débense utilizar as ecuacións Yule-Walker para proporcionar un axuste.

Xeneralizacións

A dependencia de Xt en valores pasados e nos termos de erro εt asúmese que é lineal salvo que se especifique o contrario. Se a dependencia non é lineal, o modelo é especificamente chamado modelo de media móbil non lineal (NMA), autorregresivo non lineal (NAR), ou autorregresivo de media móbil non lineal (NARMA).

Os modelos autorregresivos de media móbil poden xeneralizarse doutros xeitos. Véxase tamén os modelos ARCH (modelos de heterocedasticidade condicional autorregresivos) e os modelos ARIMA (modelos autorregresivos integrados de medias móbiles). Se temos que axustar múltiples series temporais, entón pódese axustar un modelo vectorial ARIMA (VARIMA). Se as series temporais en cuestión mostran unha longa memoria, entón é apropiado un modelo ARIMA fraccional (FARIMA, ou ás veces chamado ARFIMA). De pensar que os datos teñen certa estacionalidade, entón débese usar un modelo SARIMA.

Notas

  • George E.P. Box e F.M. Jenkins. Time Series Analysis: Forecasting and Control, second edition. Oakland, CA: Holden-Day, 1976.

Modelo:Control de autoridades