Friday, November 18, 2016

Autorregresivo De Media Móvil En R

ARIMA Pronosticar con Excel y R Hola hoy voy a caminar a través de una introducción al modelo ARIMA y sus componentes, así como una breve explicación del método de Box-Jenkins de cómo se especifican los modelos ARIMA. Por último, he creado una aplicación de Excel usando R, que Ill muestra cómo configurar y utilizar. Autorregresivos de media móvil (ARMA) Modelos El modelo autorregresivo de media móvil se utiliza para modelar y predecir, procesos estocásticos de series de tiempo estacionarias. Es la combinación de dos técnicas estadísticas desarrolladas anteriormente, el autorregresivo (AR) y Moving modelos Promedio (MA) y fue descrito originalmente por Peter Whittle en 1951. George E. P. Box y Jenkins Gwilym popularizó el modelo en 1971 mediante la especificación de pasos discretos para modelar la identificación, estimación y verificación. Este proceso se describe más adelante para la referencia. Comenzaremos con la introducción del modelo ARMA por sus diversos componentes, la AR, y los modelos MA y luego presentar una generalización popular del modelo ARMA, ARIMA (autorregresivo integrado de media móvil) y las medidas de previsión y las especificaciones del modelo. Por último, voy a explicar una aplicación de Excel que creé y cómo usarlo para hacer sus pronósticos de series de tiempo. Modelos autorregresivos El modelo autorregresivo se utiliza para describir los procesos aleatorios y procesos variables en el tiempo y especifica la variable de salida depende linealmente de sus valores anteriores. El modelo se describe como: ¿Dónde están los parámetros del modelo, C es constante, y es un término de ruido blanco. En esencia, lo que se describe es el modelo para cualquier valor dado. se puede explicar por las funciones de su valor anterior. Para un modelo con un parámetro,. se explica por su valor pasado y el error aleatorio. Para un modelo con más de un parámetro, por ejemplo. es dado por . y el error aleatorio. Media Móvil Modelo El modelo de media móvil (MA) se utiliza a menudo para el modelado de series temporales univariantes y se define como: es la media de la serie de tiempo. son los parámetros del modelo. son los términos de error de ruido blanco. es el fin del modelo de media móvil. El modelo de media móvil es una regresión lineal del valor actual de la serie en comparación con términos en el período anterior,. . Por ejemplo, un modelo de MA. se explica por el error de corriente en el mismo período y el valor de error pasado,. Para un modelo de orden 2 (), se explica por los dos últimos valores de error, y. Los términos AR () y MA () se utilizan en el modelo ARMA, que ahora se introdujo. Autorregresivo de media móvil autorregresiva Modelo Moving modelos de uso promedio de dos polinomios, AR () y MA () y describe un proceso estocástico estacionario. Un proceso estacionario no cambia cuando desplazada en el tiempo o el espacio, por lo tanto, un proceso estacionario tiene media constante y la varianza. El modelo ARMA se refiere a menudo en términos de sus polinomios, ARMA (). La notación del modelo está escrito: Al seleccionar, estimar y verificar el modelo es descrito por el proceso de Box-Jenkins. Box-Jenkins método para la identificación del modelo La continuación es más de un esquema del método de Box-Jenkins, ya que el proceso real de encontrar estos valores pueden ser bastante abrumador, sin un paquete estadístico. La hoja de Excel se incluye en esta página determina automáticamente el modelo que mejor se ajusta. La primera etapa del método de Box-Jenkins es la identificación del modelo. El paso incluye la identificación de la estacionalidad, la diferenciación y si es necesario determinar el orden de y por el trazado de las funciones de autocorrelación y autocorrelación parcial. Una vez identificado el modelo, el siguiente paso es la estimación de los parámetros. Estimación de parámetros utiliza paquetes estadísticos y algoritmos de cálculo para encontrar los mejores parámetros de ajuste. Una vez que se eligen los parámetros, el último paso es la comprobación del modelo. la comprobación de modelos se realiza mediante pruebas para ver si el modelo se ajusta a una serie de tiempo univariante estacionaria. También hay que confirmar los residuos son independientes entre sí y exhiben media constante y la varianza en el tiempo, que puede se realiza mediante la realización de una prueba de Ljung-Box o de nuevo el trazado de la autocorrelación y autocorrelación parcial de los residuos. Observe que el primer paso consiste en la comprobación de la estacionalidad. Si los datos que contiene está trabajando con las tendencias estacionales, se diferencia con el fin de hacer que el estacionaria datos. Esta etapa de diferenciación generaliza el modelo ARMA en un modelo ARIMA o autorregresivos integrados de media móvil, donde integrada corresponde a la etapa de diferenciación. Autorregresivos integrados de media móvil Modelos El modelo ARIMA tiene tres parámetros,. Con el fin de definir el modelo ARMA para incluir el término de diferenciación, empezamos por reordenar el modelo estándar ARMA para separar y de la suma. ¿Dónde está el operador de retardos y. . son parámetros autorregresivos y media en movimiento, y los términos de error, respectivamente. Ahora hacemos la suposición del primer polinomio de la función, tiene una raíz unitaria de la multiplicidad. entonces podemos volver a escribir a la siguiente: El modelo ARIMA expresa la factorización polinómica con y nos da: Por último, se generaliza el modelo aún más mediante la adición de un término deriva, que define el modelo ARIMA como ARIMA () con deriva. Con el modelo define ahora, podemos ver el modelo ARIMA como dos partes separadas, uno no estacionaria y la otra en sentido amplio estacionaria (distribución de probabilidad conjunta no cambia cuando desplazada en el tiempo o en el espacio). El modelo no estacionario: El modelo estacionario en sentido amplio: Los pronósticos se pueden hacer ahora en el uso de un método de predicción autorregresiva generalizada. Ahora que hemos hablado de los modelos ARMA y ARIMA, pasamos ahora a cómo podemos utilizar en aplicaciones prácticas para proporcionar la predicción. He construido una implementación con Excel usando R para hacer previsiones ARIMA, así como una opción para ejecutar la simulación de Monte Carlo en el modelo para determinar la probabilidad de que los pronósticos. Implementación y Excel Cómo utilizar Antes de usar la hoja, debe descargar R y Rexcel desde el sitio web Statconn. Si ya ha instalado R, sólo puede descargar Rexcel. Si usted no tiene instalado R, se puede descargar RAndFriends que contiene la última versión de R y Rexcel. Tenga en cuenta, Rexcel sólo funciona en Excel de 32 bits por su licencia no comercial. Si ha instalado 64bit Excel, tendrá que obtener una licencia comercial de Statconn. Se recomienda descargar RAndFriends como lo hace la instalación más rápida y fácil sin embargo, si ya tiene R y desea instalarlo de forma manual, siga los siguientes pasos. Instalación manual Para instalar Rexcel Rexcel y los otros paquetes para realizar trabajos de investigación en Excel, abre por primera vez R como administrador haciendo clic derecho sobre el archivo. exe. En la consola de R, instale Rexcel escribiendo las siguientes afirmaciones: Los comandos anteriores instalarán Rexcel en su máquina. El siguiente paso es instalar RCom, que es otro paquete de Statconn para el paquete Rexcel. Para instalar, escriba los siguientes comandos, que también se instalará automáticamente como rscproxy de R versión 2.8.0. Con estos paquetes instalados, puede pasar a la configuración de la conexión entre R y Excel. Aunque no es necesario para la instalación, un paquete práctico para descargar es Rcmdr, desarrollado por John Fox. Rcmdr crea menús R que pueden convertirse en los menús de Excel. Esta característica viene por defecto con la instalación RAndFriends y hace varios comandos R disponible en Excel. Escriba los siguientes comandos en R instalar Rcmdr. Podemos crear el enlace con la I y Excel. Nota en las versiones recientes de Rexcel esta conexión se realiza con un simple doble clic del. bat proporcionado ActivateRExcel2010 archivo, por lo que sólo tendrá que seguir estos pasos si R y Rexcel o si ha instalado manualmente por alguna razón la tampoco hizo durante la conexión la instalación RAndFriends. Crear la conexión entre R y Excel Abra un nuevo libro en Excel y vaya a la pantalla de opciones. Haga clic en Opciones y luego en Complementos. Debería ver una lista de todos los complementos activos e inactivos que tiene actualmente. Haga clic en el botón Ir en la parte inferior. En el cuadro de diálogo Complementos, podrás ver todas las referencias de complemento que ha realizado. Haga clic en Examinar. Vaya a la carpeta Rexcel, que normalmente se encuentra en C: Program FilesRExcelxls o algo similar. Encuentra la RExcel. xla complemento y haga clic en él. El siguiente paso es crear una referencia con el fin de macros que utilizan R para que funcione correctamente. En su documento de Excel, escriba Alt F11. Esto abrirá el editor Sobresale VBA. Ir a Herramientas - gt referencias y, a encontrar la referencia Rexcel, RExcelVBAlib. Rexcel ahora debería estar listo para usar utilizando la hoja de Excel Ahora que R y Rexcel están configurados correctamente, es hora de hacer un poco de previsión de abrir la hoja de previsión y haga clic en la carga del servidor. Esto es para iniciar el servidor RCom y también cargar las funciones necesarias para hacer la predicción. Un cuadro de diálogo se abrirá. Seleccione el archivo itall. R incluido con la hoja. Este archivo contiene las funciones que utiliza la herramienta de pronóstico. La mayor parte de las funciones contenidas fueron desarrollados por el profesor Stoffer en la Universidad de Pittsburgh. Se extienden las capacidades de R y nos dan algunos gráficos de diagnóstico votos junto con nuestra salida de la predicción. También hay una función para determinar automáticamente los mejores parámetros de ajuste del modelo ARIMA. Después de las cargas del servidor, introduzca sus datos en la columna Datos. Seleccione el rango de los datos, haga clic derecho y seleccione Nombre de rango. Nombrar el intervalo que los valores. A continuación, establezca la frecuencia de sus datos en la celda C6. La frecuencia se refiere a los períodos de tiempo de los datos. Si es semanal, la frecuencia sería 7. mensual sería de 12 mientras trimestral sería 4, y así sucesivamente. Introduzca los períodos antes de pronosticar. Tenga en cuenta que los modelos ARIMA llegar a ser bastante inexacta después de varias predicciones de frecuencia sucesivos. Una buena regla general es no superar los 30 pasos como algo pasado que podría ser bastante poco fiable. Esto depende del tamaño del conjunto de datos también. Si tiene datos limitados disponibles, se recomienda elegir un número de pasos más pequeños por delante. Después de introducir los datos, dándole el nombre y ajuste de la frecuencia deseada y los pasos por delante de pronosticar, haga clic en Ejecutar. Se puede tomar un tiempo para la previsión de procesar. Una vez completado su, obtendrá los valores pronosticados a cabo al número especificado, el error estándar de los resultados, y dos cartas. La izquierda es los valores previstos representados con los datos, mientras que la derecha contiene diagnósticos práctico que ofrece normalización de los residuos, la autocorrelación de los residuales, una parcela gg de los residuos y un gráfico de estadísticas de Ljung-Box para determinar si el modelo está bien equipado. No voy a entrar en demasiados detalles de cómo se mire para un modelo bien equipada, pero en el gráfico de ACF que no quiero ninguna (o mucho) de los picos de retardo de cruce sobre la línea azul punteada. En la parcela gg, los más círculos que pasan por la línea, más normalizada y mejor equipados es el modelo. Para los conjuntos de datos más grandes que esto podría cruzar un montón de círculos. Por último, el test de Ljung-Box es un artículo en sí mismo, sin embargo, las más círculos que están por encima de la línea azul punteada, mejor es el modelo. Si los diagnósticos resultan imposible parece buena, es posible que trate de añadir más datos o empezar en un punto diferente más cerca de la gama desea pronosticar. Puede borrar fácilmente los resultados generados por clic en los botones Borrar Valores pronosticados. Y eso es todo En la actualidad, la columna duerma fecha de hacer nada más que para su referencia, pero no es necesaria para la herramienta. Si encuentro tiempo, Ill volver atrás y añadir por lo que el gráfico en pantalla muestra la hora correcta. También puede recibir un error cuando se ejecuta el pronóstico. Esto es generalmente debido a la función que encuentra las mejores parámetros es incapaz de determinar el orden correcto. Puede seguir los pasos anteriores para tratar de organizar mejor sus datos para la función de trabajar. Espero que obtener el uso de las herramientas Su me salvó un montón de tiempo en el trabajo, ya que ahora todo lo que tengo que hacer es introducir los datos, la carga del servidor y ejecutarlo. También espero que esto te muestra cómo es impresionante R puede ser, especialmente cuando se utiliza con un front-end como Excel. Código, Excel hoja de cálculo y archivos. bas también están en GitHub aquí. A RIMA es sinónimo de autorregresivos integrados en movimiento modelos Promedio. Univariado (solo vector) ARIMA es una técnica de predicción que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su principal aplicación es en el área de predicción a corto plazo que requiere un mínimo de 40 puntos de datos históricos. Funciona mejor cuando sus datos exhibe un patrón estable o constante en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de que los autores originales), ARIMA es generalmente superior a técnicas de suavizado exponencial cuando los datos son razonablemente largo y la correlación entre las observaciones anteriores es estable. Si los datos son de corto o muy volátiles, y luego algún método de alisado puede funcionar mejor. Si usted no tiene al menos 38 puntos de datos, se debe considerar otro método que no ARIMA. El primer paso en la aplicación de la metodología ARIMA es para comprobar si hay estacionariedad. Estacionariedad implica que la serie se mantiene en un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, a continuación, sus datos no es estacionaria. Los datos también debe mostrar una varianza constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y crece a un ritmo más rápido. En tal caso, las subidas y bajadas en la estacionalidad se harán más dramática en el tiempo. Sin estas condiciones de estacionariedad se cumplen, muchos de los cálculos asociados con el proceso no se puede calcular. Si una representación gráfica de los datos indica no estacionariedad, entonces debería diferencia de la serie. La diferenciación es una excelente manera de transformar una serie no estacionaria a uno estacionario. Esto se realiza restando la observación en el periodo actual de la anterior. Si esta transformación se realiza sólo una vez para una serie, se dice que los datos han sido primera diferenciados. Este proceso elimina esencialmente la tendencia si la serie está creciendo a un ritmo bastante constante. Si está creciendo a un ritmo creciente, se puede aplicar el mismo procedimiento y la diferencia de los datos de nuevo. Sus datos serían entonces segundo diferenciada. Autocorrelaciones son valores numéricos que indican cómo una serie de datos está relacionado con sí mismo en el tiempo. Más precisamente, se mide la fuerza con los valores de datos en un número especificado de periodos aparte se correlacionan entre sí en el tiempo. El número de períodos separados generalmente se llama el retraso. Por ejemplo, una autocorrelación en medidas de retardo 1 cómo valora 1 periodo aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso de 2 medidas de cómo los datos de dos períodos separados están correlacionadas en toda la serie. Autocorrelaciones pueden variar 1--1. Un valor cercano a 1 indica una correlación positiva alta, mientras que un valor cercano a -1 indica una correlación negativa alta. Estas medidas son más a menudo evaluados a través de representaciones gráficas llamadas correlagrams. Un correlagram representa los valores de autocorrelación para una serie dada en diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. metodología ARIMA intenta describir los movimientos de una serie de tiempo estacionaria en función de lo que se denomina autorregresivo y moviendo parámetros medios. Estos se conocen como parámetros AR (autoregessive) y los parámetros MA (promedios móviles). Un modelo AR con sólo 1 de parámetros se puede escribir como. X (t) Un (1) X (t-1) E (t) en la que X (t) de series de tiempo bajo investigación Un (1) el parámetro autorregresivo de orden 1 X (t-1) las series de tiempo se retrasó 1 periodo E (t) el término de error del modelo Esto simplemente significa que cualquier valor dado de X (t) puede explicarse por alguna función de su valor anterior, X (t-1), además de algunos errores aleatorios inexplicable, E (t). Si el valor estimado de A (1) fue 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionado con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), además de algunos al azar de error e (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Mover Modelos Promedio: Un segundo tipo de modelo de Box-Jenkins se llama un modelo de media móvil. Aunque estos modelos son muy similares al modelo AR, el concepto detrás de ellos es muy diferente. Móviles parámetros medios relacionan lo que ocurre en el período t sólo a los errores aleatorios que ocurrieron en periodos pasados, es decir, E (t-1), E (t-2), etc en lugar de X (t-1), X ( t-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA se puede escribir de la siguiente manera. X (t) - B (1) E (t-1) E (t) El término B (1) se llama un MA de orden 1. El signo negativo delante del parámetro se utiliza para la única convención y por lo general se imprime a cabo automáticamente por la mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente con el error aleatorio en el periodo anterior, E (t-1), y con el término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil se pueden extender a estructuras de orden superior que cubren diferentes combinaciones y en movimiento longitudes medias. metodología ARIMA también permite que los modelos que se construirán que incorporan tanto autorregresivo y moviendo parámetros medios juntos. Estos modelos se conocen como modelos mixtos a menudo. Aunque esto lo convierte en una herramienta de pronóstico más complicado, de hecho, la estructura puede simular la serie mejor y producir un pronóstico más exacto. modelos puros implican que la estructura se compone sólo de los parámetros AR o MA - no ambas. Los modelos desarrollados por este enfoque generalmente se llaman los modelos ARIMA, ya que utilizan una combinación de autorregresivo (AR), la integración (I) - refiriéndose al proceso de diferenciación inversa para producir el pronóstico, y moviendo las operaciones promedio (MA). Un modelo ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (P), el número de operadores de diferenciación (d), y el más alto orden del plazo de media móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo de segundo orden autorregresivo de primer orden con un componente promedio cuya serie se ha diferenciado una vez para inducir estacionariedad en movimiento. Recogiendo la Especificación de la derecha: El principal problema en la clásica Box-Jenkins está tratando de decidir qué especificación ARIMA utilizar - i. e. cuántos parámetros AR y / o MA que incluyen. Esto es lo que gran parte de la caja-Jenkings 1976 se dedicó al proceso de identificación. Dependía de gráfica y numérica eva - luación de la autocorrelación de la muestra y las funciones de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en la complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, los datos representan solamente una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, error de medición, etc.) pueden distorsionar el proceso de identificación teórica. Es por ello que la modelización ARIMA tradicional es más un arte que una science.8.4 Moving modelos de promedio En lugar de utilizar los valores pasados ​​de la variable de pronóstico en una regresión, un modelo de media móvil utiliza los errores de predicción pasados ​​en un modelo de regresión similar. y c et theta theta correo electrónico puntos theta e, donde et es ruido blanco. Nos referimos a esto como un modelo MA (q). Por supuesto, no se observan los valores de y, por lo que no es realmente una regresión en el sentido habitual. Observe que cada valor de yt se puede considerar como un promedio móvil ponderado de los últimos errores de pronóstico. Sin embargo, se mueve modelos de promedio no debe confundirse con el movimiento suavizado promedio discutimos en el capítulo 6. Un modelo de media móvil se utiliza para la predicción de valores futuros mientras se mueve suavizado promedio se utiliza para estimar la tendencia-ciclo de los valores del pasado. Figura 8.6: Dos ejemplos de modelos de datos por el movimiento promedio con diferentes parámetros. Izquierda: MA (1) con y 20e t t t 0.8e-1. Derecha: MA (2) con y t e t - e t-1 0.8e t-2. En ambos casos, e t tiene una distribución normal de ruido blanco con media cero y varianza uno. La Figura 8.6 muestra algunos datos de un MA (1) y un modelo (2) Modelo MA. El cambio de los parámetros theta1, puntos, thetaq resultados en diferentes patrones de series de tiempo. Al igual que con los modelos autorregresivos, la varianza del término de error y sólo cambiará la escala de la serie, no los patrones. Es posible escribir cualquier modelo estacionario AR (p) como modelo MA (infty). Por ejemplo, mediante la sustitución repetida, podemos demostrar esto para un AR (1) Modelo: comenzar yt amp amp phi1y et phi1 (phi1y e) et amp phi12y phi1 E et amp phi13y phi12e phi1 E et amptext extremo provisto -1 lt lt phi1 1, el valor de phi1k a disminuir, al k se hace más grande. Por lo que finalmente obtenemos yt et phi1 correos electrónicos phi12 phi13 e cdots, un proceso MA (infty). El resultado inverso se mantiene si imponemos algunas restricciones sobre los parámetros MA. A continuación, el modelo se llama MA invertible. Es decir, que podemos escribir cualquier proceso invertible MA (q) como un proceso AR (infty). invertibles modelos no son simplemente nos permiten convertir de modelos MA a AR modelos. También tienen algunas propiedades matemáticas que hacen más fácil su uso en la práctica. Las limitaciones invertibilidad son similares a las limitaciones de estacionariedad. Para un MA (1) Modelo: -1lttheta1lt1. Para un MA (2) Modelo: -1lttheta2lt1, theta2theta1 gt-1, theta1 - theta2 lt 1. Las condiciones más complicadas son válidas para qge3. Una vez más, R se hará cargo de estas limitaciones cuando se estima el models.2.1 Moving Modelos Promedio (modelos MA) modelos de series temporales conocidos como modelos ARIMA puede incluir términos autorregresivos y / o términos de medias móviles. En la Semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor rezagado de x t. Por ejemplo, un retraso de 1 x término autorregresivo es t-1 (multiplicado por un coeficiente). Esta lección define términos de medias móviles. Un término promedio móvil en un modelo de series de tiempo es un error pasado (multiplicado por un coeficiente). Sea (en peso desbordado N (0, sigma2w)), lo que significa que el w t son de forma idéntica, distribuido de forma independiente, cada uno con una distribución normal con media 0 y la misma varianza. El 1º orden moviendo modelo de media, denotado por MA (1) es (xt theta1w mu peso) El orden 2º movimiento modelo de media, denotado por MA (2) es (mu xt peso theta1w theta2w) El q º orden moviendo modelo de media , denotado por MA (q) es (mu xt wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque no voltear los signos algebraicos de valores de los coeficientes estimados y los términos (unsquared) en las fórmulas para FCA y varianzas. Es necesario comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza señales positivas en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie de tiempo con un MA (1) Nota Modelo que el único valor distinto de cero en el ACF teórico es de retardo 1. Todos los demás autocorrelaciones son 0. Así, un ACF muestra con una autocorrelación significativa sólo en el retardo 1 es un indicador de un posible MA (1) modelo. Para los estudiantes interesados, pruebas de estas propiedades son un apéndice de este folleto. Ejemplo 1 Supongamos que un MA (1) modelo es x t 10 w w t 0,7 t-1. donde (en peso desbordado N (0,1)). Por lo tanto el coeficiente 1 0.7. El ACF teórico está dado por una trama de esta sigue ACF. La trama se acaba de mostrar es la ACF teórico para un MA (1) con 1 0.7. En la práctica, una muestra de costumbre suelen proporcionar un patrón tan claro. El uso de R, simulamos n 100 valores de las muestras utilizando el modelo x 10 w t t t 0,7 W-1 donde w t iid N (0,1). Para esta simulación, un gráfico de series temporales de datos de la muestra de la siguiente manera. No podemos decir mucho de esta trama. El ACF de la muestra para la simulación de datos sigue. Vemos un aumento en el retardo 1 seguido por valores generalmente no significativos para retardos pasado 1. Tenga en cuenta que la muestra ACF no coincide con el patrón teórico de la MA subyacente (1), que es que todas las autocorrelaciones para los retrasos del pasado 1 estarán 0 . una muestra tendría un ACF muestra ligeramente diferente se muestra a continuación, pero probablemente tendría las mismas características generales. Theroretical Propiedades de una serie temporal con un modelo MA (2) Para el (2) Modelo MA, propiedades teóricas son las siguientes: Tenga en cuenta que los únicos valores no nulos en la ACF teórica son los GAL 1 y 2. Autocorrelaciones para retardos más altos son 0 . por lo tanto, una muestra con ACF autocorrelaciones significativas en los retardos 1 y 2, pero autocorrelaciones no significativos para retardos más alto indica una posible MA (2) del modelo. iid N (0,1). Los coeficientes son 1 0,5 y 2 0.3. Debido a que este es un MA (2), el ACF teórica tendrá valores distintos de cero solamente en los retardos 1 y 2. Los valores de los dos autocorrelaciones son distintos de cero Una trama de la ACF teórico sigue. Como casi siempre es el caso, datos de la muestra suele comportarse tan perfectamente como teoría. Hemos simulado n 150 valores de la muestra para el modelo x 10 w t t t-0,5 W 0,3 W 1 T-2. donde w t iid N (0,1). El gráfico de series temporales de datos de la siguiente manera. Al igual que con el gráfico de series temporales de los (1) datos de las muestras MA, usted no puede decir mucho de ella. El ACF de la muestra para la simulación de datos sigue. El patrón es típico para situaciones en las que una (2) modelo de MA puede ser útil. Hay dos picos estadísticamente significativas en los retardos 1 y 2, seguido por los valores no significativos para otros retardos. Tenga en cuenta que debido a un error de muestreo, el ACF muestra no coincide con el patrón teórico exactamente. ACF para el general MA (q) Modelos Una característica de los modelos MA (q), en general, es que hay autocorrelaciones distintos de cero para los primeros retardos q autocorrelaciones y 0 para todos los GAL gt q. No unicidad de la conexión entre los valores de 1 y (Rho1) en MA (1) Modelo. En el MA (1) modelo, para cualquier valor de 1. el recíproco 1/1 da el mismo valor para A modo de ejemplo, utilizar 0,5 por 1. y luego usar 1 / (0,5) 2 por 1. Usted conseguirá (Rho1) 0,4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. que restringir MA (1) modelos de tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 habrá un valor de parámetro permisible, mientras que 1 1 / 0.5 2 no lo hará. Invertibilidad de modelos Un modelo MA MA se dice que es invertible si es algebraicamente equivalente a un modelo AR orden infinito convergentes. Al converger, nos referimos a que los coeficientes AR disminuyen a 0 a medida que avanzamos en el tiempo. Invertibilidad es una restricción de software programado en series de tiempo utilizado para estimar los coeficientes de los modelos con los términos MA. No es algo que comprobamos en el análisis de datos. Información adicional acerca de la restricción invertibilidad de MA (1) modelos se da en el apéndice. Teoría avanzada Nota. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - Q y q 0 tiene soluciones para y que están fuera del círculo unitario. R Código de los ejemplos en el Ejemplo 1, que representa el ACF teórica del modelo x 10 w t t. 7w t-1. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizan para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0,7), lag. max10) 10 rezagos de ACF para MA (1) con 0,7 theta1 lags0: 10 crea una variable llamada desfases que va de 0 a 10. parcela (retardos, acfma1, xlimc (1,10), ylabr, Type H, principal ACF para MA (1) con theta1 0,7) abline (H0) agrega un eje horizontal de la gráfica el primer comando determina la ACF y lo almacena en un objeto acfma1 llamado (nuestra elección del nombre). El comando plot (los comandos 3º) parcelas se retrasa en comparación con los valores de ACF para desfases del 1 al 10. Cuando las etiquetas El parámetro ylab el eje Y y el parámetro principal pone un título en la parcela. Para ver los valores numéricos de la ACF sólo tiene que utilizar el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. xcarima. sim (n150, lista (mac (0,7))) Simula n 150 valores de MA (1) xxc10 añade 10 para hacer medias por defecto 10. Simulación en el sentido de 0. plot (x, TypeB, mainSimulated MA (1) datos) ACF (x, xlimc (1,10), mainACF para datos de muestras simuladas) En el Ejemplo 2, se representa gráficamente la ACF teórica del modelo XT 10 en peso de 0,5 w t-1 0,3 w T-2. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 parcela (GAL, acfma2, xlimc (1,10), ylabr, Type H, principal ACF para MA (2) con theta1 0,5, theta20.3) abline (H0) xcarima. sim (n150, lista (mac (0,5, 0,3))) xxc10 plot (x, TypeB, principal simulada MA (2) Serie) ACF (x, xlimc (1,10), mainACF para MA simulada (2) datos) Apéndice: Prueba de propiedades de MA (1) para los estudiantes interesados, aquí están las pruebas de las propiedades teóricas de la (1) modelo MA. Diferencia: (texto (xt) w texto (mu theta1 en peso) 0 texto (en peso) de texto (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Cuando h 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 . la razón es que, por definición de independencia del peso. E (k w w j) 0 para cualquier k j. Además, como la w t tiene media 0, E (w w j j) E (w j 2) w 2. Por una serie de tiempo, aplicar este resultado para obtener el ACF dado anteriormente. Un modelo MA invertible es uno que puede ser escrito como un modelo AR orden infinito que converge de manera que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el (1) modelo de MA. Tenemos entonces sustituto de la relación (2) A la hora de w t-1 en la ecuación (1) (3) (ZT en peso theta1 (z - theta1w) en peso theta1z - theta2w) t-2. la ecuación (2) se convierte en A continuación, sustituir relación (4) para W t-2 en la ecuación (3) (ZT en peso theta1 z - theta21w peso theta1z - theta21 (z - theta1w) en peso theta1z - theta12z theta31w) Si tuviéramos que continuar ( infinitamente), obtendríamos el modelo AR orden infinito (ZT en peso theta1 z - theta21z theta31z - theta41z puntos) Obsérvese, sin embargo, que si 1 1, los coeficientes multiplicadores de los retardos z aumentará (infinitamente) de tamaño a medida que avanzamos en la espalda hora. Para evitar esto, necesitamos 1 LT1. Esta es la condición para un MA (1) modelo invertible. Modelo de la orden infinito MA En la semana 3, así que ver un AR (1) modelo puede ser convertido en un modelo de orden infinito MA: (xt - mu peso phi1w phi21w puntos phik1 w puntos resumen phij1w) Esta suma de términos de ruido blanco es conocido últimos como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos que se remontan en el tiempo. Esto se llama una orden infinito MA o MA (). Una orden MA finito es un AR orden infinito y cualquier orden de AR finito es un MA orden infinito. Recordemos en la semana 1, se observó que la exigencia de un AR estacionario (1) es que 1 LT1. Permite calcular el Var (x t) utilizando la representación causal. Este último paso se utiliza un hecho básico acerca serie geométrica que requiere (phi1lt1) diverge de lo contrario las series. NavigationPurpose: Comprobar parcelas aleatoriedad autocorrelación (. Box y Jenkins, pp 28-32) son una herramienta comúnmente utilizada para el control de la aleatoriedad en un conjunto de datos. Esta aleatoriedad se determina mediante el cálculo de las autocorrelaciones para los valores de datos en el tiempo que varía queda. Si al azar, tales autocorrelaciones deben estar cerca de cero para cualquier y todas las separaciones temporizados. Si no aleatoria, a continuación, una o más de las autocorrelaciones será significativamente diferente de cero. Además, las parcelas de autocorrelación se utilizan en la etapa de identificación del modelo de Box-Jenkins autorregresivo, moviendo los modelos de series de tiempo promedio. Autocorrelación es sólo una medida de aleatoriedad Tenga en cuenta que no correlacionado no significa necesariamente aleatoria. Los datos que tienen autocorrelación significativa no es aleatoria. Sin embargo, los datos que no muestran autocorrelación significativa todavía pueden exhibir no aleatoriedad de otras maneras. Autocorrelación es sólo una medida de la aleatoriedad. En el contexto de la validación del modelo (que es el principal tipo de aleatoriedad que dicuss en el Manual), la comprobación de autocorrelación es típicamente una prueba suficiente de aleatoriedad desde los residuos de un pobre ajuste de modelos tienden a mostrar aleatoriedad no sutil. Sin embargo, algunas aplicaciones requieren una determinación más rigurosa de aleatoriedad. En estos casos, una batería de pruebas, lo que podría incluir la comprobación de la autocorrelación, se aplican ya que los datos pueden ser no aleatoria de muchas maneras diferentes y, a menudo sutiles. Un ejemplo de dónde se necesita una verificación más rigurosa para la aleatoriedad estaría en la prueba de los generadores de números aleatorios. Muestra Terreno: Autocorrelaciones debe estar cerca de cero para la aleatoriedad. Tal no es el caso en este ejemplo y por lo tanto la hipótesis de aleatoriedad no pasa esta parcela de muestreo de autocorrelación muestra que las series de tiempo no es aleatoria, sino que tiene un alto grado de autocorrelación entre las observaciones adyacentes y casi adyacentes. Definición: r (h) frente a h parcelas de autocorrelación están formados por Eje vertical: coeficiente de autocorrelación, donde C h es la función de autocovarianza y C 0 es la función de varianza Nota que R h está entre -1 y 1. Nótese que algunas fuentes pueden utilizar el siguiente fórmula para la función de autocovarianza Aunque esta definición tiene menos sesgo, el (1 / N) formulación tiene algunas propiedades estadísticas deseables y es la forma más comúnmente utilizada en la literatura estadísticas. Consulte las páginas 20 y 49-50 en Chatfield para más detalles. eje horizontal: Tiempo de retardo h (h 1, 2, 3.) La línea anterior también contiene varias líneas de referencia horizontales. La línea media está en cero. Las otras cuatro líneas son 95 y 99 bandas de confianza. Tenga en cuenta que hay dos fórmulas distintas para generar las bandas de confianza. Si la trama de autocorrelación está siendo utilizado para la prueba de aleatoriedad (es decir, no hay dependencia del tiempo en los datos), se recomienda la siguiente fórmula: donde N es el tamaño de la muestra, z es la función de distribución acumulada de la distribución normal estándar y (alfa ) es el nivel de significación. En este caso, las bandas de confianza se fija anchura que depende del tamaño de la muestra. Esta es la fórmula que se utilizó para generar las bandas de confianza en la trama anterior. parcelas de autocorrelación también se utilizan en la etapa de identificación del modelo para el montaje de modelos ARIMA. En este caso, un modelo de promedio móvil se asume para los datos y las siguientes bandas de confianza debe ser generada: donde k es el retraso, N es el tamaño de la muestra, z es la función de distribución acumulada de la distribución normal estándar y (alfa) se el nivel de significación. En este caso, las bandas de confianza aumentan al incrementar la demora. La trama de autocorrelación puede proporcionar respuestas a las siguientes preguntas: ¿Son los datos aleatorios es una observación relacionada con una observación adyacente es una observación relacionada con una observación dos veces eliminado (etc.) ¿El ruido blanco serie de tiempo observada es la serie de tiempo observada sinusoidal es el autorregresivo serie temporal observada Qué es un modelo apropiado para la serie de tiempo observada es el modelo válido y suficiente en el ss fórmula / Importancia sqrt válido: asegurar la validez de las conclusiones de ingeniería aleatoriedad (junto con el modelo fijo, la variación fijo y fijo de distribución) es uno de los cuatro supuestos que normalmente subyacen en todos los procesos de medición. El supuesto de aleatoriedad es críticamente importante por las siguientes tres razones: La mayoría de las pruebas estadísticas estándar dependen de la aleatoriedad. La validez de las conclusiones de la prueba está directamente vinculada a la validez de la hipótesis de aleatoriedad. Muchas fórmulas estadísticas de uso común dependen de la suposición de la aleatoriedad, la fórmula más común es la fórmula para la determinación de la desviación estándar de la media de la muestra: donde s es la desviación estándar de los datos. Aunque se utilizan en gran medida, los resultados del uso de esta fórmula son de ningún valor a menos que el supuesto de aleatoriedad sostiene. Para los datos univariados, el modelo por defecto es Si los datos no son al azar, este modelo es incorrecto y no válido, y las estimaciones de los parámetros (como la constante) se convierta sin sentido y no válidos. En resumen, si el analista no comprueba la aleatoriedad, la validez de muchas de las conclusiones estadísticas se convierte en sospechoso. La trama de autocorrelación es una excelente manera de comprobar para tal aleatoriedad.


No comments:

Post a Comment