Modelo Modelo Médio Tempo Série
Existem várias abordagens para modelar séries temporais. Descrevemos algumas das abordagens mais comuns abaixo. Trend, Seasonal, Decomposições Residuais Uma abordagem é decompor as séries temporais em uma componente de tendência, sazonal e residual. O abrandamento exponencial triplo é um exemplo desta abordagem. Outro exemplo, chamado loess sazonal, é baseado em mínimos quadrados localmente ponderados e é discutido por Cleveland (1993). Não discutimos o loess sazonal neste manual. Métodos baseados em frequência Outra abordagem, comumente usada em aplicações científicas e de engenharia, é analisar a série no domínio da freqüência. Um exemplo dessa abordagem na modelagem de um conjunto de dados de tipo sinusoidal é mostrado no estudo de caso de deflexão do feixe. O gráfico espectral é a ferramenta principal para a análise de freqüência de séries temporais. Modelos Autoregressivos (AR) Uma abordagem comum para modelar séries temporais univariadas é o modelo autorregressivo (AR): Xt delta phi1 X phi2 X cdots phip X At, onde (Xt) é a série temporal, (At) é ruído branco e delta Esquerda (1 - sum p phii right) mu. Com (mu) denotando o processo significa. Um modelo autoregressivo é simplesmente uma regressão linear do valor atual da série contra um ou mais valores anteriores da série. O valor de (p) é chamado de ordem do modelo AR. Os modelos AR podem ser analisados com um dos vários métodos, incluindo técnicas de mínimos quadrados padrão padrão. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para modelar modelos de séries temporais univariáveis é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal, (mu ) É a média da série, (A) são termos de ruído branco e (theta1, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado de ordem do modelo MA. Ou seja, um modelo de média móvel é conceitualmente uma regressão linear do valor atual da série contra o ruído branco ou choques aleatórios de um ou mais valores prévios da série. Os choques aleatórios em cada ponto são assumidos como provenientes da mesma distribuição, geralmente uma distribuição normal, com localização em zero e escala constante. A distinção neste modelo é que esses choques aleatórios são propagados a valores futuros das séries temporais. Ajustar as estimativas MA é mais complicado do que com os modelos AR porque os termos de erro não são observáveis. Isso significa que os procedimentos iterativos de encadernação não linear precisam ser usados em lugar de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF e o PACF sugerem que um modelo de MA seria uma escolha de modelo melhor e, por vezes, ambos os termos de AR e MA devem ser usados no mesmo modelo (ver Seção 6.4.4.5). Note, no entanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir os pressupostos padrão para um processo univariado. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autorregressivas no livro Time Series Analysis: Forecasting and Control (Box, Jenkins e Reinsel, 1994). Embora as abordagens médias autorregressivas e móveis já tenham sido conhecidas (e foram originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que poderiam incorporar ambas as abordagens. Isso faz com que os modelos Box-Jenkins sejam uma classe de modelos poderosa. As próximas várias seções discutirão esses modelos em detalhes. Tutorial completo sobre Modelagem de séries temporais em R Introdução 8216Time8217 é o fator mais importante que garante o sucesso em uma empresa. É difícil manter o ritmo do tempo. Mas, a tecnologia desenvolveu alguns métodos poderosos usando o qual podemos encontrar as coisas 8217 antes do tempo. Não se preocupe, não estou falando sobre Time Machine. Let8217s sejam realistas aqui I8217m falando sobre os métodos de previsão amplificação previsão. Um desses métodos, que trata de dados baseados em tempo, é Time Series Modeling. Como o nome sugere, envolve trabalhar com dados baseados em tempo (anos, dias, horas, minutos), para obter informações ocultas para tomar decisões fundamentadas. Modelos de séries temporais são modelos muito úteis quando você possui dados correlacionados em série. A maioria das casas comerciais trabalha em dados da série temporal para analisar o número de vendas para o próximo ano, o tráfego do site, a posição da competição e muito mais. No entanto, também é uma das áreas, que muitos analistas não entendem. Então, se você não tem certeza sobre o processo completo de modelagem de séries temporais, este guia apresentaria vários níveis de modelagem de séries temporais e suas técnicas relacionadas. Os seguintes tópicos são abordados neste tutorial, conforme mostrado abaixo: Índice básico 8211 Modelagem de séries temporais Exploração de dados de séries temporais em R Introdução ao quadro de modelagem da série temporária ARMA e aplicação da série de séries temporais ARIMA Tempo para começar 1. Fundamentos 8211 Tempo Modelagem de série Let8217s começam a partir do básico. Isso inclui séries estacionárias, passeios aleatórios. Rho Coefficient, Dickey Fuller Test of Stationarity. Se esses termos já estiverem assustando você, não se preocuparão com o 8211, eles ficarão claros um pouco e eu aposto que você vai começar a apreciar o assunto como eu explicá-lo. Série estacionária Existem três critérios básicos para que uma série seja classificada como série estacionária: 1. A média da série não deve ser uma função do tempo e deve ser uma constante. A imagem abaixo possui o gráfico da mão esquerda que satisfaz a condição enquanto o gráfico em vermelho tem uma média dependente do tempo. 2. A variância da série não deve ser uma função do tempo. Esta propriedade é conhecida como homoscedasticidade. O gráfico seguinte descreve o que é e o que não é uma série estacionária. (Observe a distribuição variável da distribuição no gráfico da mão direita) 3. A covariância do i i termo e o termo (i m) th não deve ser uma função do tempo. No gráfico a seguir, você notará que o spread se torna mais próximo à medida que o tempo aumenta. Portanto, a covariância não é constante com o tempo para a série 8216red8217. Por que eu me importo com 8216stationarity8217 de uma série de tempo. O motivo pela qual eu tomei essa seção primeiro foi que, até que suas séries temporais estejam estacionadas, você não pode construir um modelo de séries temporais. Nos casos em que o critério estacionário é violado, o primeiro requisito torna-se para estacionar as séries temporais e, em seguida, tentar modelos estocásticos para prever esta série de tempo. Existem várias maneiras de trazer esta estacionança. Alguns são Detrending, Differencing etc. Random Walk Este é o conceito mais básico da série temporal. Você pode conhecer bem o conceito. Mas, eu encontrei muitas pessoas na indústria que interpretam a caminhada aleatória como um processo estacionário. Nesta seção, com a ajuda de algumas matemáticas, tornarei este conceito claro para sempre. Let8217s dar um exemplo. Exemplo: Imagine uma menina se movendo aleatoriamente em um tabuleiro de xadrez gigante. Neste caso, a próxima posição da menina depende apenas da última posição. Agora imagine, você está sentado em outra sala e não consegue ver a garota. Você quer prever a posição da menina com o tempo. Quão preciso você será, claro, você ficará cada vez mais impreciso à medida que a posição da menina muda. Para saber exatamente onde está a menina. Da próxima vez, ela só pode mover para 8 quadrados e, portanto, sua probabilidade dips para 1 8 em vez de 1 e continua a cair. Agora, vamos tentar formular esta série: onde Er (t) é o erro no ponto de tempo t. Esta é a aleatoriedade que a menina traz em todos os momentos. Agora, se nos encaixarmos de forma recursiva em todos os Xs, finalmente acabaremos com a seguinte equação: agora, vamos tentar validar nossos pressupostos de séries estacionárias sobre esta fórmula de caminhada aleatória: 1. É a constante média Nós sabemos que a expectativa de qualquer erro Será zero, pois é aleatório. Por isso, obtemos EX (t) EX (0) Constante. 2. A constante de variação Por isso, inferimos que a caminhada aleatória não é um processo estacionário, pois possui variância variável no tempo. Além disso, se verificarmos a covariância, vemos que também depende do tempo. Let8217s apimentam as coisas um pouco, já sabemos que uma caminhada aleatória é um processo não estacionário. Vamos apresentar um novo coeficiente na equação para ver se podemos fazer a formulação estacionária. Coeficiente introduzido. Rho Agora, vamos variar o valor de Rho para ver se podemos fazer a série estacionária. Aqui vamos interpretar a dispersão visualmente e não fazer qualquer teste para verificar a estacionaria. Let8217s começam com uma série perfeitamente estacionária com Rho 0. Aqui está o enredo para as séries temporais: Aumentar o valor de Rho para 0,5 nos dá o seguinte gráfico: Você pode notar que nossos ciclos se tornaram mais amplos, mas essencialmente não parece ser um Grave violação de pressupostos estacionários. Let8217s agora tomam um caso mais extremo de Rho 0.9 Ainda vemos que o X retorna de valores extremos para zero após alguns intervalos. Esta série também não está violando significativamente a não-estacionaridade. Agora, let8217s dê uma olhada na caminhada aleatória com rho 1. Isto obviamente é uma violação de condições estacionárias. O que torna o Rho 1 um caso especial que aparece mal no teste estacionário. Vamos encontrar o motivo matemático para isso. Let8217s esperam em cada lado da equação 8220X (t) Rho X (t-1) Er (t) 8221 Esta equação é muito perspicaz. O próximo X (ou no ponto de tempo t) está sendo puxado para baixo para Rho Último valor de X. Por exemplo, se X (t 8211 1) 1, EX (t) 0,5 (para Rho 0,5). Agora, se X se move para qualquer direção de zero, é puxado de volta para zero no próximo passo. O único componente que pode levá-lo ainda mais é o termo de erro. O termo de erro é igualmente provável em qualquer direção. O que acontece quando o Rho se torna 1 Nenhuma força pode puxar o X para baixo no próximo passo. Dickey Fuller Test of Stationarity O que você acabou de aprender na última seção é formalmente conhecido como teste Dickey Fuller. Aqui está um pequeno tweak que é feito para nossa equação para convertê-lo em um teste Dickey Fuller: devemos testar se Rho 8211 1 é significativamente diferente de zero ou não. Se a hipótese nula for rejeitada, obtemos uma série de tempo estacionária. Testes estacionários e conversão de uma série em uma série estacionária são os processos mais críticos em uma modelagem de séries temporais. Você precisa memorizar cada detalhe desse conceito para avançar para o próximo passo da modelagem de séries temporais. Let8217s agora consideram um exemplo para mostrar como é uma série de tempos. 2. Exploração de dados de séries temporais em R Aqui, we8217ll aprende a lidar com dados de séries temporais em R. Nosso escopo será restrito à exploração de dados em um conjunto de dados de séries temporais e não será usado para construir modelos de séries temporais. Usei um conjunto de dados incorporado de R chamado AirPassengers. O conjunto de dados consiste em totais mensais de passageiros internacionais de passageiros, 1949 a 1960. Carregando o conjunto de dados A seguir, o código que irá ajudá-lo a carregar o conjunto de dados e espalhar algumas métricas de nível superior. Inferências importantes A tendência anual revela claramente que os passageiros têm aumentado sem falhas. A variação e o valor médio em julho e agosto são muito superiores ao resto dos meses. Embora o valor médio de cada mês seja bastante diferente, sua variação é pequena. Por isso, temos um forte efeito sazonal com um ciclo de 12 meses ou menos. Explorar dados torna-se mais importante em um modelo de série temporal 8211 sem essa exploração, você não saberá se uma série está parada ou não. Como neste caso, já conhecemos muitos detalhes sobre o tipo de modelo que procuramos. Let8217s agora ocupam alguns modelos de séries temporais e suas características. Também levamos esse problema à frente e fazemos algumas previsões. 3. Introdução à modelagem de séries temporais ARMA Os modelos ARMA são comumente usados na modelagem de séries temporais. No modelo ARMA, AR significa auto-regressão e MA significa média móvel. Se essas palavras soarem intimidadas para você, não se preocupe. Não consigo simplificar esses conceitos nos próximos minutos para você. Agora vamos desenvolver uma habilidade para esses termos e entender as características associadas a esses modelos. Mas antes de começar, você deve lembrar, AR ou MA não são aplicáveis em séries não estacionárias. Caso você obtenha uma série não estacionária, primeiro você precisa estacionar a série (tomando a transformação da diferença) e depois escolha os modelos da série de tempo disponíveis. Primeiro, eu explico cada um desses dois modelos (AR amp MA) individualmente. Em seguida, analisaremos as características desses modelos. Modelo de série de tempo Auto-Regressivo Let8217s compreendendo os modelos de AR usando o caso abaixo: O PIB atual de um país diz que x (t) é dependente do último ano do PIB de 1982, ou seja, x (t 8211 1). A hipótese de que o custo total de produção de produtos de serviços de amplificação em um país em um ano fiscal (conhecido como PIB) é dependente da instalação de serviços de plantas de fabricação no ano anterior e as novas instalações de plantações de plantas nos atuais ano. Mas o componente primário do PIB é o primeiro. Assim, podemos escrever formalmente a equação do PIB como: Esta equação é conhecida como formulação AR (1). O número um (1) indica que a próxima instância depende unicamente da instância anterior. O alfa é um coeficiente que buscamos para minimizar a função de erro. Observe que x (t - 1) está realmente ligado a x (t-2) da mesma forma. Portanto, qualquer choque para x (t) desaparecerá gradualmente no futuro. Por exemplo, let8217s dizem que x (t) é o número de garrafas de suco vendidas em uma cidade em um dia específico. Durante os invernos, muito poucos vendedores compraram garrafas de suco. De repente, em um determinado dia, a temperatura subiu e a demanda de garrafas de suco subiu para 1000. No entanto, depois de alguns dias, o clima tornou-se frio novamente. Mas, sabendo que as pessoas se acostumaram a beber suco durante os dias quentes, havia 50 pessoas ainda bebendo suco durante os dias frios. Nos dias seguintes, a proporção desceu para 25 (50 de 50) e depois gradualmente para um número pequeno após um número significativo de dias. O gráfico a seguir explica a propriedade de inércia da série AR: modelo de série de tempo médio em movimento Let8217s leva outro caso para entender o modelo de série de tempo médio em movimento. Um fabricante produz um certo tipo de bolsa, que estava prontamente disponível no mercado. Sendo um mercado competitivo, a venda da bolsa ficou em zero por muitos dias. Então, um dia ele experimentou o design e produziu um tipo diferente de bolsa. Este tipo de bolsa não estava disponível em qualquer parte do mercado. Assim, ele conseguiu vender todo o estoque de 1000 sacas (vamos chamar isso de x (t)). A demanda ficou tão alta que a bolsa ficou sem estoque. Como resultado, cerca de 100 clientes estranhos não podiam comprar este saco. Permite chamar essa lacuna como o erro nesse ponto de tempo. Com o tempo, a bolsa perdeu seu fator woo. Mas ainda faltavam poucos clientes que foram entregues vazios no dia anterior. A seguir, é uma formulação simples para descrever o cenário: se tentarmos traçar esse gráfico, isso parecerá algo assim: Você notou a diferença entre o modelo MA e AR. No modelo MA, o choque de ruído rapidamente desaparece com o tempo. O modelo AR tem um efeito muito duradouro do choque. Diferença entre os modelos AR e MA A principal diferença entre um modelo AR e MA baseia-se na correlação entre objetos de séries temporais em diferentes pontos de tempo. A correlação entre x (t) e x (t-n) para a ordem n gt de MA é sempre zero. Isso decorre diretamente do fato de que a covariância entre x (t) e x (t-n) é zero para os modelos de MA (algo que nos referimos no exemplo mostrado na seção anterior). No entanto, a correlação de x (t) e x (t-n) diminui gradualmente com n tornando-se maior no modelo AR. Essa diferença é explorada independentemente de ter o modelo AR ou o modelo MA. O gráfico de correlação pode nos dar a ordem do modelo MA. Explorando parcelas ACF e PACF Uma vez que temos as séries temporais estacionárias, devemos responder a duas questões principais: Q1. É um processo AR ou MA Q2. Qual a ordem do processo AR ou MA precisamos usar O truque para resolver essas questões está disponível na seção anterior. Didn8217t que você observa. A primeira pergunta pode ser respondida usando o Gráfico de Correlação Total (também conhecido como AutoClude 8211, função de correlação ACF). ACF é um gráfico da correlação total entre diferentes funções de atraso. Por exemplo, no problema do PIB, o PIB no ponto de tempo t é x (t). Estamos interessados na correlação de x (t) com x (t-1). X (t-2) e assim por diante. Agora, deixe-nos refletir sobre o que aprendemos acima. Em uma série média móvel de lag n, não teremos nenhuma correlação entre x (t) e x (t 8211 n -1). Por isso, o gráfico de correlação total corta no décimo primeiro atraso. Então, torna-se simples encontrar o atraso para uma série MA. Para uma série AR, esta correlação irá gradualmente diminuir sem qualquer valor de corte. Então, o que fazemos se for uma série AR. Aqui está o segundo truque. Se descobrimos a correlação parcial de cada atraso, ele irá cortar após o grau de série AR. Por exemplo, se tivermos uma série AR (1), se excluímos o efeito de 1 lag (x (t-1)), nosso 2º atraso (x (t-2)) é independente de x (t). Assim, a função de correlação parcial (PACF) irá diminuir acentuadamente após o primeiro intervalo. A seguir estão os exemplos que esclarecerão quaisquer dúvidas que você tenha sobre esse conceito: a linha azul acima mostra valores significativamente diferentes de zero. Claramente, o gráfico acima tem um corte na curva PACF após o 2º intervalo, o que significa que este é principalmente um processo AR (2). Claramente, o gráfico acima tem um corte na curva ACF após o 2º intervalo, o que significa que este é principalmente um processo MA (2). Até agora, abordamos como identificar o tipo de série estacionária usando parcelas ACF amp PACF. Agora, eu apresentarei uma estrutura abrangente para construir um modelo de séries temporais. Além disso, também discutimos sobre as aplicações práticas da modelagem de séries temporais. 4. Estrutura e aplicação da modelagem da Série Temporal ARIMA Uma revisão rápida, Até aqui, we8217ve aprendi os conceitos básicos da modelagem de séries temporais, séries temporais na modelagem R e ARMA. Agora é a hora de se juntar a essas peças e fazer uma história interessante. Visão geral do Framework Esta estrutura (mostrada abaixo) especifica a abordagem passo a passo em 8216 Como fazer uma Análise da Série de Tempo 8216: Como você saberia, as três primeiras etapas já foram discutidas acima. No entanto, o mesmo foi delineado brevemente abaixo: Etapa 1: Visualize as séries temporais É essencial analisar as tendências antes de construir qualquer tipo de modelo de séries temporais. Os detalhes que nos interessam pertencem a qualquer tipo de tendência, sazonalidade ou comportamento aleatório na série. Cobrimos essa parte na segunda parte desta série. Passo 2: Estacionar a série Uma vez que conhecemos os padrões, tendências, ciclos e sazonalidade. Podemos verificar se a série está parada ou não. Dickey 8211 Fuller é um dos testes mais populares para verificar o mesmo. Nós cobrimos esse teste na primeira parte desta série de artigos. Isso não termina. O que acontece se a série não for estacionada. Existem três técnicas comumente usadas para fazer uma série de tempo estacionária: 1. Detrending. Aqui, simplesmente removemos o componente de tendência da série temporal. Por exemplo, a equação da minha série temporal é: We8217ll simplesmente remova a parte entre parênteses e construa o modelo para o resto. 2. Diferenciação. Esta é a técnica comumente utilizada para remover a não-estacionaridade. Aqui, tentamos modelar as diferenças dos termos e não o termo atual. Por exemplo, essa diferenciação é chamada como parte de integração em AR (I) MA. Agora, temos três parâmetros 3. Sazonalidade. A sazonalidade pode ser facilmente incorporada diretamente no modelo ARIMA. Mais sobre isso foi discutido na parte de aplicativos abaixo. Etapa 3: Encontre parâmetros ótimos Os parâmetros p, d, q podem ser encontrados usando parcelas ACF e PACF. Uma adição a esta abordagem pode ser, se ACF e PACF diminuem gradualmente, isso indica que precisamos fazer as séries temporais estacionárias e introduzir um valor para 8220d8221. Passo 4: Construa o modelo ARIMA Com os parâmetros em mãos, agora podemos tentar construir o modelo ARIMA. O valor encontrado na seção anterior pode ser uma estimativa aproximada e precisamos explorar mais combinações (p, d, q). Aquele com o menor BIC e AIC deve ser nossa escolha. Também podemos tentar alguns modelos com um componente sazonal. Por favor, notamos qualquer sazonalidade nas parcelas ACF PACF. Passo 5: Faça previsões Depois de ter o modelo ARIMA final, agora estamos prontos para fazer previsões sobre os futuros pontos de tempo. Também podemos visualizar as tendências para se validar se o modelo funcionar bem. Aplicações do Modelo de Série de Tempo Agora, usamos o mesmo exemplo que usamos acima. Então, usando séries de tempo, we8217ll fazer previsões futuras. Recomendamos que você verifique o exemplo antes de prosseguir. Onde começamos A seguir é a parcela do número de passageiros com anos. Tente fazer observações sobre esta trama antes de avançar no artigo. Aqui estão as minhas observações: 1. Existe um componente de tendência que cresce o passageiro ano a ano. 2. Parece haver um componente sazonal que tenha um ciclo inferior a 12 meses. 3. A variação nos dados continua aumentando com o tempo. Sabemos que precisamos abordar duas questões antes de testar as séries estacionárias. Um, precisamos remover variações desiguais. Fazemos isso usando o log da série. Dois, precisamos abordar o componente de tendência. Fazemos isso tomando a diferença da série. Agora, let8217s testar a série resultante. Teste Dickey-Fuller aumentado Vemos que a série é estacionária o suficiente para fazer qualquer tipo de modelagem de séries temporais. O próximo passo é encontrar os parâmetros certos a serem usados no modelo ARIMA. Nós já sabemos que o componente 8216d8217 é 1, pois precisamos de 1 diferença para tornar as séries estacionárias. Fazemos isso usando os gráficos de correlação. Seguem-se os gráficos da ACF para a série: o que você vê no gráfico mostrado acima Claramente, o gráfico de decadência do ACF é muito lento, o que significa que a população não está estacionária. Nós já discutimos acima que agora pretendemos regredir a diferença de logs em vez de registrar diretamente. Let8217s vêem como a curva ACF e PACF sai após regredir a diferença. Claramente, a trama da ACF corta após o primeiro intervalo. Por isso, entendemos que o valor de p deve ser 0, pois o ACF é a curva que está sendo cortada. Enquanto o valor de q deveria ser 1 ou 2. Após algumas iterações, descobrimos que (0,1,1) como (p, d, q) é a combinação com menos AIC e BIC. Let8217s se encaixa no modelo ARIMA e prevê os próximos 10 anos. Além disso, tentaremos instalar um componente sazonal na formulação ARIMA. Então, visualizaremos a previsão juntamente com os dados de treinamento. Você pode usar o seguinte código para fazer o mesmo: Com isso, chegamos a este fim do tutorial sobre Modelagem de séries temporais. Espero que isso ajude você a melhorar seus conhecimentos para trabalhar com dados baseados no tempo. Para obter os benefícios máximos deste tutorial, I8217d sugere que você pratique esses códigos R lado a lado e verifique seu progresso. Você achou o artigo útil Compartilhe conosco se você já fez análises similares antes. Deixe-nos saber seus pensamentos sobre este artigo na caixa abaixo. Se você gosta do que você acabou de ler o amplificador quer continuar a sua aprendizagem de análise, inscreva-se nos nossos e-mails. Siga-nos no Twitter ou como a nossa página do Facebook. Compartilhar isso:
Comments
Post a Comment