Índice Centrado Em Movimento Média Sazonal
Cálculo de um índice sazonal Este folheto deve ser usado juntamente com o arquivo MS Excel seasonalindex. xls localizado na página inicial da classe Econ437. 1. Liste os preços mensais em ordem cronológica na coluna D da sua planilha. Exemplo. O conjunto de dados fornecido é de janeiro de 1975 a dezembro de 1996, 264 observações totais. 2. Calcule um total movimentado de 12 meses centrado, somando os preços de janeiro a dezembro. Você deve começar com a 6ª observação. Exemplo. Para junho de 1975 (observação 6) 3.012.822.632.652.672.652.702.942.762.542.302.30 31.97 3. Repita o passo 2 para o resto do conjunto de dados. Nota. Haverá 5 células em branco no início do conjunto de dados na Coluna E e 6 células em branco no final da Coluna E. 4. Calcule o total em movimento de 2 meses da Coluna E e insira isso na Coluna F começando com a 7ª observação. Haverá 6 células em branco no início e no final da coluna F. Exemplo. Para observação 7, 31.9731.3363.30. 5. Divida a coluna F por 24 e insira isso na coluna G, começando com a observação 7. Esta é a média dobrada de 12 meses centrada (MA). 6. Divida os preços originais na coluna D pela média móvel centrada de 12 meses na coluna G e insira esses valores mensais individuais na coluna H a partir de julho de 1975, observação 7. Não haverá valores para os primeiros 6 meses de 1975 e Nos últimos 6 meses de 1996. 7. Adicione todos os índices mensais para cada mês e a média deles para obter o valor do índice bruto. Veja a tabela abaixo. Encontre a média dos índices brutos. Divida a cada mês índice bruto pela média dos índices brutos para obter o índice ajustado. Implementação da tabela de cálculo do ajuste sazonal e alisamento exponencial. É direto realizar ajustes sazonais e ajustar modelos de suavização exponencial usando o Excel. As imagens de tela e os gráficos abaixo são retirados de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e o alisamento exponencial linear nos seguintes dados trimestrais de vendas da Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão do alisamento exponencial linear que será usada aqui para fins de demonstração é a versão Brown8217s, meramente porque pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que possui constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii), então, as previsões são geradas para os dados sazonalmente ajustados através de alisamento exponencial linear e (iii) finalmente, as previsões sazonalmente ajustadas são quantitativas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isso pode ser feito tomando a média de duas médias de um ano que são compensadas por um período relativo um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é igual.) O próximo passo é calcular a proporção para a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de quottrend-cyclequot componente do padrão, na medida em que os efeitos da tendência e do ciclo comercial podem ser considerados como sendo tudo isso Permanece após uma média de um ano inteiro de dados. Claro, as mudanças de mês a mês que não são devidas à sazonalidade podem ser determinadas por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todos os índices para essa estação específica, o que é feito nas células G3-G6 usando uma fórmula AVERAGEIF. Os rácios médios são então redimensionados de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400 neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o quarto do ano que representa. A média móvel centrada e os dados sazonalmente ajustados ficam assim: note que a média móvel normalmente se parece com uma versão mais suave da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo linear de suavização exponencial aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot.) O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série dessazonalizada. A fórmula usada aqui para a previsão LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada a partir daí. Observe que a previsão LES para o período atual refere-se às duas observações precedentes e aos dois erros de previsão precedentes, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar um alisamento exponencial linear em vez de linear, poderíamos substituir a fórmula SES aqui em vez disso. Também poderíamos usar Holt8217s em vez do modelo LES Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível e a tendência Que são usados na previsão). Os erros são computados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isso se segue à identidade matemática: VARIÂNCIA MSE (erros) (MÉDIA (erros)) 2. No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo na verdade não inicia a previsão até O terceiro período (linha 15 na planilha). O valor ideal de alfa pode ser encontrado alterando o alfa manualmente até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alfa que o Solver encontrou é mostrado aqui (alfa0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em atrasos de até uma estação. Aqui está uma série de séries temporais dos erros (ajustados sazonalmente): as autocorrelações de erro são computadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um enredo das autocorrelações dos erros nos primeiros cinco atrasos: as autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas o pico no intervalo 4 (cujo valor é 0.35) é um pouco incômodo - sugere que o O processo de ajuste sazonal não foi completamente bem sucedido. No entanto, na verdade, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de n-menos-k é em torno de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor do alfa à mão neste modelo do Excel, você pode observar o efeito na série de tempo e nos gráficos de autocorrelação dos erros, bem como no erro da raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é citada no futuro, simplesmente substituindo as previsões por valores reais no ponto em que os dados reais se esgotaram - ou seja. Onde quotthe futurequot começa. (Em outras palavras, em cada célula onde um futuro valor de dados ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas de cima para cima: Observe que os erros para as previsões de O futuro é calculado para ser zero. Isso não significa que os erros reais serão zero, mas sim reflete apenas o fato de que, para fins de predição, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões resultantes de LES para os dados dessazonalizados são assim: com este valor particular de alfa, otimizado para previsões de um período de antecedência, a tendência projetada é ligeiramente ascendente, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente, é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa for ajustado manualmente para 0.25: A tendência de longo prazo projetada agora é negativa em vez de positiva. Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A estimativa do nível e da tendência atual e suas previsões de longo prazo refletem a tendência de queda observada nos últimos 5 anos em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um menor valor de alfa é mais lento para responder aos pontos de referência nos dados e, portanto, tende a fazer um erro do mesmo sinal por vários períodos seguidos. Seus erros de previsão de 1 passo à frente são maiores em média do que os obtidos anteriormente (RMSE de 34,4 em vez de 27,4) e fortemente auto-correlacionados positivamente. A autocorrelação de lag-1 de 0,56 excede muito o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como alternativa para diminuir o valor do alfa, a fim de introduzir mais conservadorismo em previsões de longo prazo, um fator de amortecimento de quotstend às vezes é adicionado ao modelo, a fim de tornar a tendência projetada abrandar depois de alguns períodos. O passo final na construção do modelo de previsão é para quantificar as previsões do LES, multiplicando-os pelos índices sazonais apropriados. Assim, as previsões reestruturadas na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES temporariamente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para previsões de um passo a frente feitas por este modelo: primeiro Computa o RMSE (erro da raiz-meio-quadrado, que é apenas a raiz quadrada do MSE) e depois calcula um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança 95 para uma previsão de um período anterior é aproximadamente igual ao ponto de previsão mais-ou-menos-duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição do erro é aproximadamente normal e o tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE, em vez do desvio padrão da amostra dos erros, é a melhor estimativa do desvio padrão dos futuros erros de previsão porque leva também o viés, bem como variações aleatórias.) Os limites de confiança Para a previsão ajustada sazonalmente são então resgatados. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Nesse caso, o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (dezembro-93) é 273,2. Então o intervalo de confiança 95 ajustado sazonalmente é de 273,2-227,4 218,4 a 273,2227,4 328,0. Multiplicando esses limites pelo índice sazonal Decembers de 68,61. Obtemos limites de confiança inferiores e superiores de 149,8 e 225,0 em torno da previsão do ponto 93 de 187,4. Os limites de confiança para as previsões mais de um período adiante geralmente se ampliarão à medida que o horizonte de previsão aumentar, devido à incerteza sobre o nível e a tendência, bem como os fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular os limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão de mais de um período adiante, tomando todas as fontes de Erro na sua conta, a sua melhor opção é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão anterior de 2 passos, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão de 2 passos e use isso como base para um intervalo de confiança de 2 passos. Médias migratórias e médias movimentadas centradas. Alguns pontos sobre a sazonalidade em uma série temporal são repetidos, mesmo que Eles parecem óbvios. Um deles é que o termo 8220season8221 não se refere necessariamente às quatro estações do ano que resultam da inclinação do eixo Earth8217s. Na análise preditiva, freqüentemente significa precisamente isso, porque muitos dos fenômenos que estudamos variam de acordo com a progressão da primavera até o inverno: vendas de artes de inverno ou verão, incidência de certas doenças generalizadas, eventos climáticos causados pela localização da Fluxo de jato e mudanças na temperatura da água no oceano Pacífico oriental, e assim por diante. Igualmente, os eventos que ocorrem regularmente podem atuar como estações meteorológicas, mesmo que tenham apenas uma conexão tênue com os solstícios e equinócios. Mudanças de oito horas em hospitais e fábricas muitas vezes se expressam na incidência de ingestas e gastos de energia lá, uma temporada é de oito horas e as estações circulam todos os dias e não todos os anos. As datas de vencimento para impostos sinalizam o início de uma inundação de dólares em tesouros municipais, estaduais e federais, a estação pode ser de um ano (impostos sobre o rendimento das pessoas singulares), seis meses (impostos sobre a propriedade em muitos estados), trimestralmente (muitos impostos sobre as sociedades ), e assim por diante. É um pouco estranho que tenhamos a palavra 8220season8221 para se referir geralmente ao período de tempo regularmente recorrente, mas nenhum termo geral para o período de tempo durante o qual ocorre uma volta completa das estações. 8220Cycle8221 é possível, mas na análise e previsão de que o termo geralmente é considerado um período de duração indeterminada, como um ciclo comercial. Na ausência de um termo melhor, I8217ve usado 8220encompatibilidade período8221 neste e subseqüentes capítulos. Isso não é apenas reflexão terminológica. As formas em que identificamos as estações e o período de tempo durante o qual as estações tornam-se reais, se muitas vezes menores, implicações sobre a forma como medimos os seus efeitos. As seções a seguir abordam a forma como alguns analistas variam da forma como calculam as médias móveis de acordo com o número de temporadas que é impar ou igual. Usando médias móveis em vez de médias simples Suponha que uma grande cidade esteja considerando a reafectação de sua polícia de trânsito para melhor abordar a incidência de condução enquanto está prejudicada, o que a cidade acredita ter aumentado. Há quatro semanas, entrou em vigor uma nova legislação, legalizando a posse e o uso recreativo da maconha. Desde então, o número diário de detenções de trânsito para a DWI parece estar a tendência. Complicar questões é o fato de que o número de paradas parece aumentar nas sextas e sábados. Para ajudar a planejar os requisitos de mão-de-obra no futuro, you8217d gostaria de prever qualquer tendência subjacente que o 8217s esteja sendo estabelecido. You8217d também gosta de tempo a implantação de seus recursos para levar em consideração qualquer temporada sazonal que 8217s aconteça. A Figura 5.9 possui os dados relevantes com os quais você deve trabalhar. Figura 5.9 Com este conjunto de dados, cada dia da semana constitui uma estação. Mesmo com apenas ocultação do gráfico na Figura 5.9. Você pode dizer que a tendência do número de prisões diárias está em alta. Você deve planejar expandir o número de agentes de trânsito e esperar que a tendência diminua em breve. Além disso, os dados confirmam a noção de que mais detenções ocorrem rotineiramente nas sextas e sábados, de modo que sua alocação de recursos precisa abordar essas espinhas. Mas você precisa quantificar a tendência subjacente, para determinar a quantidade de policiais adicionais que você precisa trazer. Você também precisa quantificar o tamanho esperado dos picos de fim de semana, para determinar quantas policiais adicionais você precisa prestar atenção para motoristas erráticos naqueles dias. O problema é que, até o momento, você não sabe o quanto do aumento diário é devido à tendência e quanto é devido ao efeito desse fim de semana. Você pode começar diminuindo as séries temporais. Anteriormente neste capítulo, em 8220Simple Seasonal Medias, 8221 você viu um exemplo de como destruição de uma série de tempo para isolar os efeitos sazonais usando o método de médias simples. Nesta seção, você verá como fazê-lo, usando as médias móveis, muito provável, a abordagem das médias móveis é usada com mais freqüência na análise preditiva do que a abordagem de médias simples. Existem várias razões para a maior popularidade das médias móveis, dentre elas, que a abordagem das médias móveis não pede que você colapse seus dados no processo de quantificação de uma tendência. Lembre-se de que o exemplo anterior tornou necessário o colapso das médias trimestrais para as médias anuais, calcular uma tendência anual e, em seguida, distribuir um quarto da tendência anual em cada trimestre do ano. Esse passo era necessário para remover a tendência dos efeitos sazonais. Em contrapartida, a abordagem das médias móveis permite que você desmonte a série temporal sem recorrer a esse tipo de maquinação. A Figura 5.10 mostra como a abordagem de médias móveis funciona no presente exemplo. Figura 5.10 A média móvel no segundo gráfico esclarece a tendência subjacente. A Figura 5.10 acrescenta uma coluna de média móvel e uma coluna para sazonais específicos. Para o conjunto de dados na Figura 5.9. Ambas as adições requerem alguma discussão. As picos de prisões que ocorrem nos fins de semana oferecem motivos para acreditar que você trabalha com as estações que repetem uma vez por semana. Portanto, comece obtendo a média para o período abrangente8212, isto é, as primeiras sete estações, de segunda a domingo. A fórmula para a média na célula D5, a primeira média móvel disponível, é a seguinte: Essa fórmula é copiada e colada através da célula D29, então você tem 25 médias móveis com base em 25 corridas de sete dias consecutivos. Observe que, para mostrar as primeiras e as últimas observações na série temporal, escondeu as linhas 10 a 17. Você pode exibi-las, se desejar, neste livro do capítulo8217s, disponível no site do publisher8217s. Faça uma seleção múltipla de linhas visíveis 9 e 18, clique com o botão direito do mouse em um de seus cabeçalhos de linha e escolha Desligar no menu de atalho. Quando você esconde as linhas de uma planilha 8217s, como I8217ve feito na Figura 5.10. Todos os dados gráficos nas linhas ocultas também estão ocultos no gráfico. Os rótulos dos eixos x identificam apenas os pontos de dados que aparecem no gráfico. Como cada média móvel da Figura 5.10 abrange sete dias, nenhuma média móvel é emparelhada com as três primeiras ou últimas três observações reais. Copiar e colar a fórmula na célula D5 até um dia para a célula D4 corre para fora das observações8212. Não há observação registrada na célula C1. Da mesma forma, não há média móvel registrada abaixo da célula D29. Copiar e colar a fórmula em D29 em D30 exigiria uma observação na célula C33, e nenhuma observação está disponível para o dia em que a célula representaria. Seria possível, é claro, encurtar o comprimento da média móvel para, digamos, cinco em vez de sete. Assim, significaria que as fórmulas de média móvel na Figura 5.10 poderiam começar na célula D4 em vez de D5. No entanto, neste tipo de análise, você deseja que o comprimento da média móvel seja igual ao número de estações: sete dias em uma semana para eventos que se repetem semanalmente implica uma média móvel de comprimento sete e quatro trimestres por ano para eventos que Repetir anualmente implica uma média móvel de comprimento quatro. Ao longo de linhas semelhantes, geralmente quantificamos os efeitos sazonais de tal forma que eles totalizam para zero dentro do período de tempo abrangente. Como você viu na primeira seção deste capítulo8217, em médias simples, isso é feito calculando a média de (digamos) os quatro trimestres em um ano e subtraindo a média do ano de cada figura trimestral. Assim, garante que o total dos efeitos sazonais seja zero. Por sua vez, isso é útil porque ele coloca os efeitos sazonais em um efeito de verão comum de 8212a de 11 é tão distante da média como um efeito de inverno de 821111. Se você quiser uma média de cinco estações em vez de sete para obter sua média móvel, você é melhor Descobrindo um fenômeno que se repete a cada cinco temporadas em vez de cada sete. No entanto, quando você toma a média dos efeitos sazonais mais tarde no processo, é improvável que essas médias somem para zero. É necessário nesse ponto recalibrar ou normalizar. As médias de modo que sua soma seja zero. Quando isso é feito, as médias sazonais médias expressam o efeito em um período de tempo de pertença a uma determinada estação. Uma vez normalizadas, as médias sazonais são denominadas os índices sazonais que este capítulo já mencionou várias vezes. Você verá como funciona mais adiante neste capítulo, em 8220Detrending the Series with Moving Medes.8221 Compreendendo Sazonais Específicos A Figura 5.10 também mostra o que são chamados de sazonais específicos na coluna E. Eles são o que deixa depois de subtrair a média móvel da observação real. Para ter uma idéia do que os sazonais específicos representam, considere a média móvel na célula D5. É a média das observações em C2: C8. Os desvios de cada observação a partir da média móvel (por exemplo, C2 8211 D5) são garantidos para somar zero8212 a 8217s uma característica de uma média. Portanto, cada desvio expressa o efeito de estar associado a esse dia específico naquela semana específica. It8217s é um específico sazonal e então especifico porque o desvio se aplica a determinada segunda-feira ou terça-feira e assim por diante, e sazonal, porque neste exemplo, estamos tratando cada dia como se fosse uma estação no período abrangente de uma semana. Como cada medida sazonal específica o efeito de estar naquela estação vis-224-vis a média móvel para esse grupo de (aqui) sete estações, você pode, posteriormente, classificar os sazonais específicos para uma determinada temporada (por exemplo, todas as sextas na sua Séries temporais) para estimar que o efeito geral, em vez de específico, da estação8217s. Essa média não é confundida por uma tendência subjacente na série temporal, porque cada estaço específico expressa um desvio de sua própria média móvel particular. Alinhando as médias móveis There8217s também a questão de alinhar as médias móveis com o conjunto de dados original. Na figura 5.10. Eu alinhei cada média móvel com o ponto médio da gama de observações que ela inclui. Assim, por exemplo, a fórmula na célula D5 mede as observações em C2: C8, e alineei com a quarta observação, o ponto médio do intervalo médio, colocando-a na linha 5. Esse arranjo é denominado média móvel centrada . E muitos analistas preferem alinhar cada média móvel com o ponto médio das observações que mede. Tenha em mente que, neste contexto, 8220midpoint8221 se refere ao meio do período: a quinta-feira é o ponto médio de segunda a domingo. Não se refere à mediana dos valores observados, embora, claro, isso possa funcionar dessa maneira na prática. Outra abordagem é a média móvel final. Nesse caso, cada média móvel está alinhada com a observação final de que ela é média8212 e, portanto, fica atrás de seus argumentos. Este é muitas vezes o arranjo preferido se você deseja usar uma média móvel como uma previsão, como é feito com suavização exponencial, porque sua média móvel final ocorre coincidindo com a observação final disponível. Médias móveis centradas com números pares de estações Nós geralmente adotamos um procedimento especial quando o número de estações é mesmo em vez de estranho. Esse é o estado típico das coisas: tende a ter um número uniforme de estações no período abrangente para as estações típicas, como meses, trimestres e períodos quadrienais (para eleições). A dificuldade com um número par de temporadas é que não há ponto médio. Dois não são o ponto médio de um intervalo que começa em 1 e termina em 4, e tampouco é 3 se se pode dizer ter um, seu ponto médio é 2,5. Seis não é o ponto médio de 1 a 12, e nem 7 é o ponto médio puramente teórico é de 6,5. Para agir como se um ponto médio exista, você precisa adicionar uma camada de média acima das médias móveis. Veja a Figura 5.11. Figura 5.11 O Excel oferece várias maneiras de calcular uma média móvel centrada. A idéia por trás dessa abordagem para obter uma média móvel que a média de 8217 se centrou em um ponto médio existente, quando há um número par de temporadas, é puxar esse ponto médio para frente em meio tempo. Você calcula uma média móvel que seria centrada em, digamos, o terceiro ponto no tempo, se cinco estações em vez de quatro constituíram uma volta completa do calendário. Isso foi feito tomando duas médias móveis consecutivas e promediando-as. Assim, na Figura 5.11. Existe uma média móvel na célula E6 que mede os valores em D3: D9. Como há quatro valores sazonais em D3: D9, a média móvel em E6 é pensada como centrada na estação imaginária 2.5, meio ponto abaixo da primeira temporada de candidatos disponíveis, 3. (as estações 1 e 2 não estão disponíveis como pontos médios para Falta de dados para a média antes da temporada 1.) Note, no entanto, que a média móvel na célula E8 é a média dos valores em D5: D11, o segundo ao quinto na série temporal. Essa média é centrada no ponto (imaginário) 3.5, um período completo antes da média centrada em 2.5. Ao calcular a média das duas médias móveis, então o pensamento corre, você pode puxar o ponto central da primeira média móvel em meio em meio ponto, de 2,5 para 3. Aqueles que são as médias da coluna F da Figura 5.11. A célula F7 fornece a média das médias móveis em E6 e E8. E a média em F7 está alinhada com o terceiro ponto de dados na série temporal original, na célula D7, para enfatizar que a média está centrada naquela estação. Se você expandir a fórmula na célula F7, bem como as médias móveis nas células E6 e E8, você verificou que se trata de uma média ponderada dos primeiros cinco valores na série temporal, com o primeiro e quinto valor dado um peso De 1 e os valores do segundo ao quarto, dado um peso de 2. Isso nos leva a uma maneira mais rápida e simples de calcular uma média móvel centrada com um número par de temporadas. Ainda na Figura 5.11. Os pesos são armazenados no intervalo H3: H11. Esta fórmula retorna a primeira média móvel centralizada, na célula I7: Essa fórmula retorna 13.75. Que é idêntico ao valor calculado pela fórmula de média dupla na célula F7. Fazendo a referência aos pesos absolutos, por meio dos sinais de dólar em H3: H11. Você pode copiar a fórmula e colá-la, na medida do necessário, para obter o resto das médias móveis centradas. Detrendendo a série com médias móveis Quando você subtraiu as médias móveis das observações originais para obter os sazonais específicos, você removeu a tendência subjacente da série. O que é que as restantes 828 sazonais são normalmente uma série horizontal estacionária com dois efeitos que causam que os sazonais específicos partem de uma linha absolutamente reta: os efeitos sazonais e o erro aleatório nas observações originais. A Figura 5.12 mostra os resultados para este exemplo. Figura 5.12 Os efeitos sazonais específicos para sexta-feira e sábado permanecem claros na série detrada. O gráfico superior da Figura 5.12 mostra as observações diárias originais. Tanto a tendência ascendente geral como os picos sazonais de fim de semana são claros. O gráfico inferior mostra os eventos sazonais específicos: o resultado de destruição da série original com um filtro de média móvel, conforme descrito anteriormente em 8220Estudo de Sazonais Específicos.8221 Você pode ver que a série destrendida agora é praticamente horizontal (uma linha de tendência linear para os sazonais específicos Tem uma ligeira deriva para baixo), mas os picos sazonais de sexta-feira e sábado ainda estão no lugar. O próximo passo é ir além dos períodos sazonais específicos para os índices sazonais. Veja a Figura 5.13. Figura 5.13 Os efeitos sazonais específicos são em primeiro lugar em média e depois normalizados para atingir os índices sazonais. Na Figura 5.13. As estações específicas da coluna E são rearranjadas na forma tabular mostrada na faixa H4: N7. O objetivo é simplesmente facilitar o cálculo das médias sazonais. Essas médias são mostradas em H11: N11. No entanto, as figuras em H11: N11 são médias, não desvios de uma média, e, portanto, não podemos esperar que somem a zero. Ainda precisamos ajustá-los para que eles expressem desvios de um grande meio. Essa grande média aparece na célula N13, e é a média das médias sazonais. Podemos chegar aos índices sazonais, subtraindo a grande média em N13 de cada uma das médias sazonais. O resultado está na faixa H17: N17. Esses índices sazonais não são mais específicos para uma média móvel particular, como é o caso dos sazonais específicos na coluna E. Como eles são baseados em uma média de cada instância de uma determinada estação, eles expressam o efeito médio de uma determinada estação ao longo da Quatro semanas na série temporal. Além disso, são medidas de uma estação8217s8212hhh, um dia8217s8212feita em prisões de trânsito vis-224-vis a média por um período de sete dias. Agora podemos usar esses índices sazonais para dessazonalizar a série. Utilizamos a série dessazonalizada para obter previsões por meio de regressão linear ou método de Holt8217s de tendências da série (discutido no Capítulo 4). Então, simplesmente adicionamos os índices sazonais de volta às previsões para redefini-los. Tudo isso aparece na Figura 5.14. Figura 5.14 Depois de ter os índices sazonais, os toques finais aplicados aqui são os mesmos que no método das médias simples. As etapas ilustradas na Figura 5.14 são em grande parte as mesmas das Figuras 5.6 e 5.7. Discutido nas seções a seguir. Desestatizando as Observações Subtrair os índices sazonais das observações originais para desestatizar os dados. Você pode fazer isso como mostrado na Figura 5.14. Em que as observações originais e os índices sazonais são organizados como duas listas que começam na mesma linha, as colunas C e F. Este arranjo torna um pouco mais fácil estruturar os cálculos. Você também pode fazer a subtração como mostrado na Figura 5.6. Em que as observações trimestrais originais (C12: F16), os índices trimestrais (C8: F8) e os resultados dessazonalizados (C20: F24) são mostrados em um formato tabular. Esse arranjo torna um pouco mais fácil se concentrar nos índices sazonais e nos trimestres dessazonados. Previsão das Observações Desesperadas na Figura 5.14. As observações dessazonalizadas estão na coluna H e, na Figura 5.7, estão na coluna C. Independentemente de querer usar uma abordagem de regressão ou uma abordagem de suavização da previsão, é o melhor para organizar as observações dessazonalizadas em uma lista de uma única coluna. Na Figura 5.14. As previsões estão na coluna J. A seguinte fórmula de matriz é inserida no intervalo J2: J32. No início deste capítulo, apontou que, se você omitir o argumento x-values dos argumentos TREND () function8217s, o Excel fornece os valores padrão 1. 2. N. Onde n é o número de valores y. Na fórmula dada, H2: H32 contém 31 valores de y. Como o argumento que normalmente contém os valores x está faltando, o Excel fornece os valores padrão 1. 2. 31. Esses são os valores que gostaríamos de usar de qualquer maneira, na coluna B, então a fórmula como dada é equivalente a TREND (H2: H32, B2: B32). E que a estrutura utilizada em D5: D24 da Figura 5.7: Fazendo a previsão de um passo para frente Até agora você organizou as previsões das séries temporais dessazonalizadas de t 1 a t 31 na Figura 5.14. E de t 1 a t 20 na Figura 5.7. Essas previsões constituem informações úteis para vários fins, incluindo a avaliação da precisão das previsões por meio de uma análise RMSE. Mas seu objetivo principal é prever pelo menos o próximo período de tempo, ainda não observado. Para obter isso, você poderia primeiro prever a partir da função TREND () ou LINEST () se you8217re usando regressão ou da fórmula de suavização exponencial se you8217re usando o método Holt8217s. Então você pode adicionar o índice sazonal associado à previsão de regressão ou alisamento, para obter uma previsão que inclua tanto a tendência como o efeito sazonal. Na Figura 5.14. Você obtém a previsão de regressão na célula J33 com esta fórmula: Nesta fórmula, os valores y em H2: H32 são os mesmos nas outras fórmulas TREND () na coluna J. Assim, os valores x (padrão) de 1 Através de 32. Agora, no entanto, você fornece um novo valor x como o terceiro argumento do function8217s, que você conta para TREND () para procurar na célula B33. It8217s 32. O próximo valor de t. E o Excel retorna o valor 156.3 na célula J33. A função TREND () na célula J33 está dizendo ao Excel, de fato, 8220Calcular a equação de regressão para os valores em H2: H32 regredido nos valores t de 1 a 31. Aplica essa equação de regressão ao novo valor x de 32 e retorna o resultado.8221 You8217ll encontra a mesma abordagem na célula D25 da Figura 5.7. Onde a fórmula para obter a previsão one-step-ahead é esta: Adicionando os índices sazonais de volta ao passo final é redimensionar as previsões adicionando os índices sazonais às previsões de tendência, reverteu o que você fez quatro passos atrás quando você subtraiu a Índices das observações originais. Isso é feito na coluna F na Figura 5.7 e na coluna K na Figura 5.14. Don8217t esqueça de adicionar o índice sazonal apropriado para a previsão one-step-ahead, com os resultados mostrados na célula F25 na Figura 5.7 e na célula K33 na Figura 5.14. (I8217ve sombreou as células de um passo à frente, tanto na Figura 5.7 como na Figura 5.14 para destacar as previsões.) Você pode encontrar gráficos de três representações dos dados de trânsito na Figura 5.15. As séries dessazonalizadas, a previsão linear dos dados dessazonalizados e as previsões resgatadas. Note-se que as previsões incorporam tanto a tendência geral quanto os dados originais e os pontos de sexta-feira. Figura 5.15 Traçando as previsões.
Comments
Post a Comment