Flytte Gjennomsnittet Of Time Serien

Flytte gjennomsnitt Gjeldende gjennomsnitt Med konvensjonelle datasett er gjennomsnittlig verdi ofte den første, og en av de mest nyttige, oppsummerte statistikkene for å beregne. Når data er i form av en tidsserie, er seriemengden et nyttig mål, men reflekterer ikke dataens dynamiske natur. Gjennomsnittlige verdier som beregnes over kortere perioder, enten før den nåværende perioden eller sentrert i den nåværende perioden, er ofte mer nyttige. Fordi slike middelverdier vil variere, eller flytte, som den nåværende perioden beveger seg fra tid t 2, t 3. etc. er de kjent som bevegelige gjennomsnitt (Mas). Et enkelt glidende gjennomsnitt er (typisk) det uveide gjennomsnittet av k tidligere verdier. Et eksponentielt vektet glidende gjennomsnitt er i det vesentlige det samme som et enkelt bevegelige gjennomsnitt, men med bidrag til middelvektet av deres nærhet til den nåværende tid. Fordi det ikke er en, men en hel rekke bevegelige gjennomsnittsverdier for en gitt serie, kan settet Mas selv bli plottet på grafer, analysert som en serie, og brukes til modellering og prognoser. En rekke modeller kan bygges ved hjelp av bevegelige gjennomsnitt, og disse er kjent som MA-modeller. Hvis slike modeller er kombinert med autoregressive (AR) modeller, er de resulterende komposittmodellene kjent som ARMA - eller ARIMA-modeller (jeg er for integrert). Enkle bevegelige gjennomsnitt Siden en tidsserie kan betraktes som et sett med verdier, kan t 1,2,3,4, n gjennomsnittet av disse verdiene beregnes. Hvis vi antar at n er ganske stor, og vi velger et heltall k som er mye mindre enn n. vi kan beregne et sett med blokk gjennomsnitt eller enkle bevegelige gjennomsnitt (av rekkefølge k): Hvert mål representerer gjennomsnittet av dataverdiene over et intervall av k observasjoner. Merk at den første mulige MA for ordre k gt0 er den for t k. Mer generelt kan vi slippe det ekstra abonnementet i uttrykkene ovenfor og skrive: Dette sier at estimert gjennomsnitt på tidspunktet t er det enkle gjennomsnittet av den observerte verdien ved tid t og de foregående k -1-trinnene. Hvis det legges vekt på som reduserer bidraget til observasjoner som er lengre bort i tiden, sies det glidende gjennomsnittet å være eksponensielt jevnt. Flytende gjennomsnitt blir ofte brukt som en form for prognoser, hvorved estimert verdi for en serie på tiden t 1, S t1. er tatt som MA for perioden til og med tiden t. f. eks dagens estimat er basert på et gjennomsnitt av tidligere registrerte verdier fram til og med gårdager (for daglige data). Enkle bevegelige gjennomsnitt kan ses som en form for utjevning. I eksemplet som er vist nedenfor, er luftforurensningsdatasettet vist i introduksjonen til dette emnet blitt utvidet med en 7-dagers glidende gjennomsnittlig (MA) - linje, vist her i rødt. Som det ser ut, jevner MA-linjen ut toppene og troughene i dataene og kan være svært nyttig når det gjelder å identifisere trender. Standard forward-beregning formel betyr at de første k -1 datapunktene ikke har noen MA-verdi, men deretter utvider beregningene til det endelige datapunktet i serien. PM10 daglige gjennomsnittsverdier, Greenwich kilde: London Air Quality Network, londonair. org. uk En grunn til å beregne enkle bevegelige gjennomsnitt på måten som er beskrevet er at det gjør det mulig å beregne verdier for alle tidsluker fra tid tk frem til i dag, og Som en ny måling er oppnådd for tid t 1, kan MA for tid t 1 legges til settet som allerede er beregnet. Dette gir en enkel prosedyre for dynamiske datasett. Det er imidlertid noen problemer med denne tilnærmingen. Det er rimelig å argumentere for at gjennomsnittsverdien i løpet av de siste 3 periodene skal være plassert ved tidspunktet t -1, ikke tiden t. og for en MA over et jevnt antall perioder, bør det kanskje ligge midt mellom to tidsintervaller. En løsning på dette problemet er å bruke sentrale MA beregninger, der MA på tidspunktet t er gjennomsnittet av et symmetrisk sett med verdier rundt t. Til tross for det åpenbare meritter, er denne tilnærmingen ikke vanligvis brukt fordi det krever at data er tilgjengelig for fremtidige hendelser, noe som kanskje ikke er tilfelle. I tilfeller der analysen er helt av en eksisterende serie, kan bruk av sentrert Mas være å foretrekke. Enkle bevegelige gjennomsnitt kan betraktes som en form for utjevning, fjerne noen høyfrekvente komponenter i en tidsserie og markere (men ikke fjerne) trender på samme måte som det generelle begrepet digital filtrering. Faktisk er glidende gjennomsnitt en form for lineært filter. Det er mulig å bruke en bevegelig gjennomsnittsberegning til en serie som allerede har blitt utjevnet, dvs. utjevning eller filtrering av en allerede glatt serie. For eksempel, med et bevegelige gjennomsnitt på rekkefølge 2, kan vi betrakte det som beregnet ved hjelp av vekter, så MA ved x 2 0,5 x 1 0,5 x 2. På samme måte MA på x 3 0,5 x 2 0,5 x 3. Hvis vi bruk et andre nivå av utjevning eller filtrering, vi har 0,5 x 2 0,5 x 3 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dvs. 2-trinns filtrering prosess (eller convolution) har produsert et variabelt vektet symmetrisk glidende gjennomsnitt, med vekter. Flere konvolutter kan produsere ganske komplekse vektede glidende gjennomsnitt, hvorav noen har blitt funnet å være særlig bruk i spesialiserte felt, som for eksempel i livsforsikringsberegninger. Flytte gjennomsnitt kan brukes til å fjerne periodiske effekter dersom det beregnes med periodikkets lengde som kjent. For eksempel, med månedlige data kan sesongvariasjoner ofte fjernes (hvis dette er målet) ved å bruke et symmetrisk 12-måneders glidende gjennomsnitt med alle månedene vektet like, bortsett fra det første og det siste som veies med 12. Dette skyldes at det vil være 13 måneder i den symmetriske modellen (nåværende tid, t. - 6 måneder). Summen er delt med 12. Lignende prosedyrer kan vedtas for en veldefinert periodicitet. Eksponentielt vektede glidende gjennomsnitt (EWMA) Med den enkle glidende gjennomsnittsformelen: Alle observasjoner er likevektede. Hvis vi kalte disse likevektene, alfa t. hver av k-vekter vil være lik 1 k. så summen av vektene ville være 1, og formelen ville være: Vi har allerede sett at flere applikasjoner av denne prosessen resulterer i at vektene varierer. Med eksponentielt vektede glidende gjennomsnitt blir bidraget til middelverdien fra observasjoner som er fjernet i tid, redusert, og derved legges vekt på nyere (lokale) hendelser. I hovedsak er en utjevningsparameter, 0lt al1l, introdusert, og formelen er revidert til: En symmetrisk versjon av denne formelen vil være av formen: Hvis vektene i den symmetriske modellen er valgt som betingelsene i betingelsene for binomial ekspansjonen, (1212) 2q. de vil summe til 1, og når q blir stor, vil omtrentlig normalfordelingen. Dette er en form for kjernevikting, med binomialet som kjernefunksjon. Den to-trinns konvolusjon som er beskrevet i det foregående avsnitt er nettopp dette arrangementet, med q 1, som gir vekter. Ved eksponensiell utjevning er det nødvendig å bruke et sett med vekter som summerer til 1 og som reduserer størrelsen geometrisk. Vektene som brukes er vanligvis av skjemaet: For å vise at disse vektene summerer til 1, vurder utvidelsen av 1 som en serie. Vi kan skrive og utvide uttrykket i parentes ved hjelp av binomialformelen (1- x) s. hvor x (1-) og p -1, som gir: Dette gir da en form for vektet glidende gjennomsnitt av skjemaet: Denne summeringen kan skrives som en tilbakevendingsrelasjon: som forenkler beregningen sterkt og unngår problemet at vektingsregimet bør strengt være uendelig for vektene til summen til 1 (for små verdier av alfa. dette er vanligvis ikke tilfelle). Notasjonen som brukes av ulike forfattere varierer. Noen bruker bokstaven S for å indikere at formelen er i hovedsak en glatt variabel, og skriv: mens kontrollteori litteraturen ofte bruker Z i stedet for S for eksponentielt vektede eller jevnte verdier (se for eksempel Lucas og Saccucci, 1990, LUC1 , og NIST-nettsiden for flere detaljer og arbeidede eksempler). Formlene som er nevnt ovenfor kommer fra Roberts arbeid (1959, ROB1), men Hunter (1986, HUN1) bruker et uttrykk for formen: som kan være mer hensiktsmessig for bruk i noen kontrollprosedyrer. Med alfa 1 er gjennomsnittlig estimering bare dens målte verdi (eller verdien av forrige datapost). Med 0,5 er estimatet det enkle glidende gjennomsnittet for nåværende og tidligere målinger. I prognosemodellene er verdien S t. brukes ofte som estimat eller prognoseverdi for neste tidsperiode, det vil si som estimatet for x på tidspunktet t 1. Dermed har vi: Dette viser at prognosen på tidspunktet t 1 er en kombinasjon av det forrige eksponentielt veide glidende gjennomsnittet pluss en komponent som representerer den veide prediksjonsfeilen, epsilon. på tidspunktet t. Forutsatt at en tidsserie er gitt og det kreves en prognose, er det nødvendig med en verdi for alfa. Dette kan estimeres fra eksisterende data ved å evaluere summen av kvadrert prediksjon feil oppnådd med varierende verdier av alfa for hver t 2,3. sette det første estimatet til å være den første observerte dataværdien, x 1. I kontrollapplikasjoner er verdien av alfa viktig, da den brukes til å bestemme de øvre og nedre kontrollgrensene, og påvirker den forventede gjennomsnittlige kjølelengde (ARL) før disse kontrollgrensene er brutt (under antagelsen om at tidsseriene representerer et sett av tilfeldige, identisk distribuerte uavhengige variabler med vanlig varians). Under disse forholdene er variansen av kontrollstatistikken: (Lucas og Saccucci, 1990): Kontrollgrenser settes vanligvis som faste multipler av denne asymptotiske variansen, f. eks. - 3 ganger standardavviket. Hvis f. eks. Alpha 0,25 og dataene som overvåkes antas å ha en Normal fordeling, N (0,1), når den er i kontroll, vil kontrollgrensene være - 1,134 og prosessen vil nå en eller annen grense i 500 trinn gjennomsnittlig. Lucas og Saccucci (1990 LUC1) utlede ARLene for et bredt spekter av alfaverdier og under ulike forutsetninger ved bruk av Markov Chain-prosedyrer. De tabulerer resultatene, inkludert å gi ARLer når gjennomsnittet av kontrollprosessen har blitt forskjøvet med noen flere av standardavviket. For eksempel, med en 0,5 skift med alfa 0,25 er ARL mindre enn 50 timers trinn. Tilnærmingene beskrevet ovenfor er kjent som enkelt eksponensiell utjevning. ettersom prosedyrene blir brukt en gang til tidsseriene, og deretter utføres analyser eller kontrollprosesser på det resulterende glatte datasettet. Hvis datasettet inneholder en trend og sesongkomponenter, kan to - eller tre-trinns eksponensiell utjevning brukes som et middel til å fjerne (eksplisitt modellering) disse effektene (se videre avsnittet om prognose nedenfor og NIST-arbeidet). CHA1 Chatfield C (1975) Analyse av Times Series: Teori og praksis. Chapman og Hall, London HUN1 Hunter J S (1986) Det eksponentielt vektede glidende gjennomsnittet. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Eksponentielt vektede Flytte Gjennomsnittlige kontrollsystemer: Egenskaper og forbedringer. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolldiagramtester basert på geometriske bevegelige gjennomsnitt. Technometrics, 1, 239-2502.1 Moving Average Models (MA modeller) Tidsseriemodeller kjent som ARIMA-modeller kan inneholde autoregressive vilkår og eller flytte gjennomsnittlige betingelser. I uke 1 lærte vi et autoregressivt uttrykk i en tidsseriemodell for variabelen x t er en forsinket verdi på x t. For eksempel er et lag 1 autoregressivt uttrykk x t-1 (multiplisert med en koeffisient). Denne leksjonen definerer glidende gjennomsnittlige vilkår. En glidende gjennomsnittlig term i en tidsseriemodell er en tidligere feil (multiplisert med en koeffisient). La (wt overset N (0, sigma2w)), noe som betyr at w t er identisk, uavhengig distribuert, hver med en normalfordeling med gjennomsnittlig 0 og samme varians. Den første ordre-flytende gjennomsnittsmodellen, betegnet med MA (1), er (xt mu wt theta1w) Den andre ordens bevegelige gjennomsnittsmodellen, betegnet med MA (2), er (xt mu wt theta1w theta2w) , betegnet med MA (q) er (xt mu wt theta1w theta2w punkter thetaqw) Merknad. Mange lærebøker og programvare definerer modellen med negative tegn før betingelsene. Dette endrer ikke de generelle teoretiske egenskapene til modellen, selv om den ikke flipper de algebraiske tegnene på estimerte koeffisientverdier og (unsquared) termer i formler for ACFer og avvik. Du må sjekke programvaren for å verifisere om negative eller positive tegn har blitt brukt for å skrive riktig estimert modell. R bruker positive tegn i sin underliggende modell, som vi gjør her. Teoretiske egenskaper av en tidsrekkefølge med en MA (1) modell Merk at den eneste ikke-nullverdien i teoretisk ACF er for lag 1. Alle andre autokorrelasjoner er 0. Således er en prøve-ACF med en signifikant autokorrelasjon bare ved lag 1 en indikator på en mulig MA (1) modell. For interesserte studenter er bevis på disse egenskapene et vedlegg til denne utdelingen. Eksempel 1 Anta at en MA (1) modell er x t 10 w t .7 w t-1. hvor (wt overset N (0,1)). Dermed er koeffisienten 1 0,7. Den teoretiske ACF er gitt av Et plott av denne ACF følger. Plottet som nettopp er vist er den teoretiske ACF for en MA (1) med 1 0,7. I praksis vil en prøve vanligvis ikke gi et slikt klart mønster. Ved hjelp av R simulerte vi n 100 prøveverdier ved hjelp av modellen x t 10 w t .7 w t-1 hvor w t iid N (0,1). For denne simuleringen følger en tidsserie-plott av prøvedataene. Vi kan ikke fortelle mye fra denne plottet. Prøven ACF for de simulerte dataene følger. Vi ser en spike i lag 1 etterfulgt av generelt ikke signifikante verdier for lags forbi 1. Merk at prøven ACF ikke samsvarer med det teoretiske mønsteret til den underliggende MA (1), som er at alle autokorrelasjoner for lags forbi 1 vil være 0 . En annen prøve ville ha en litt annen prøve-ACF vist nedenfor, men vil trolig ha de samme brede funksjonene. Terapeutiske egenskaper av en tidsserie med en MA (2) modell For MA (2) modellen er teoretiske egenskaper følgende: Merk at de eneste ikke-nullverdiene i teoretisk ACF er for lags 1 og 2. Autokorrelasjoner for høyere lags er 0 . En ACF med signifikant autokorrelasjoner på lags 1 og 2, men ikke-signifikante autokorrelasjoner for høyere lags indikerer en mulig MA (2) modell. iid N (0,1). Koeffisientene er 1 0,5 og 2 0,3. Fordi dette er en MA (2), vil den teoretiske ACF bare ha null nullverdier ved lags 1 og 2. Verdier av de to ikke-null-autokorrelasjonene er Et plot av teoretisk ACF følger. Som nesten alltid er tilfellet, vil prøvedataene ikke oppføre seg så perfekt som teori. Vi simulerte n 150 utvalgsverdier for modellen x t 10 w t .5 w t-1 .3 w t-2. hvor det er N (0,1). Tidsserien av dataene følger. Som med tidsserien for MA (1) eksempeldata, kan du ikke fortelle mye om det. Prøven ACF for de simulerte dataene følger. Mønsteret er typisk for situasjoner der en MA (2) modell kan være nyttig. Det er to statistisk signifikante pigger på lags 1 og 2 etterfulgt av ikke-signifikante verdier for andre lags. Merk at på grunn av prøvetakingsfeil, samsvarte ACF ikke nøyaktig det teoretiske mønsteret. ACF for General MA (q) Modeller En egenskap av MA (q) - modeller generelt er at det finnes ikke-null autokorrelasjoner for de første q lagene og autokorrelasjonene 0 for alle lagene gt q. Ikke-entydighet av sammenhengen mellom verdier av 1 og (rho1) i MA (1) Modell. I MA (1) - modellen, for en verdi på 1. Den gjensidige 1 1 gir samme verdi. For eksempel, bruk 0,5 for 1. og bruk deretter 1 (0,5) 2 for 1. Du får (rho1) 0,4 i begge tilfeller. For å tilfredsstille en teoretisk begrensning kalt invertibility. vi begrenser MA (1) - modeller for å ha verdier med absolutt verdi mindre enn 1. I eksemplet som er gitt, vil 1 0,5 være en tillatelig parameterverdi, mens 1 10,5 2 ikke vil. Invertibility av MA modeller En MA-modell sies å være invertibel hvis den er algebraisk tilsvarer en konvergerende uendelig rekkefølge AR-modell. Ved konvergering mener vi at AR-koeffisientene reduseres til 0 da vi beveger oss tilbake i tid. Invertibility er en begrensning programmert i tidsserier programvare som brukes til å estimere koeffisientene av modeller med MA termer. Det er ikke noe vi ser etter i dataanalysen. Ytterligere opplysninger om inverterbarhetsbegrensningen for MA (1) - modeller er gitt i vedlegget. Avansert teorienotat. For en MA (q) modell med en spesifisert ACF, er det bare en inverterbar modell. Den nødvendige betingelsen for invertibilitet er at koeffisientene har verdier slik at ligningen 1- 1 y-. - q y q 0 har løsninger for y som faller utenfor enhetens sirkel. R-kode for eksemplene I eksempel 1, plotte vi den teoretiske ACF av modellen x t10 w t. 7w t-1. og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte dataene. R-kommandoene som ble brukt til å plotte den teoretiske ACF var: acfma1ARMAacf (mac (0,7), lag. max10) 10 lag av ACF for MA (1) med theta1 0,7 lags0: 10 skaper en variabel som heter lags som varierer fra 0 til 10. plot (lags, acfma1, xlimc (1,10), ylabr, typh, main ACF for MA (1) med theta1 0,7) abline (h0) legger til en horisontal akse på plottet. Den første kommandoen bestemmer ACF og lagrer den i en gjenstand kalt acfma1 (vårt valg av navn). Plot-kommandoen (den tredje kommandoen) plots lags versus ACF-verdiene for lags 1 til 10. ylab-parameteren merker y-aksen og hovedparameteren setter en tittel på plottet. For å se de numeriske verdiene til ACF, bruk bare kommandoen acfma1. Simuleringen og tomtene ble gjort med følgende kommandoer. xcarima. sim (n150, liste (mac (0.7))) Simulerer n 150 verdier fra MA (1) xxc10 legger til 10 for å gjøre gjennomsnitt 10. Simuleringsstandarder betyr 0. Plot (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF for simulerte prøvedata) I eksempel 2 skisserte vi den teoretiske ACF av modellen xt 10 wt .5 w t-1 .3 w t-2. og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte dataene. R-kommandoene som ble brukt var acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typh, hoved ACF for MA (2) med theta1 0,5, theta20.3) abline (h0) xcarima. sim (n150, liste (mac (0,5, 0,3)) xxc10 plot (x, typeb, hoved Simulert MA (2) Serie) acf (x, xlimc (1,10) mainACF for simulert MA (2) Data) Vedlegg: Bevis på egenskaper av MA (1) For interesserte studenter, her er bevis for teoretiske egenskaper av MA (1) modellen. Varians: (tekst (xt) tekst (mu wt theta1 w) 0 tekst (wt) tekst (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Når h 1, er det forrige uttrykket 1 w 2. For ethvert h 2, . Årsaken er at ved definisjon av uavhengighet av wt. E (w k w j) 0 for noen k j. Videre, fordi w t har middelverdien 0, E (w jw j) E (w j 2) w 2. For en tidsserie, Bruk dette resultatet for å få ACF gitt ovenfor. En inverterbar MA-modell er en som kan skrives som en uendelig rekkefølge AR-modell som konvergerer slik at AR-koeffisientene konvergerer til 0 mens vi beveger oss uendelig tilbake i tiden. Vel demonstrere invertibility for MA (1) modellen. Vi erstatter deretter forholdet (2) for w t-1 i ligning (1) (3) (zt wt theta1 (z-theta1w) wt theta1z-tet2w) Ved tid t-2. (2) blir vi da erstatter forholdet (4) for w t-2 i ligning (3) (zt wt theta1z-teteta21wt theta1z-teteta21 (z-theta1w) wt theta1z-theta12z theta31w) Hvis vi skulle fortsette uendelig), ville vi få den uendelige rekkefølgen AR-modellen (zt wt theta1z - theta21z theta31z - theta41z prikker) Merk imidlertid at hvis 1 1, vil koeffisientene som multipliserer lagene av z, øke (uendelig) i størrelse når vi beveger oss tilbake i tid. For å forhindre dette, trenger vi 1 lt1. Dette er betingelsen for en inverterbar MA (1) modell. Uendelig Order MA-modell I uke 3 ser du at en AR (1) - modell kan konverteres til en uendelig rekkefølge MA-modell: (xt - mu wt phi1w phi21w prikker phik1 w dots sum phij1w) Denne summeringen av tidligere hvite støybetingelser er kjent som årsakssammenheng av en AR (1). Med andre ord, x t er en spesiell type MA med et uendelig antall vilkår som går tilbake i tid. Dette kalles en uendelig ordre MA eller MA (). En endelig ordre MA er en uendelig orden AR og en hvilken som helst endelig rekkefølge AR er en uendelig rekkefølge MA. Tilbakekall i uke 1, bemerket vi at et krav til en stasjonær AR (1) er at 1 lt1. Lar beregne Var (x t) ved hjelp av årsakssammensetningen. Dette siste trinnet bruker et grunnfakta om geometrisk serie som krever (phi1lt1) ellers ser serien ut. Navigasjon5.2 Utjevning av tidsserie Utjevning gjøres vanligvis for å hjelpe oss med å se mønstre, trender for eksempel i tidsserier. Vanligvis jevne ut uregelmessig grovhet for å se et klarere signal. For sesongdata kan vi jevne ut sesongmessigheten slik at vi kan identifisere trenden. Utjevning gir oss ikke en modell, men det kan være et godt første skritt i å beskrive ulike komponenter i serien. Termen filter er noen ganger brukt til å beskrive en utjevning prosedyre. For eksempel, hvis den glatte verdien for en bestemt tid beregnes som en lineær kombinasjon av observasjoner for omgivende tider, kan det sies at vi har anvendt et lineært filter på dataene (ikke det samme som å si at resultatet er en rett linje, ved veien). Den tradisjonelle bruken av begrepet glidende gjennomsnitt er at vi ved hvert tidspunkt bestemmer (muligens vektet) gjennomsnitt av observerte verdier som omgir en bestemt tid. For eksempel, på tidspunktet t. et sentrert glidende gjennomsnitt av lengde 3 med likevekter ville være gjennomsnittet av verdier til tider t -1. t. og t1. For å ta bort sesongbestemte fra en serie, så vi bedre kan se trenden, ville vi bruke et glidende gjennomsnitt med en lengde sesongkurs. Således i den glatte serien har hver glatt verdi vært gjennomsnittsvis over alle årstider. Dette kan gjøres ved å se på et ensidig glidende gjennomsnitt der du gjennomsnittlig alle verdier for de foregående årene er verdt data eller et sentrert glidende gjennomsnitt der du bruker verdier både før og etter gjeldende tid. For kvartalsdata kan vi for eksempel definere en glatt verdi for tiden t som (x t x t-1 x t-2 x t-3) 4, gjennomsnittet av denne tiden og de foregående 3 kvartaler. I R-kode vil dette være et ensidig filter. Et sentrert glidende gjennomsnitt skaper litt vanskelig når vi har et jevnt antall tidsperioder i sesongperioden (som vi vanligvis gjør). Å glatte bort sesongmessige forhold i kvartalsdata. For å identifisere trenden, er den vanlige konvensjonen å bruke det glidende gjennomsnittet jevnt på tiden. For å glatte bort sesongmessigheten i månedlige data. For å identifisere trenden er den vanlige konvensjonen å bruke det glidende gjennomsnittet jevnt på tidspunktet t er Det er at vi bruker vekt 124 til verdier til tider t6 og t6 og vekt 112 til alle verdier til enhver tid mellom t5 og t5. I R-filter-kommandoen, velg et tosidig filter når vi vil bruke verdier som kommer både før og etter tiden som ble utjevning. Merk at på side 71 i vår bok gjelder forfatterne likevekt over et sentrert sesongmessig glidende gjennomsnitt. Det er ok også. For eksempel kan en kvartalsvisere glattes på tid t er frac x frac x frac xt frac x frac x En månedlig glattere kan legge vekt på 113 til alle verdier fra tidene t-6 til t6. Koden forfatterne bruker på side 72 utnytter en rep-kommando som gjentar en verdi et visst antall ganger. De bruker ikke filterparameteren i filterkommandoen. Eksempel 1 Kvartalsbierproduksjon i Australia I både Leksjon 1 og Leksjon 4 så vi på en serie kvartalsvis ølproduksjon i Australia. Følgende R-kode skaper en glatt serie som lar oss se trendmønsteret, og plotter dette trendmønsteret på samme graf som tidsserien. Den andre kommandoen lager og lagrer den glatte serien i objektet som kalles trendpattern. Vær oppmerksom på at i filterkommandoen gir parameteren som heter filteret koeffisientene for utjevning og side 2 forårsaker en sentrert glatt å beregnes. ølprodskanning (beerprod. dat) trendpatternfilter (ølprod, filter c (18, 14, 14, 14, 18), sider2) plot (ølprod, type b, hovedgjenværende gjennomsnittlig årlig trend) linjer (trendpattern) Heres resultatet: Vi kan trekke trendmønsteret fra dataverdiene for å få bedre koll på seasonality. Heres hvordan det skulle gjøres: årstidens ølprod - trendpattern plot (årstid, type b, viktigste sesongmønster for ølproduksjon) Resultatet følger: En annen mulighet for utjevning av serier for å se trenden er filteret Trendpattern2 filter (ølprod, filter c (14, 14, 14, 14), sider1) Med denne er den glatte verdien gjennomsnittet for det siste året. Eksempel 2. US Månedlig Arbeidsledighet I leksene for uke 4 så du på en månedlig serie av arbeidsledighet i USA for 1948-1978. Heres en utjevning gjort for å se på trenden. trendunemployfilter (unemployed, filterc (124,112,112,112,112,112,112,112,112,112,112,112,124), sider2) trendunemploy ts (trendunemploy, start c (1948,1), freq 12) plot (trendunemploy, mainTrend i USAs arbeidsledighet, 1948-1978, xlab Year) Bare den glatte trenden er plottet. Den andre kommandoen identifiserer kalendertidskarakteristikkene til serien. Det gjør at plottet har en mer meningsfull akse. Plottet følger. For ikke-sesongbaserte serier, er du bundet til å glatte over et bestemt spekter. For utjevning bør du eksperimentere med bevegelige gjennomsnitt av forskjellige spenner. Disse tidsforløpene kan være relativt korte. Målet er å slå av grove kanter for å se hvilken trend eller mønster som kan være der. Andre utjevningsmetoder (Avsnitt 2.4) Avsnitt 2.4 beskriver flere sofistikerte og nyttige alternativer for å flytte gjennomsnittlig utjevning. Detaljer kan virke sketchy, men det er greit fordi vi ikke ønsker å bli skrudd ned i mange detaljer for disse metodene. Av de alternative metodene som er beskrevet i avsnitt 2.4, kan lowess (lokalt vektet regresjon) være den mest brukte. Eksempel 2 Fortsatt Følgende tomt er en jevn trendlinje for den amerikanske arbeidsledighetsserien, funnet ved hjelp av en lavest jevnere hvor en betydelig mengde (23) bidro til hvert glatt estimat. Legg merke til at dette jevnet serien mer aggressivt enn det bevegelige gjennomsnittet. Kommandoene som ble brukt var arbeidsledige (arbeidsløs, start c (1948,1), freq12) plot (lowess (unemployed, f 23), den viktigste Lowess utjevning av USAs arbeidsledighetstrend) Enkelt eksponensiell utjevning Den grunnleggende prognose-ligningen for enkelt eksponensiell utjevning er ofte gitt som hat alfa xt (1-alfa) hat t-tekst Vi forutsier verdien av x på tidspunktet t1 som en vektet kombinasjon av den observerte verdien ved tid t og den prognostiserte verdien ved tid t. Selv om metoden kalles en utjevningsmetode, brukes den hovedsakelig til prognose for korttid. Verdien av kalles utjevningskonstanten. Uansett grunn er 0,2 et populært standardvalg av programmer. Dette legger en vekt på .2 på den siste observasjonen og en vekt på 1, 2, 8 på den siste prognosen. Med en relativt liten verdi vil utjevningen bli relativt mer omfattende. Med en relativt stor verdi er utjevningen relativt mindre omfattende, da mer vekt vil bli lagt på den observerte verdien. Dette er en enkel fremgangsmetode for fremgangsmåtene som ved første øyekast ikke ser ut til å kreve en modell for dataene. Faktisk svarer denne metoden til bruk av en ARIMA (0,1,1) modell uten konstant. Den optimale prosedyren er å passe en ARIMA (0,1,1) modell til det observerte datasettet og bruke resultatene til å bestemme verdien av. Dette er optimalt i den hensikt å skape det beste for dataene som allerede er observert. Selv om målet er utjevning og ett steg fremover prognoser, gir ekvivalensen til ARIMA (0,1,1) - modellen et godt poeng. Vi bør ikke blindt bruke eksponensiell utjevning fordi den underliggende prosessen kanskje ikke er godt modellert av en ARIMA (0,1,1). ARIMA (0,1,1) og eksponensiell utjevningseffektivitet Vurder en ARIMA (0,1,1) med gjennomsnittlig 0 for de første forskjellene, xt - x t-1: start hatten amp amp xt theta1 wt amp amp xt theta1 (xt - som t) amp amp (1 theta1) xt-theta1hat tendens. Hvis vi lar (1 1) og dermed - (1) 1, ser vi ekvivalensen til ligning (1) ovenfor. Hvorfor metoden kalles eksponensiell utjevning Dette gir følgende: start hodes amp amp alpha xt (1-alfa) alpha x (1-alfa) hue forsterker forsterker alfa xt alfa (1-alfa) x (1-alfa) på denne måten ved suksessivt å erstatte den prognostiserte verdien på høyre side av ligningen. Dette fører til: hat alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x prikker alfa (1-alfa) jx prikker alfa (1-alfa) x1-tekst Ekvation 2 viser at prognosen er et veid gjennomsnitt av alle tidligere verdier av serien, med eksponentielt endrede vekter når vi beveger oss tilbake i serien. Optimal eksponensiell utjevning i R I utgangspunktet passer vi bare en ARIMA (0,1,1) til dataene og bestemmer koeffisienten. Vi kan undersøke passformen til glatt ved å sammenligne de anslåtte verdiene til den faktiske serien. Eksponensiell utjevning har en tendens til å bli brukt mer som et prognoseverktøy enn en ekte glattere, så var ser for å se om vi har en god passform. Eksempel 3. n 100 månedlige observasjoner av logaritmen til en oljeprisindeks i USA. Datarien er: En ARIMA (0,1,1) passform i R ga en MA (1) koeffisient 0,3877. Dermed (11) 1.3877 og 1-0.3877. Den eksponensielle utjevningsprognosekvasjonen er hue 1.3877xt - 0.3877hat t Ved tid 100 er den observerte verdien av serien x 100,86601. Forventet verdi for serien på den tiden er dermed prognosen for tid 101 er lue 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 Følgende er hvor bra den jevnere passer til serien. Det er en god passform. Det er et godt tegn på prognoser, hovedformålet med dette jevnere. Her er kommandoene som brukes til å generere produksjonen for dette eksempelet: oilindex scan (oildata. dat) plot (oilindex, type b, hovedlogg for oljeindeksserie) expsmoothfit arima (oilindex, rekkefølge c (0,1,1)) expsmoothfit for å se arima-resultatene forutsetter oljeprisen - expsmoothfitresiduals predicted values plot (oilindex, typeb, hoved eksponensiell utjevning av logg av oljeindeks) linjer (forutsigbar) 1.3877oilindex100-0.3877predicteds100 prognose for tid 101 Dobbelt eksponensiell utjevning Dobbelt eksponensiell utjevning kan brukes når det er trend (enten langsiktig eller kort sikt), men ingen sesongmessighet. I hovedsak oppretter metoden en prognose ved å kombinere eksponentielt glattestimater av trenden (helling av en rett linje) og nivået (i utgangspunktet avskjæringen av en rett linje). To forskjellige vekter eller utjevningsparametere brukes til å oppdatere disse to komponentene hver gang. Det glatte nivået er mer eller mindre ekvivalent med en enkel eksponensiell utjevning av dataverdiene, og den glatte trenden er mer eller mindre ekvivalent med en enkel eksponensiell utjevning av de første forskjellene. Prosedyren svarer til å montere en ARIMA (0,2,2) modell, uten konstant det kan utføres med en ARIMA (0,2,2) passform. (1-B) 2 xt (1 teta1B theta2B2) vekt. NavigationSmoothing-data fjerner tilfeldig variasjon og viser trender og sykliske komponenter Inherent i samlingen av data tatt over tid er en form for tilfeldig variasjon. Det finnes metoder for å redusere avbryte effekten på grunn av tilfeldig variasjon. En ofte brukt teknikk i industrien er utjevning. Denne teknikken, når den brukes riktig, viser tydeligere den underliggende trenden, sesongmessige og sykliske komponenter. Det er to forskjellige grupper av utjevningsmetoder. Midlere metoder Eksponensielle utjevningsmetoder Gjennomsnitt er den enkleste måten å glatte data på. Vi vil først undersøke noen gjennomsnittsmetoder, for eksempel det enkle gjennomsnittet av alle tidligere data. En leder av et lager ønsker å vite hvor mye en typisk leverandør leverer i 1000 dollar-enheter. Heshe tar et utvalg av 12 leverandører, tilfeldig, og oppnår følgende resultater: Beregnet gjennomsnitt eller gjennomsnitt av dataene 10. Lederen bestemmer seg for å bruke dette som estimat for utgifter til en typisk leverandør. Er dette et bra eller dårlig estimat Mean squared feil er en måte å dømme hvor bra en modell er. Vi skal beregne den gjennomsnittlige kvadratfeilen. Feil sant beløp brukt minus estimert beløp. Feilen squared er feilen ovenfor, firkantet. SSE er summen av kvadratfeilene. MSE er gjennomsnittet av de kvadratiske feilene. MSE-resultater for eksempel Resultatene er: Feil og kvadratfeil Estimatet 10 Spørsmålet oppstår: kan vi bruke gjennomsnittet til å prognostisere inntekt hvis vi mistenker en trend. En titt på grafen nedenfor viser tydelig at vi ikke bør gjøre dette. Gjennomsnittlig veier alle tidligere observasjoner likt Sammendrag oppgir vi at Det enkle gjennomsnittet eller gjennomsnittet av alle tidligere observasjoner er bare et nyttig estimat for prognoser når det ikke er noen trender. Hvis det er trender, bruk ulike estimater som tar hensyn til trenden. Gjennomsnittet veier alle tidligere observasjoner likt. For eksempel er gjennomsnittet av verdiene 3, 4, 5 4. Vi vet selvsagt at et gjennomsnitt beregnes ved å legge til alle verdiene og dividere summen med antall verdier. En annen måte å beregne gjennomsnittet på er å legge til hver verdi dividert med antall verdier, eller 33 43 53 1 1.3333 1.6667 4. Multiplikatoren 13 kalles vekten. Generelt: bar frac sum venstre (frac høyre) x1 venstre (frac høyre) x2,. ,, venstre (frac høyre) xn. Den (venstre (frac høyre)) er vektene, og selvfølgelig summen de til 1.

Fabrikk forex Elverum

Search This Blog

Flytte Gjennomsnittet Of Time Serien

Comments

Post a Comment

Popular posts from this blog

La Comptabilisation Des Aksjeopsjoner

Forex Wlan Driver

Kortsiktig Forex Trading Strategi