Tuesday, 28 November 2017

Keskitetty Liikkuvan Keskiarvon In R


Keskimääräiset liikkeet Siirtyvät keskiarvot Tavallisten datasetien keskimääräinen arvo on usein ensimmäinen ja yksi hyödyllisimmistä yhteenvetotietojen laskemisesta. Kun tieto on aikasarjan muodossa, sarjaväylä on hyödyllinen toimenpide, mutta se ei heijasta tietojen dynaamista luonnetta. Keskimääräiset arvot, jotka lasketaan oikaistuneiden jaksojen aikana, joko ennen nykyistä ajanjaksoa tai keskittyneet nykyiseen kauteen, ovat usein hyödyllisimpiä. Koska tällaiset keskiarvot vaihtelevat tai liikkuvat, koska nykyinen kausi siirtyy ajasta t2, t3 jne., Ne tunnetaan liikkuvina keskiarvona (Mas). Yksinkertainen liikkuva keskiarvo on (tyypillisesti) k ennalta annettujen arvojen painottamaton keskiarvo. Eksponentiaalisesti painotettu liikkuva keskiarvo on oleellisesti sama kuin yksinkertainen liukuva keskiarvo, mutta keskimääräinen painotus niiden läheisyydessä nykyiseen aikaan. Koska ei ole yhtä, vaan koko joukko liikkuvia keskiarvoja millekään tietylle sarjalle, Mas-sarjaa voidaan itse piirtää graafeilla, analysoida sarjana ja käyttää mallinnuksessa ja ennusteessa. Malleja voidaan rakentaa käyttämällä liikkuvia keskiarvoja, ja niitä kutsutaan MA-malleiksi. Jos tällaisia ​​malleja yhdistetään autoregressiivisiin (AR) malleihin, syntyvät komposiittimallit tunnetaan ARMA - tai ARIMA-malleiksi (I on integroitu). Yksinkertaiset liikkuvat keskiarvot Koska aikasarjaa voidaan pitää arvojen joukona, t 1,2,3,4, n näiden arvojen keskiarvo voidaan laskea. Jos oletamme, että n on melko suuri, ja valitaan kokonaisluku k, joka on paljon pienempi kuin n. voimme laskea joukon lohkojen keskiarvoja tai yksinkertaisia ​​liikkuvia keskiarvoja (tilauksesta k): Jokainen mitta edustaa datajoukon keskiarvoa k-havaintojen väliin. Huomaa, että ensimmäinen mahdollinen järjestyskäsky k gt0 on tk: lle. Yleisemmin voimme pudottaa ylimääräisen indeksin yllä oleviin ilmentymiin ja kirjoittaa: Tämä kertoo, että arvioitu keskiarvo ajankohtana t on havaitun arvon yksinkertainen keskiarvo ajankohtana t ja edeltävät k-1-vaiheet. Jos käytetään painoja, jotka vähentävät havaintomäärän kauempana olevia osuuksia, liikkuvan keskiarvon sanotaan olevan eksponentiaalisesti tasoitettu. Keskimääriä siirretään usein ennusteiden muodossa, jolloin sarjan arvioitu arvo hetkellä t 1, S t1. pidetään MA: ksi ajanjaksoon t ja siihen asti. esim. nykypäivän arvion mukaan keskiarvo ennalta kirjattujen arvojen päivämääristä (päivittäisiin tietoihin asti) mukaan lukien. Yksinkertaisia ​​liukuvia keskiarvoja voidaan nähdä tasoitusmuodoksi. Seuraavassa esimerkissä ilmaa aiheuttavan ilman pilaantumatietokantaan on lisätty 7 päivän liukuva keskiarvo (MA), joka on tässä punaisella. Kuten voidaan nähdä, MA-linja tasoittaa datan huiput ja kourut ja voi olla erittäin hyödyllistä tunnistaa suuntaukset. Tavallinen laskentataulukko tarkoittaa, että ensimmäisillä k-1-pisteillä ei ole MA-arvoa, mutta tämän jälkeen laskelmat ulottuvat sarjan lopulliseen datapisteeseen. PM10 päivittäiset keskiarvot, Greenwichin lähde: London Air Quality Network, londonair. org. uk Yksi syy yksinkertaisten liikkuvien keskiarvojen laskemiseen kuvatulla tavalla on se, että se mahdollistaa arvojen laskemisen kaikkien aikavälien osalta ajasta tk aina tähän asti. kun uutta mittausta saadaan ajasta t 1, ajastimelle MA voidaan lisätä jo laskettu joukko. Tämä tarjoaa yksinkertaisen menettelyn dynaamisille datasetsille. Tällä lähestymistavalla on kuitenkin joitakin ongelmia. On järkevää väittää, että keskimääräinen arvo viimeisten kolmen jakson aikana pitäisi olla ajan hetkellä t -1 eikä aika t. ja MA: lle parillisen määräjaksojen aikana, ehkä se olisi sijoitettava keskipisteen väliin kahden aikajakson välillä. Ratkaisu tähän kysymykseen on käyttää keskitettyjä MA-laskelmia, joissa MA on ajankohtana t symmetrisen arvoryhmän keskiarvoa ympärillä t. Huolimatta sen ilmeisistä ansioista, tätä lähestymistapaa ei yleisesti käytetä, koska se edellyttää, että saatavilla on tietoja tulevista tapahtumista, mikä ei ehkä ole. Jos analyysi on kokonaan olemassa olevasta sarjasta, keskitetyn Mas-mallin käyttö voi olla edullista. Yksinkertaisia ​​liikkuvia keskiarvoja voidaan pitää tasoitusmuodona, poistaa joitain aikasarjojen korkeataajuisia komponentteja ja korostaa (mutta ei poistaa) trendejä samalla tavoin kuin digitaalisen suodatuksen yleinen käsitys. Itse asiassa liukuvat keskiarvot ovat lineaarisen suodattimen muoto. On mahdollista soveltaa liikkuvan keskimääräisen laskennan jo tasoitettuun sarjaan, ts. Tasoittamalla tai suodattamalla jo tasoitettua sarjaa. Esimerkiksi järjestyksessä 2 liikkuvan keskiarvon perusteella voimme pitää sitä laskettaessa painojen mukaan, joten MA: ssa x 2: ssa 0,5 x 1 0,5 x 2. Samalla MA: lla x 3: lla 0,5 x 2 x 0,5 x 3. Jos me (0,5 x 2 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 eli 2-vaiheinen suodatus prosessi (tai konvoluutio) on tuottanut vaihtelevan painotetun symmetrisen liukuvan keskiarvon painoilla. Useat konvoluutiot voivat tuottaa varsin monimutkaisia ​​painotettuja liikkuvia keskiarvoja, joista osa on todettu erityisen käyttökelpoisiksi erikoistuneilla aloilla, kuten henkivakuutuslaskelmissa. Siirrettäviä keskiarvoja voidaan käyttää jaksoittaisten vaikutusten poistamiseen, jos lasketaan jaksollisuuden pituudella tunnetuksi. Esimerkiksi kuukausittaiset tiedot kausivaihteluista voidaan usein poistaa (jos tämä on tavoite) soveltamalla symmetristä 12 kuukauden liukuvaa keskiarvoa kaikkien kuukausien painotettuna yhtä suureksi, paitsi ensimmäiset ja viimeiset, jotka painotetaan 12: lla. Tämä johtuu siitä, että olla 13 kuukautta symmetrisessä mallissa (nykyinen aika, t. - 6 kuukautta). Kokonaismäärä jaetaan 12: llä. Samanlaiset menettelyt voidaan toteuttaa mille tahansa hyvin määritellylle jaksolle. Eksponentiaalisesti painotetut liikkuvat keskiarvot (EWMA) Yksinkertaisella liikkuva keskiarvolla: kaikki havainnot ovat yhtä painotettuja. Jos kutsuttiin nämä yhtä suuret painot, alpha t. kukin k-paino olisi 1 k. joten painojen summa olisi 1 ja kaava olisi: Olemme jo nähneet, että tämän prosessin useat sovellukset johtavat painoihin vaihtelevasti. Eksponentiaalisesti painotetuilla liikkuvilla keskiarvoilla harkitaan vähentyneiden havaintojen keskimääräistä vaikutusta, mikä korostaa viimeaikaisia ​​(paikallisia) tapahtumia. Pohjimmiltaan tasoitusparametri, 0lt alpha lt1, otetaan käyttöön ja kaava tarkistetaan: Tämän kaavan symmetrinen versio olisi muotoa: Jos symmetrisessä mallissa olevat painot valitaan binomialgian ehtojen termeiksi, (1212) 2q. ne summaavat 1: ksi, ja koska q tulee suureksi, se vastaa likimääräistä jakautumista. Tämä on ytimen painotuksen muoto, jossa binomiomi toimii ydinfunktiossa. Edellisessä kappaleessa kuvattu kaksiportainen konvoluutio on juuri tämä järjestely, jossa q 1, jolloin painot saadaan. Eksponentiaalisessa tasoituksessa on käytettävä joukko painoja, jotka summaavat 1 ja jotka pienentävät kokoa geometrisesti. Käytetyt painot ovat tyypillisesti muotoa: Näiden painojen summana 1: ksi katsotaan 1: n laajeneminen sarjaksi. Voimme kirjoittaa ja laajentaa ilmaisua suluissa binomi-kaavalla (1- x) p. jossa x (1-) ja p-1, joka antaa: Tämä muodostaa muodon painotetun liukuvan keskiarvon: Tämä summaus voidaan kirjoittaa uudelleenkorjaussuhteeksi, joka yksinkertaistaa laskennan suuresti ja välttää ongelman, tulisi olla ehdottomasti ääretön painojen summana 1: een (alfa-arvojen pienet arvot, tämä ei yleensä ole tapaus). Eri kirjoittajien käyttämä notaatio vaihtelee. Jotkut käyttävät kirjainta S osoittaen, että kaava on olennaisesti tasoitettu muuttuja ja kirjoittaa: kun taas ohjausteoria kirjallisuus käyttää usein Z: tä pikemmin kuin S: n eksponentiaalisesti painotettuja tai tasoitettuja arvoja (katso esimerkiksi Lucas ja Saccucci, 1990, LUC1 , ja NIST verkkosivuilla lisätietoja ja toiminut esimerkit). Edellä mainitut kaavat johtuvat Robertsin työstä (1959, ROB1), mutta Hunter (1986, HUN1) käyttää muotoilua, joka voi olla sopivampi käytettäväksi joissakin valvontatoimenpiteissä. Alfa 1: n keskiarvo on yksinkertaisesti sen mitattu arvo (tai edellisen tietoerän arvo). 0,5: llä arvio on nykyisen ja edellisen mittauksen yksinkertainen liukuva keskiarvo. Ennustemalleissa arvo S t. käytetään usein ennustearvona tai ennustearvona seuraavalle ajanjaksolle, eli x: n arvoksi t hetkellä t 1. Näin ollen: Tämä osoittaa, että ennustearvo ajankohtana t 1 on edellisen eksponentiaalisesti painotetun liukuvan keskiarvon sekä komponentti, joka edustaa painotettua ennustevirhettä, epsilon. ajankohtana t. Olettaen, että aikasarja on annettu ja tarvitaan ennuste, tarvitaan alfa-arvo. Tämä voidaan arvioida olemassa olevista tiedoista arvioimalla neliön ennustevirheiden summa saadaan alfa-arvon vaihtelevilla arvoilla kullakin t 2,3: llä. ensimmäisen arvion asettaminen ensimmäiseksi havainnoiduksi datan arvoksi x 1. Ohjaussovelluksissa alfa-arvo on tärkeä, sillä sitä käytetään ylemmän ja alemman kontrollin rajojen määrittämisessä ja vaikuttaa odotettuun keskimääräiseen ajon pituuteen (ARL) ennen kuin nämä valvontarajat rikkoutuvat (olettaen, että aikasarja edustaa joukkoa satunnaisia, identtisesti jakamia riippumattomia muuttujia, joilla on yhteinen varianssi). Näissä olosuhteissa kontrollitilaston varianssi on: (Lucas ja Saccucci, 1990): Ohjausrajat asetetaan tavallisesti tällaisen asymptoottisen varianssien kiinteiksi kerrannaisiksi, esim. - 3-kertainen keskihajonta. Jos esim. Alfa-arvoa 0,25 ja valvottavaa dataa oletetaan olevan normaali jakautuma, N (0,1), kun kontrollissa ohjausrajat ovat - 1,134 ja prosessi saavuttaa yhden tai useamman rajan 500 vaiheessa keskimäärin. Lucas ja Saccucci (1990 LUC1) tuottavat ARL-arvot monille alfa-arvoille ja erilaisissa olettamuksissa käyttäen Markovin ketjumenetelmiä. Ne tulostavat taulukot, mukaan lukien ARL: ien tarjoaminen, kun kontrolliprosessin keskiarvo on siirretty keskiarvon muutaman kerran. Esimerkiksi 0,5-siirtymällä alfa 0,25: lla ARL on alle 50 aikaportaat. Yllä kuvatut lähestymistavat tunnetaan yhtenä eksponentiaalisena tasoituksena. koska menetelmiä sovelletaan kerran aikasarjaan ja sitten analysoidaan tai ohjataan prosesseja tuloksena olevalla tasoitetulla tietosarjalla. Jos datasarja sisältää trendin ja tai kausittaiset komponentit, voidaan käyttää kahden tai kolmen vaiheen eksponentiaalisia tasoituksia näiden vaikutusten poistamista (eksplisiittisesti mallinnusta varten) (katso tarkemmin alla oleva ennakointi ja esimerkki NIST: stä). CHA1 Chatfield C (1975) Times-sarjan analyysi: teoria ja käytäntö. Chapman ja Hall, London HUN1 Hunter J S (1986) Eksponentiaalisesti painotettu liukuva keskiarvo. J, Quality Technology, 18, 203 - 210 LUC1 Lucas J M, Saccucci M S (1990) Eksponentiaalisesti painotetut keskimääräiset siirtojärjestelmät: Ominaisuudet ja parannukset. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrollikartatutkimukset Geometristen liikuttavien keskiarvojen perusteella. Technometrics, 1, 239-2505.2 Smoothing Time Series Smoothing on yleensä tehty auttamaan meitä paremmin nähdä kuvioita, suuntauksia esimerkiksi aikasarjassa. Yleisesti sileä epäsäännöllinen karheus nähdäksesi selkeämmän signaalin. Kausittaisia ​​tietoja voisimme sopeuttaa kausivaihtelun, jotta voimme tunnistaa trendin. Tasoitus ei tarjoa meille mallia, mutta se voi olla hyvä ensimmäinen askel sarjan eri osien kuvaamisessa. Termi suodatinta käytetään joskus kuvaamaan tasoitustoimenpidettä. Jos esimerkiksi tietyn ajan tasoitettu arvo lasketaan lineaarisena yhdistelmänä ympäröivien aikojen havainnoista, voidaan sanoa, että weve käytti lineaarista suodatinta dataan (ei sama kuin sanoo, että tulos on suora, tapa). Käänteessä liikkuvan keskiarvon perinteinen käyttö on se, että jokaisella ajanhetkellä määritämme tietyn ajan ympäröivien havaittujen arvojen (mahdollisesti painotetut) keskiarvot. Esimerkiksi hetkellä t. keskimääräinen pituus 3 keskimääräinen keskimääräinen keskimääräinen painoarvo olisi arvojen keskiarvo ajankohtana t -1. t. ja t1. Jos haluat poistaa kausiluonteisuuden sarjasta, niin voimme nähdä paremmin trendin, käytämme liikkuvaa keskiarvoa pitkien kausivaihteluiden kanssa. Siksi tasoitetussa sarjassa jokainen tasoitettu arvo on laskettu keskiarvon ympäri kaikkina vuodenaikoina. Tämä voidaan tehdä tarkastelemalla yksipuolista liukuvaa keskiarvoa, jossa keskität kaikki arvot edellisten vuosien arvosta tai keskitetty liikkuva keskiarvo, jossa käytät arvoja sekä ennen että sen jälkeen. Esimerkiksi neljännesvuositietoihin voitiin määritellä tasoitettu arvo ajaksi t (x t x t-1 x t-2 x t-3) 4, tämän ajan keskiarvo ja edelliset kolme neljäsosaa. R-koodissa tämä on yksipuolinen suodatin. Keskitetty liukuva keskiarvo luo hieman vaikeuksia, kun meillä on parillinen määrä kausia (kuten tavallisesti). Kausittaisuuden lieventäminen neljännesvuosittain. trendin tunnistamiseksi tavanomainen käytäntö on liikuttaa liukuva keskiarvo tasoitettuna ajankohtana t on Kuukausitietoisuuden tasaus kausivaihteluista. Jotta tavoite tunnistettaisiin, tavanomainen käytäntö on liikuttaa liukuva keskiarvo tasoitettuna ajanhetkellä t. Käytämme painoa 124 arvoihin ajankohtana t6 ja t6 ja painon 112 kaikkien arvojen kanssa aina t5: n ja t5: n välillä. R-suodattimessa määritä hyvin kaksipuolinen suodatin, kun haluamme käyttää arvoja, jotka tulevat sekä ennen että jälkeen, jolloin ne olivat tasoituksia. Huomaa, että kirjan sivulla 71 kirjoittajat käyttävät samaa painoa keskitetyn kausiluonteisen liukuvan keskiarvon kesken. Se onkin kunnossa. Esimerkiksi neljännesvuorisen pehmeämpi voi olla tasoitettu aikaan t on frac x frac x frac xt frac x frac x Kuukausittain pehmeä voi käyttää painoa 113 kaikkiin arvoihin kertaa t-6 t6. Tekijän käyttämä koodi sivulla 72 hyödyntää rep-komentoa, joka toistaa arvon tietyn määrän kertoja. He eivät käytä suodatusparametria suodatinkomennossa. Esimerkki 1 Australiassa neljännesvuoden oluen tuotanto Tarkastelimme sekä oppituntien 1 että 4 oppitunteja neljännesvuosittaisen oluen tuotantoa Australiassa. Seuraava R-koodi luo tasoitetun sarjan, jonka avulla voimme nähdä trendikuviot ja piirtää tämän trendikuvan samaan kaavioon kuin aikasarja. Toinen komento luo ja tallentaa tasoitetun sarjan objektiin, jota kutsutaan trendipohjaksi. Huomaa, että suodatinkomennolla parametri nimeltä suodatin antaa kertoimet tasoitukselle ja sivut 2 aiheuttaa keskitetyn tasaisen laskemisen. (beerprod. dat) trendivälin suodatin (beerprod, suodatin c (18, 14, 14, 14, 18), sivut2) juoni (beerprod, tyyppi b, voi vähentää trenditiedon datan arvoista saadakseen paremman kausiluonteisuuden. Ehdottomasti tämä tapahtuisi: kausityöt beerprod - suuntausmalli (kausiluonteisuus, tyyppi b, tärkein kausittainen kaavoitus oluen tuotantoa varten) Tulos seuraa: Toinen mahdollisuus tasoitussarjan näkemiseen on yksipuolinen suodattimen trendivaihtelu2 suodatin (beerprod, suodatin c (14, 14, 14, 14), sivut1) Tämän avulla tasoitettu arvo on viimeisen vuoden keskiarvo. Esimerkki 2. Yhdysvaltain kuukausittainen työttömyys Viikon 4 kotitehtävissä tarkastit kuukausittaista Yhdysvaltain työttömyyden sarjaa 1948-1978. Tässä on tasoitus, joka on tehty trendin tarkastelemiseksi. trendunemployfilter (työttömät, filterc (124,112,112,112,112,112,112,112,112,112,112,112,124), sivut2) suuntausnäytöt (trendunemploy, alku c (1948,1), freq 12) tontti (trendunemploy, mainTrend Yhdysvalloissa työttömyydestä, 1948-1978, xlabvuosi) Toinen komento yksilöi sarjan kalenterin aikaominaisuudet. Tällöin tontilla on mielekkäämpi akseli. Tontti seuraa. Muun kuin kausittaisen sarjan osalta et voi sopeutua mihinkään tiettyyn span. Tasoituksen suhteen sinun tulisi kokeilla eri liukuluvuilla liikkuvia keskiarvoja. Nämä ajanjaksot voivat olla suhteellisen lyhyitä. Tavoitteena on irrottaa karkeat reunat nähdäksesi mikä suuntaus tai kuvio voi olla siellä. Muut tasoitustekniikat (luku 2.4) Kappaleessa 2.4 kuvataan useita kehittyneitä ja hyödyllisiä vaihtoehtoja keskimääräisen liikkumisen liikkumiseen. Yksityiskohtia voi tuntua houkuttelevalta, mutta se on okei, koska emme halua heikentää paljon yksityiskohtia näistä menetelmistä. Vaiheessa 2.4 kuvatuista vaihtoehtoisista menetelmistä voi olla yleisimmin käytetty alentuma (paikallisesti painotettu regressio). Esimerkki 2 Jatkuu Seuraavassa kuvassa on tasoitettu trendilinja Yhdysvaltain työttömyyssarjasta, joka löytyy alentuneisuuden tasoituksesta, jossa huomattava määrä (23) vaikutti jokaiseen tasoitettuun arvioon. Huomaa, että tämä tasoitti sarjan aggressiivisemmin kuin liikkuva keskiarvo. Käytetyt komennot olivat työttömät (työttömät, alku c (1948,1), freq12) tontti (työttömyysaste, f 23), Yhdysvaltain työttömyyskysynnän päävähennys) Yksittäisen eksponentiaalisen tasoituksen taso Yksittäisen eksponenttien tasoituksen perusennusteen yhtälö on usein annetaan hattuna alfa xt (1-alfa) hattu t teksti Ennusteessa x: n arvon ajanhetkellä t1 on painotettu yhdistelmä havaitusta arvosta hetkellä t ja ennustettu arvo ajankohtana t. Vaikka menetelmää kutsutaan tasoitusmenetelmäksi, sitä käytetään lähinnä lyhytaikaiseen ennusteeseen. Arvoa kutsutaan tasoitusvakiona. Mistä tahansa syystä, 0.2 on suosittu ohjelmien valinta. Tämä asettaa viimeisimmän havainnon perusteella paino 0,2. Ja viimeisimmän ennusteen paino 1,2 .8. Suhteellisen pienellä arvolla tasoitus on suhteellisen laajempi. Suhteellisen suurella arvolla tasoitus on suhteellisen vähäistä, kun havaitulle arvolle asetetaan enemmän painoa. Tämä on yksinkertainen yksiportainen ennakointimenetelmä, joka ensi silmäyksellä ei näytä edellyttävän datan mallia. Itse asiassa tämä menetelmä vastaa ARIMA (0,1,1) - mallin käyttämistä ilman vakiota. Optimaalinen menettely on ARIMA (0,1,1) mallin sovittaminen havaittuun datasarjaan ja tulosten käyttäminen määritettäessä arvoa. Tämä on optimaalinen siinä mielessä, että parhaana voidaan luoda jo havaitut tiedot. Vaikka tavoitteena on tasoittaminen ja ennustaminen eteenpäin, ARIMA (0,1,1) - mallin vastaavuus tuo mukanaan hyvän pisteen. Emme saisi sokeasti soveltaa eksponentiaalisia tasoituksia, koska ARIMA (0,1,1) ei ehkä mallinnut taustalla olevaa prosessia. ARIMA (0,1,1) ja eksponentiaalisen tasoituksen ekvivalenssi Harkitse ARIMA (0,1,1) keskiarvoilla 0 ensimmäisille eroille, xt - x t-1: aloittaa hampun vahvistimen xt theta1 wt amp ampxtxt (xt - niin t) amp amp (1 theta1) xt - theta1hat yleensä. Jos annamme (1 1) ja siten - (1) 1, näemme vastaavuuden edellä olevaan yhtälöön (1). Miksi menetelmää kutsutaan eksponentiaaliseksi tasoitukseksi Tämä tuottaa seuraavaa: Aloita hat amp amp alfa xt (1-alfa) alfa x (1-alfa) hattu amp amp alfa xt alfa (1-alfa) x (1-alfa) tällä tavoin korvaamalla ennustettu arvo yhtälön oikealla puolella. Tämä johtaa seuraaviin: hattu alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x pisteet alfa (1-alfa) jx pisteet alfa (1-alfa) x1 teksti Yhden kaavan 2 mukaan ennustettu arvo on painotettu keskiarvo kaikista sarjan aikaisemmista arvoista ja eksponentiaalisesti muuttuvilla painoilla, kun siirrymme sarjaan. Optimaalinen eksponentiaalinen tasoittaminen R: ssä Perustietoa ARIMA: sta (0,1,1) sovitetaan yhteen ja määritetään kerroin. Voimme tutkia sileän sävyn vertaamalla ennustettuja arvoja todelliseen sarjaan. Eksponentiaalinen tasoitus pyrkii käyttämään enemmän ennustustyökaluna kuin todellinen sileämpi, joten he etsivät nähdä, onko meillä hyvä sovitus. Esimerkki 3. n 100 kuukausittaista havaintoa öljyn hintaindeksin logaritmista Yhdysvalloissa. Tietosarja on: R: lle sopiva ARIMA (0,1,1) antoi MA (1) - kertoimen 0,3877. Näin ollen (11) 1.3877 ja 1- -0.3877. Eksponentiaalisen tasausennusteen yhtälö on hattu 1.3877xt - 0.3877hat t At time 100, sarjan havaittu arvo on x 100 0.86601. Tämänhetkisen sarjan ennustettu arvo on siis ajan 101 ennuste hattu 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 Seuraavassa on, kuinka hyvin sileämpi sopii sarjaan. Se on hyvä sovitus. Tämä on hyvä merkki ennakointiin, jonka tärkein tarkoitus on sileämpi. Seuraavassa on esimerkkejä tämän esimerkin lähdön generoimiseksi: oilindex scan (oildata. dat) - viiva (öljynindeksi, tyyppi b, öljyindeksin päälogi) expsmoothfit arima (öljyindeksi, järjestys c (0,1,1)) expsmoothfit nähdä arima tuloksia ennustaa öljynindeksi - expsmoothfitresiduals ennustettu arvot tontti (oilindex, typeb, pää Exponential Smoothing log of Oil Index) linjat (ennustaa) 1.3877oilindex100-0.3877predicteds100 ennuste ajan 101 Double Exponential Smoothing Kaksinkertainen eksponentti tasoitus voidaan käyttää, kun Theres (joko pitkällä tai lyhyellä aikavälillä), mutta ei kausivaihtelua. Pohjimmiltaan menetelmä luo ennusteen yhdistämällä eksponentiaalisesti tasoitettuja estimaatteja trendistä (suoran kulmakerroin) ja tasosta (pohjimmiltaan suora viiva). Kaksi eri painoa tai tasoittavaa parametria käytetään näiden kahden komponentin päivittämiseen joka kerta. Tasoitettu taso on enemmän tai vähemmän vastaava datan arvojen yksinkertaisen eksponentiaalisen tasoituksen kanssa ja tasoitettu suuntaus vastaa enemmän tai vähemmän vastaaviin eroihin perustuvaa yksinkertaista eksponentiaalista tasoitusta. Toimenpide vastaa ARIMA (0,2,2) - mallin asentamista, ilman vakioa ARIMA (0,2,2) sopivuudella. (1-B) 2'xt (1-thetaBB theta2B2) wt. Navigointi6.2 Keskimääräisten muuttujien ma 40 sähkönmyynti, järjestys 5 41 Tämän taulukon toisessa sarakkeessa esitetään järjestyksen 5 liukuva keskiarvo, joka antaa arvion trendisuunnittelusta. Ensimmäinen arvo tässä sarakkeessa on viiden ensimmäisen havainnon keskiarvo (1989-1993), toinen arvo 5-MA-sarakkeessa on arvojen keskiarvo 1990-1994 ja niin edelleen. Jokainen 5-MA-sarakkeen arvo on viiden vuoden ajanjaksolla havaittujen havaintojen keskiarvo, joka on keskitetty vastaavaan vuoteen. Kahden ensimmäisen vuoden tai kahden viime vuoden aikana ei ole arvoja, koska meillä ei ole kahta huomautusta kummallakin puolella. Edellä olevassa kaavassa sarakkeessa 5-MA sisältää hatun arvot k2: lla. Nähdäksesi, mitä trendisuhteen arvio näyttää, piirrämme sen yhdessä kuvien 6.7 alkuperäisten tietojen kanssa. tontti 40 elecsales, main quotSidellinen sähkönmyyntikilpailu, ylab quotGWhquot. Huomaa, kuinka trendi (punainen) on sujuvampi kuin alkuperäiset tiedot ja ottaa huomioon aikasarjojen pääliikkeet ilman pieniä vaihteluita. Liikkuva keskimääräinen menetelmä ei salli T: n estimaattia, jossa t on lähellä sarjan päitä, joten punainen viiva ei ulotu kaavion reunaan kummallakin puolella. Myöhemmin käytämme kehittyneempiä trendisuunnittelumenetelmiä, jotka mahdollistavat estimaatit lähellä loppupisteitä. Liikkuvan keskiarvon järjestys määrittää trendisuhteen arvioinnin tasaisuuden. Yleensä suurempi järjestys tarkoittaa sujuvampaa käyrää. Seuraavassa kuvassa näkyy liikkuvan keskiarvon muutoksen vaikutus asuntojen sähkönmyyntitietoihin. Tällaiset yksinkertaiset liukuvat keskiarvot ovat yleensä outoa (esim. 3, 5, 7 jne.). Näin ollen ne ovat symmetrisiä: liikuteltaessa keskimäärin kertaluokkaa m2k1 on aikaisempia havaintoja, myöhemmät havainnot ja keskimmäinen havainto jotka on keskiarvo. Mutta jos m oli tasainen, se ei enää olisi symmetrinen. Liukuvien keskiarvojen liukuvien keskiarvojen siirtäminen Liikkuvaa keskiarvoa voidaan siirtää liikkuvalle keskiarvolle. Yksi syy tähän on tehdä tasalaatuisesta liikkuva keskiarvo symmetrisestä. Voimme esimerkiksi siirtää keskimäärin järjestyksen 4 ja soveltaa sitten toiseen liukuva keskiarvo järjestykseen 2 tuloksiin. Taulukossa 6.2 tämä on tehty ensimmäisten vuosien ajan Australian neljännesvuosittaisten oluen tuotantoa koskevien tietojen osalta. olut2 lt - ikkuna 40 ausbeer, alku 1992 41 ma4 ltma 40 olut2, järjestys 4. keskusta FALSE 41 ma2x4 ltma 40 olut2, tila 4. keskitaso TRUE 41 Merkintä 2 kertaa4-MA viimeisellä sarakkeella tarkoittaa 4-MA jota seuraa 2-MA. Viimeisen sarakkeen arvot saadaan käyttämällä edellisen sarakkeen arvojen liikkuvaa keskiarvoa 2. Esimerkiksi 4-MA-sarakkeen ensimmäiset kaksi arvoa ovat 451,2 (443410420532) 4 ja 448,8 (410420532433) 4. Ensimmäinen arvo 2times4-MA-sarakkeessa on näiden kahden keskiarvo: 450,0 (451,2448,8) 2. Kun 2-MA seuraa tasaisen järjestyksen (esim. 4) liukuvaa keskiarvoa, sitä kutsutaan keskitetyksi keskimääräiseksi järjestysnumeroksi 4. Tämä johtuu siitä, että tulokset ovat nyt symmetrisiä. Nähdäksesi, että näin on, voimme kirjoittaa 2times4-MA: n seuraavasti: Aloita hat amp frac Bigfrac (y y y y) frac (y y y y) Suuri amp frac y frac14y frac14y frac14y frac18y. loppu Se on nyt havaintojen painotettu keskiarvo, mutta se on symmetrinen. Myös muita liikkuvien keskiarvojen yhdistelmiä on mahdollista. Esimerkiksi 3 x 3-MA: ta käytetään usein ja se koostuu järjestyksen 3 liikkuvasta keskiarvosta, jota seuraa toinen liukuva keskiarvo tilauksesta 3. Yleisesti tasaisen tilauksen MA jälkeen tulisi noudattaa tasaista MA: ta, jotta se olisi symmetrinen. Samoin pariton tilaus MA: n tulisi seurata pariton tilaus MA. Suhdesyklin arvio kausitietojen avulla Keskitetyn liikkuvan keskiarvon yleisin käyttö on arvioida trendijakso kausittaisista tiedoista. Harkitse 2times4-MA: hattu frac y frac14y frac14y frac14y frac18y. Vuosittain neljännesvuosittain annetuilla tiedoilla on sama paino kuin ensimmäiset ja viimeiset ehdot koskevat samana vuosineljänneksi peräkkäisinä vuosina. Näin ollen kausivaihtelu lasketaan keskimäärin ja tuloksena saadut h-arvot ovat vähäiset tai ei kausivaihtelua jäljellä. Samankaltainen vaikutus saataisiin käyttämällä 2-kertaista 8-MA: ta tai 2 x 12-MA: ta. Yleensä 2-kertainen m-MA vastaa m1: n painotettua liikkuvaa keskiarvoa kaikkiin havaintoihin, joissa paino on 1 m, lukuun ottamatta ensimmäisiä ja viimeisiä termejä, jotka ottavat painot 1 (2 m). Joten jos kausittainen ajanjakso on tasainen ja tilaus m, käytä 2-kertaista m-MA: ta trendisuhteen arvioimiseen. Jos kausi-aika on outoa ja tilaus m, käytä m-MA: ta trendisuhteen arvioimiseen. Erityisesti 2 x 12-MA: ta voidaan käyttää kuukausittaisten tietojen trendikierroksen arvioimiseen ja 7-MA: n avulla voidaan arvioida päivittäisten tietojen trendikierros. Muut vaihtoehdot MA: n järjestyksessä johtavat yleensä trendisuhteen arvioihin, jotka ovat saastuneet datakauden kausivaiheessa. Esimerkki 6.2 Sähkölaitteiden valmistus Kuva 6.9 esittää sähkölaitteiden tilausindeksiin 2 x 12 mA. Huomaa, että sileä viiva ei näytä kausivaihtelua, se on lähes sama kuin kuvassa 6.2 esitetyn kehityssyklin, joka arvioitiin käyttäen paljon kehittyneempää menetelmää kuin keskimääräiset liikkeet. Muut vaihtoehdot liikkuvan keskiarvon järjestyksessä (paitsi 24, 36 jne.) Olisivat johtaneet sileään linjaan, joka näyttää kausivaihteluita. tontti 40 elecequip, ylab quotNew orders indexquot. col quotgrayquot, main quotElectrical equipment manufacturing (euroalue) quot 41 lines 40 ma 40 elecequip, order 12 41. col quotedquot 41 Painotetut liikkuvat keskiarvot Liikkuvien keskiarvojen yhdistelmät aiheuttavat painotetut liikkuvat keskiarvot. Esimerkiksi edellä käsitelty 2x4-MA vastaa painotettua 5-MA: ta, jonka painot ovat frac, frac, frac, frac, frac. Yleensä painotettu m-MA voidaan kirjoittaa hat t summa k aj, jossa k (m-1) 2 ja painot annetaan a, pisteillä, ak. On tärkeää, että painot kaikki summa yhteen ja että ne ovat symmetrisiä niin, että aj a. Yksinkertainen m-MA on erikoistapaus, jossa kaikki painot ovat 1m. Painotettujen liikkuvien keskiarvojen suurin etu on se, että ne antavat tasaisemman estimaatin trendikehityksestä. Sen sijaan, että havainnot tulisivat sisään ja lähtevät laskelmasta täydellä painolla, niiden painot kasvoivat hitaasti ja pienenivät sitten hitaasti ja tuloksena saatiin tasaisempi käyrä. Joitakin tiettyjä sarjoja painoja käytetään laajalti. Jotkut näistä on esitetty taulukossa 6.3. Liikkuvan ikkunan on oltava kokonaisluku 1: n ja n: n välille vaihtoehto erilaisten algoritmien valitsemiseksi. C - versio kirjoitetaan C: hen. Se voi käsitellä ei-äärellisiä lukuja, kuten NaN ja Infs (kuten keskiarvo (x, na. rm TRUE)). Se toimii nopeimmin endrulemean. nopea - toinen, vielä nopeampi C-versio. Tämä algoritmi ei toimi epäyhtenäisten numeroiden kanssa. Se toimii myös nopeimmin endruleille kuin keskiarvolle. R - paljon hitaampi koodi kirjoitettu R. Hyödyllinen virheenkorjaukseen ja asiakirjaksi. tarkka - sama kuin C. paitsi, että kaikki lisäykset suoritetaan käyttäen algoritmia, joka jäljittää ja korjaa lisäyskierrosvirheitä merkkijonoa, joka kertoo tietojen alku - ja loppuarvojen käsittelyn. Tähän vaikuttaa vain ensimmäiset ja viimeiset k2-arvot molemmissa päissä, missä k2 on puoli kaistanleveys k2 k 2. mean - soveltaa taustalla olevaa funktiota pienempiin ja pienempiin osioihin taulukosta. Vastaavasti: ((i in 1: k2) outi tarkoittaa (x1: (ik2)). Tämä vaihtoehto toteutetaan C: ssä jos algC. muuten tehdään R: ssä. trim - trim, päiden tuotosryhmän pituus on yhtä pitkä kuin (x) -2k2 (out out (k21) :( n - k2)). Tämä vaihtoehto jäljittelee sovelluksen (upottaa (x, k), 1, keskiarvo) ja muita vastaavia toimintoja. - täytä päät - numerot x vektorilla (out1: k2 x1: k2) vakio - täytä päät ensimmäisellä ja viimeisellä laskennallisella arvolla lähtötehtävässä (out1: k2 outk21) NA - täytä päät NA: llä (out1: k2 NA ) func - sama kuin keskiarvo, mutta implimented in R. Tämä vaihtoehto voisi olla hyvin hidas, ja se sisältyy lähinnä testaukseen Samanlainen endrule runmed toiminto, jolla on seuraavat vaihtoehdot: ldquo c (mediaani, pidä, vakio) rdquo. specifies onko tulos tulisi olla keskitetty (oletus), vasemmalle tai oikealle. Jos endrule keskiarvo sitten asettaminen kohdalle vasemmalle tai oikealle palaa hitaampaan toteutukseen, joka vastaa endrule func: tä. Loppuarvojen lisäksi y: n (x, k) tulos on sama kuin ldquo (j (1k2) :( n-k2)) yjmean (x (j-k2) :( jk2)) rdquo. Tärkein kannustin kirjoittaa tämä funktio oli suhteellinen hitaus useimmissa liikkuvissa ikkunatoiminnoissa, jotka ovat saatavilla R: ssä ja sen pakkauksissa. Paitsi runmed. käynnissä oleva ikkuna-media-toiminto, kaikki luetellut toiminnot ovat myös hitaampia kuin erittäin tehoton ldquo-sovellus (upottaa (x, k), 1, FUN) rdquo-lähestymistapa. Suhteellisen nopeuden runmean toiminto on O (n). Toiminto EndRule soveltaa yhtä viidestä menetelmästä (ks. Endrule-argumentti) tulojärjestelmän x loppupisteiden käsittelemiseksi. Nykyisessä version koodissa oletusarvoinen endrulemean-vaihtoehto lasketaan C-koodilla. Tämä tapahtuu nopeuden parantamiseksi suurien liikuteltavien ikkunoiden tapauksessa. Runmean (.algexact) - toiminnon tapauksessa käytetään erityistä algoritmia (ks. Viitejaksot), jotta pyöristysvirheet eivät kerääntyisi. Tuloksena runmean on tarkempi kuin suodatin (x, rep (1k, k)) ja runmean (.algC) - funktiot. Palauttaa numeerisen vektorin tai matriisin, jonka koko on sama kuin x. Vain endruletrim-tapauksessa lähtövektorit ovat lyhyempiä ja lähtömatriisilla on vähemmän rivejä. Toiminto runmean (. Algexact) perustuu Vadim Ogranovichin koodiin, joka perustuu Python-koodiin (ks. Viimeinen viittaus), jonka Gabor Grothendieck huomautti. Viitteet Pyöristysvirheenkorjaus, jota käytetään runmeanissa. Shewchuk, Jonathan Adaptive Precision Floating-Point-aritmeettinen ja nopea, kestävä geometrinen predikaatti. www-2.cs. cmu. eduafscsprojectquakepublicpapersrobust-arithmetic. ps Lisätietoja kierrosvirheen korjaamisesta on osoitteessa: aspn. activestateASPNCookbookPythonRecipe393090 Linkit liittyvät: liikkuva keskiarvo - keskiarvo. kernapply. suodattaa. hajota. STL. rollmean eläintarhakirjastosta, taulukirjaston alaluokat, muut pakettikytkimet tässä ikkunassa: runmin. runmax. runquantile. runmad ja rund runmed yleinen käynnissä oleva ikkuna - toiminnot: Käytä (upottaa (x, k), 1, FUN) (nopein), käynnissä gtools-paketista (erittäin hidas tähän tarkoitukseen). kaikki mitat. Paketti caTools versio 1.12 Hakemisto

No comments:

Post a Comment