Arhive zilnice: 16 februarie 2015

Modele de eliminare a componentelor (MEC). Alegerea unui model

Pornind de la exemplul din postarea anterioară putem scrie formula generală pentru MEC se poate astfel:

modelul 1

fig16

sau

modelul 2

fig17

unde
yij – măsurătoarea realizată în luna j din anul i
l – numărul de ani în care s-a făcut observația
s – perioada fenomenului sezonier (cele 12 luni ale anului)
mij – media mobila pentru luna j din anul i
sj – coeficientul sezonier pentru a j- a lună
dij – valoarea reziduală pentru luna j din anul i (modelul 1)
eij – valoarea reziduală pentru luna j din anul (modelul 2)

Să revedem foaia de calcul obținută la postarea anterioară:

fig13

Exemplu: pentru ianuarie 1977 vom avea:

yij = 151
mij = 214,75
sj = 0,701
dij = o,46
eij = 1,003

modelul 1:
151 = ( 214,75)(0,701) + 0,460

modelul 2:
151 = (214,75)(0,701)(1,003)

Primul model este un model mixt, denumirea provenind din faptul că sezonalitatea este obținută multiplicativ, dar reziduul este aditiv.

Al doilea model se numește model multiplicativ deoarece observația rezultă din înmulțirea componentelor analizate (componenta sezonieră și reziduul).

În anumite cazuri putem avea un model aditiv:

fig20

unde cu r am notat valoarea reziduală pentru acest model.

Alegerea modelului depinde de modul în care este organizată seria cronologică din care dorim să eliminăm o componentă. Prin alegerea modelului se înțelege alegerea tipul de model – aditiv, mixt, multiplicativ.

Am văzut în postările anterioare că:

1. modelul aditiv corespunde unei serii cronologice ce are o componentă sezonieră de amplitudine constantă.

2. modelele mixt și multiplicativ corespund seriilor cronologice ce au componente de amplitudine proporțională la nivelul seriei.

O primă modalitate de identificare a tipului de model este examinarea reprezentării grafice a seriei cronologice.

O altă metodă de alegere a modelului este de studierea abaterilor-standard pentru o duzină de observații ale unei serii. Această metodă este eficientă doar atunci când componenta neregulată este mai puțin importantă decât componenta sezonieră și când încadrarea tendinței generale a seriei se păstrează între anumite limite rezonabile ale liniarității seriei.

Să vedem cum ar funcționa această metodă pentru exemplul prezentat în postările anterioare. Mai jos redăm baza de date a cantităților de lapte colectate lunar în Belgia în perioada 1975-1988. Calculăm mediile (cu ajutorul funcției AVERAGE din excel) abaterile-standard (cu ajutorul funcției STDEV din excel) pentru fiecare an :

fig21

Reprezentăm pe același grafic valorile mediilor și valorile abaterilor standard:

fig22

Se observă că nu există că nu avem nici o relație între aceste două caracteristici. De altfel acest lucru am fi putut să-l observăm și calculând coeficientul de corelație r=-0,20 (p=0,49 > 0,05). Deci variabilitatea observațiilor anuale nu se exprimă ca funcție de mediile anuale. În consecință putem presupune ca avem o componentă sezonieră (care exprimă preponderent variabilitatea) care nu depinde de nivelul seriei și deci se poate justifica un model aditiv.

Dacă am fi avut o corelație liniară pozitivă destul de mare, am fi putut ajunge la concluzia ca există o relație între variabilitatea observațiilor și valorile medii. Adică, pentru această situație ar fi fost indicată folosirea unui model multiplicativ sau mixt.

(n.mea – dar acest lucru nu înseamnă că modelul prezentat în exemplul de la o postare anterioară nu este bine ales? Adică arătând mai sus că este indicată folosirea unui model aditiv, ce rost ar mai avea calcularea coeficienții sezonieri?)