Arhive zilnice: 14 februarie 2015

Metode de eliminare a componentelor

N. mea. – am preferat să traduc „eliminare a componentelor” și nu „descompunere”, deoarece, din punct de vedere matematic, a descompune o expresie matematică nu e același lucru cu a elimina o variabilă dintr-o expresie matematică. Pentru a elimina confuzia am preferat folosirea primei forme, chiar dacă „methodes de decomposition” ar fi fost mai degrabă „metode de descompunere”. 

Am văzut în postările anterioare că o serie cronologică poate fi considerată ca fiind rezultatul asocierii următoarelor componente: tendința, componenta ciclică, componenta sezonieră și componenta neregulată.

Principiul de la care pornește această metodă este de a identifica și estima componentele ce intră în seria cronologică. Înafară de eliminarea componentelor dintr-o serie cronologică, aceasta metodă poate fi utilă la descrierea seriei (obiectivul 1 din postarea anterioară) sau la realizarea unor previziuni.

În postarea de azi vom arăta un exemplu de desezonalizare (eliminarea componentei sezoniere dintr-o serie cronologică).

Un exemplu de desezonalizare a datelor

Înainte de a prezenta acest exemplu, atrag atenția asupra faptului că, în prelucrarea datelor am utilizat Excel-ul, în timp ce în materialul de la ITCF a fost folosit un soft al institutului – STAT-ITCF. În plus, pentru a înțelege mai bine modul de aplicare al acestei metode am „lărgit” baza de date (în manual baza de date conținea înregistrările din 40 de luni, în baza de date ce o folosesc aici am pus 48 de înregistrări)

În tabelul de mai jos am pus cantitățile de lapte recoltate lunar în Belgia în perioada 1975-1978 (date preluate din „Statistiques Agricole” publicație lunară a Institutului Național Belgian de Statistică – appud. ITCF):

fig08

Algoritmul va conține mai mulți pași.

Pasul 1. Calculul mediilor mobile. Vom calcula media pentru fiecare lună ca fiind o medie a valorilor înregistrate pe o perioadă de 6 luni înainte de luna pentru care calculăm și 6 luni după luna în care calculăm. De exemplu, pentru a calcula media mobilă pentru luna iulie 1975, vom calcula media între lunile ianuarie 1975 și ianuarie 1976. Deoarece luna ianuarie apare de două ori vom pune în formulă valoarea din ianuarie împărțită la 2. Astfel formula în excel va fi pentru luna iulie 1975 (o vom pune în celula E8):

fig09

Vom copia această formulă în blocul de celule de la E8 la E43, celule de la E2 la E7 și de la E44 la E49 vor rămâne necompletate, deoarece pentru lunile corespunzătoare acelor celule nu avem destule date pentru a le calcula. Vom obține următoarea foaie de excel:

fig10

Pasul 2: Calcularea raportului dintre valoarea lunară și media mobilă

Aceste valori le vom scrie în coloana F. Normal ele vor fi calculate doar de la linia 8 la linia 43. De exemplu în celula F8 vom avea formula

= D8/E8

Apoi vom copia această formulă în blocul de celule F8:F43. Vom obține:

fig11

Pasul 3. Pentru a elimina efectul sezonier al acestor coeficienți, vom calcula o medie a coeficienților pentru fiecare lună (în acest caz la fiecare medie vom avea 3 valori). Astfel pentru coeficientul sezonier al lunii martie, vom calcula media valorilor din celulele F16, F28, F40 și vom obține valoarea 0,701. Vom calcula valorile pentru fiecare lună și apoi le vom copia în dreptul fiecărei luni (în foaia de excel de mai jos am încadrat valorile calculate inițial – atenție – la copiere se va folosi optiunea Paste Special, Values pentru ca să nu se copieze formulele, ci valorile din celule):

fig12

Pasul 4. Acum putem calcula valorile seriei cronologice din care am eliminat variațiile sezoniere. Valoarea corectată va fi dată de raportul dintre valoarea măsurată în o lună și coeficientul sezonier al acelei luni. De exemplu pentru luna ianuarie 1975 vom avea formula:

= D2/G2

Apoi vom copia această formulă pentru toate datele și vom obține:

fig13

Pentru a realiza analiza, am să reprezint pe un grafic atât datele inițiale (productia lunară de lapte) cât și datele corectate prin desezonalizare:

fig14

Graficul de mai sus ne arată modul în care datele au fost corectate și de ce aceste date ne arată mai bine tendința seriei cronologice. Pentru o analiză de profunzime recomand realizarea unui grafic doar cu datele corectate. În acest grafic de asemenea e bine să modificăm și scala (valori între 195 si 255):

fig15