Aplicaţie corelaţia liniară

Pentru 30 de plante de porumb s-au măsurat: conținutul de proteină (%) și conținutul de zahăr(%). S-au obținut următoarele date:

Să se calculeze coeficientul de corelație pentru cele două caracteristici și să se studieze dacă acesta este semnificativ. Pentru calcularea coeficientului de corelație vom folosi funcția CORREL din Excel. În fereastra pentru introducerea argumentelor funcției vom scrie cele două șiruri de celule ca-n imaginea de mai jos:

Vom da un clic pe OK si vom obține valoarea -0,29 pentru coeficientul de corelație. Având o corelație negativă putem emite următoarea ipoteză: dacă avem un conținut bogat de proteine atunci procentul de zahăr va fi scăzut (atenție coeficientul de corelație nu ne dă relații gen cauză-efect, de aceea nu am scris, „conținutul bogat în proteine determină procentul scăzut de zahăr”). Pentru a verifica aceasta ipoteză trebuie să verificăm dacă avem o corelație semnificativă. Pentru aceasta vom calcula valoarea t dată de formula:

unde cu r am notat coeficentul de corelație (pentru calcularea lui t vom folosi modulul coeficientului de corelație). Calculând această formulă vom obține următoarea foaie de calcul:

Pentru a calcula valoarea p asociată valorii t calculate vom folosi funcția din Excel – TDIST.

În final vom obține:

Deoarece p > 0,05 coeficentul de corelație nu e semnificativ (diferit de zero). În concluzie, pentru datele de mai sus, putem spune că nu avem o corelație liniară între procentul de proteină și cel de zahăr la porumb, dar există o tendință de corelare între cele două (deoarece val lui p 0,058 este apropiata de pragul de 0,05).

Posted in Uncategorized | Leave a comment