Curba ROC în PSPP

Deoarece curba ROC este folosită adeseori în cercetările din domeniul medical, exemplul pe care voi explica folosirea curbei ROC va folosi date din medicină:

Exemplu:

Pe un lot de 51 de pacienți cu vârsta cuprinsă între 26 și 79 de ani s-a studiat dacă vârsta este un factor determinant în pentru bolnavii cu diabet. Pentru aceasta am pus într-un tabel pe o coloană varsta pacientilor și pe altă coloană am codificat cu 1 daca pacientul are diabet și 0 dacă pacientul nu are diabet (având 51 de înregistrări am pus doar o parte din date în tabelul de mai jos):

15_08_001

Apoi în meniu dăm un clic pe Analyze și apoi pe ROC Curve:

15_08_002

După ce vom da un clic pe opțiunea ROC Curve, va apărea fereastra:

15_08_003

În această fereastră la Test Variable am pus varibila Varsta (am da un clic pe variabila Varsta în fereastra stângă, apoi am dat un clic pe săgeata din dreptul ferestrei Test Variable). La fel vom selecta la State Variable variabila binomială Diabet_zaharat. Vom mai bifa opțiunile ROC Curve, With diagonal reference line (pentru a avea pe diagrama o linie pentru prima diagonală) și Coordinate points of the ROC Curve. Apoi vom da un clci pe OK. În fereastra Output vor apărea următoarele rezultate

15_08_004

Primul tabel ne arată câși pacienți au diabet și câți nu (în exemplul nostru 16 pacientți au diabet și 35 nu au diabet). În al doilea tabel avem aria egală cu 0,69. În conformitate cu teoria (vezi postarea aceasta) modelul este acceptat. (se află la nivelul corect (fair)).

În tabelul de mai jos sunt trecute punctele pentru specificitate și sensibilitate a modelului, puncte utile în calcularea punctului de cutt-off:

15_08_005

Analiza varianței unifactorială – scoruri necorelate

Atunci când dorim sa realizăm analiza varianței unifactorială (ANOVA-U)în primul rând trebuie să vedem ce tip de date avem. Acestea pot fi

  1. cu scoruri nerelaționate sau necorelate
  2. măsurători repetate sau scoruri relaționate

În postarea de azi voi prezenta un exemplu de ANOVA-U pentru primul caz. Datele pornesc de la un exemplu din [How01] (vezi bibliografia). Pe un grup de 9 subiecți se studiază efectul unor medicamente asupra scorurilor depresiei. Acești subiecți au fost împărțiți în trei grupe. Primului grup i s-a administrat meedicamentul 01, celui de-al doilea grup i s-a administrat placebo, iar celui de-al treilea grup i s-a administrat medicamentul02. Desigur subiecții nu au fost informați despre tipul de medicament ce le este administrat. Înainte de aplicarea tratamentului mediile scorurilor testului de depresie corespunzătoare celor 3 grupuri nu difereau semnificativ. În urma realizării acestui experiment s-au obținut următoarele rezultate:

snspa069

Vom pune aceste date într-un fișier SPSS codificând cele trei grupe: 1- Medicament01, 2 – Placebo, 3 – Medicament02

snspa070

Vom da câte un clic pe următoarele opțiuni: Analyze Compare Means One-Way ANOVA

snspa071

Va apărea o fereastră în care vom introduce la dependent list variabila scor depresie, iar la factor variabila cu codul grupurilor. Apoi vom da un clic pe Options iar în fereastra ce va apărea vom bifa opțiunea Descriptives (pentru a avea afișate și mediile corespunzătoare celor 3 grupuri) și opțiunea Means Plot pentru ca să avem la rezultate afișată și diagrama cu mediile.

snspa072 Vom da un clic pe Continue, iar în fereastra principală vom da un clic pe OK. Pe fereastra Output vom avea:

1. Statistica descriptivă:

snspa073

2. Tabelul cu rezultatele pentru ANOVA:

snspa074

deoarece val p = 0,01 < 0,05 avem diferențe semnificative între medii (Sig. = ,010).

3. Diagrama cu rezultatele:

snspa075

Observăm că media obținută pentru primul medicament este mai mare decât mediile de la grupul 2 și 3.