Arhive etichetă: analiza datelor

Clustering KM

Această metodă pornește de un număr predefinit de clustere. În fiecare cluster va fi adăugat câte un element în funcție de distanța de la acesta la cluster.

Vulnerabilități ale acestei metode:

  • definirea apriori a numărului de clustere
  • influența negativă a valorilor aberante (prin includerea acestora într-un cluster)
  • nu avem o ierarhizare a clusterelor

Fie exemplu prezentat la metoda AI:

da_038

Alegem trei clustere pornind de la trei observații: A , D și F. Apoi facem un tabel cu distanțele de la celelalte observații la acestea trei:

da_043

Deci am obținut:

  • Clusterul 1: A, B, H
  • Clusterul 2: D , C, G
  • Clusterul 3: E, F

Centralizarea datelor:

da_044