análisis de conglomerados (cluster analysis)
DESCRIPTION
Análisis de conglomerados (Cluster analysis). Métodos de partición Dividir los datos en grupos disjuntos Métodos jerárquicos Construir una jerarquía de los datos y deducir de alli los grupos. K medias. Criterios. Mismo criterio con vectores. Justificación del criterio. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/1.jpg)
Análisis de conglomerados(Cluster analysis)
![Page 2: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/2.jpg)
• Métodos de partición
Dividir los datos en grupos disjuntos
• Métodos jerárquicos
Construir una jerarquía de los datos y deducir de alli los grupos
![Page 3: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/3.jpg)
K medias
![Page 4: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/4.jpg)
Criterios
![Page 5: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/5.jpg)
Mismo criterio con vectores
![Page 6: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/6.jpg)
Justificación del criterio• La justificación es el análisis de la varianza. Para
una variable escalar esto es la descomposición:
VT=VNE+VE
Y para vectores
Minimizar la variabilidad internar es maximizar las diferencias entre grupos.
![Page 7: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/7.jpg)
Algoritmo de K medias
![Page 8: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/8.jpg)
Numero de grupos
![Page 9: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/9.jpg)
Problemas de estandarización
![Page 10: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/10.jpg)
Ejemplo Ruspini
![Page 11: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/11.jpg)
![Page 12: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/12.jpg)
![Page 13: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/13.jpg)
![Page 14: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/14.jpg)
![Page 15: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/15.jpg)
Problemas de k-medias
• Muy sensible a datos atípicos (k-medias recortadas)
• Distancias euclídeas. Mal para cluster esféricos
• No determinar el número de grupos que
debe obtenerse por algúna medida de ajuste.
![Page 16: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/16.jpg)
Algoritmos jerárquicos
![Page 17: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/17.jpg)
Aglomerativos
![Page 18: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/18.jpg)
vecino más proximo
![Page 19: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/19.jpg)
Vecino más alejado
![Page 20: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/20.jpg)
media
![Page 21: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/21.jpg)
centroide
![Page 22: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/22.jpg)
Método de Ward
![Page 23: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/23.jpg)
Dendogramas
![Page 24: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/24.jpg)
Ejemplo
![Page 25: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/25.jpg)
![Page 26: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/26.jpg)
![Page 27: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/27.jpg)
![Page 28: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/28.jpg)
![Page 29: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/29.jpg)
![Page 30: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/30.jpg)
![Page 31: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/31.jpg)
![Page 32: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/32.jpg)
Problemas cluster jerárquico
• Con muchos datos lento, cada vez n(n-1)/2 comparaciones.
• Distancias euclideas pueden no ser apropiadas
• Con muchos datos dificil de interpretar el dendograma
![Page 33: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/33.jpg)
Un nuevo enfoque para cluster (The SAR procedure, Peña and Tiao, 2003)
Buscar para cada dato su discriminante. Definido por el punto que maximiza
This is equivalent to
And for large samples
![Page 34: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/34.jpg)
![Page 35: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/35.jpg)
![Page 36: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/36.jpg)
We can split the sample in this way and computeSome global statistic at each step as the SCDG To see if more splitting is needed
![Page 37: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/37.jpg)
![Page 38: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/38.jpg)
Conglomerados por variablesDistancias entre variables cuantitativas
![Page 39: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/39.jpg)
Distancias entre variables cuantitativas (2)
![Page 40: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/40.jpg)
Distancias entre variables cualitativas
![Page 41: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/41.jpg)
Similaridad entre atributos cualitativos
![Page 42: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/42.jpg)
![Page 43: Análisis de conglomerados (Cluster analysis)](https://reader033.vdocuments.mx/reader033/viewer/2022061612/56813a04550346895da1cf1e/html5/thumbnails/43.jpg)