nỘi dung chÍnh
DESCRIPTION
1. 2. PHÂN TÍCH CỤM. BẢN ĐỒ NHẬN THỨC. NỘI DUNG CHÍNH. 1. PHÂN TÍCH CỤM. Khái niệm. Phân tích cụm là nhận diện và phân loại các đối tượng hay các biến sao cho các đối tượng trong cùng một cụm tương tự nhau xét theo các đặc tính lựa chọn để nghiên cứu. Phân tích Q. - PowerPoint PPT PresentationTRANSCRIPT
NỘI DUNG CHÍNH
Khái niệm
Phân loại theo các mối liên hệ
tự nhiên
Phân loại theo các mối liên hệ
tự nhiên Phân tích phân loại
Phân tích Q
Phân loại kỹ thuật định lượng
Phân tích cụm là nhận diện và phân loại các đối tượng hay các biến sao cho các đối tượng trong cùng một cụm tương tự nhau xét theo các đặc tính lựa chọn để nghiên cứu.
Phân tích cụm là nhận diện và phân loại các đối tượng hay các biến sao cho các đối tượng trong cùng một cụm tương tự nhau xét theo các đặc tính lựa chọn để nghiên cứu.
Sinh học
Kinh DoanhTrong nghiên cứu thị trường, phân tích cụm
được sử dụng để phân đoạn thị trường và xác định thị trường mục tiêu.
Trong biểu diễn dữ liệu gene dùng để nhóm các mẫu gen giống nhau, nhóm các mẫu khác nhau trên các hồ sơ tương ứng
phân tích cụm được sử dụng để xác định các nhóm của người dân mà có thể được hưởng lợi từ các dịch vụ y tế
Sức khỏe tâm lý
Ứng dụng
Tiến hành phân tích cụm
Chọn lựa các biến để phân cụm, nên chọn tập hợp biến có khả năng mô tả được sự giống nhau giữa các đối tượng theo mục đích nghiên cứu.
Các biến này có thể được chọn trên cơ sở phân tích lý thuyết, kết quả nghiên cứu trong quá khứ, hay xem xét các giả thuyết có liên quan để được kiểm định
Bước 1 :Xác định vấn đề
Mua sắm là một thú vui 1 2 3 4 5 6 7
Mua sắm là tốn tiền 1 2 3 4 5 6 7
Tôi đi mua sắm kết hợp với ăn uống 1 2 3 4 5 6 7
Tôi tìm mua những gì đáng mua nhất khi đi mua sắm 1 2 3 4 5 6 7
Tôi không quan tâm đến việc khi mua sắm 1 2 3 4 5 6 7
Đi mua sắm giúp tiết kiệm được nhiều nhờ so sánh giá cả 1 2 3 4 5 6 7
Bước 1 :Xác định vấn đề
Mã hóa thành 6 biến:V1 Mua sắm là một thú vuiV2 Mua sắm là tốn tiềnV3 Mua sắm kết hợp với ăn uốngV4 Cố gắng tìm mua những gì đáng mua nhất khi đi mua sắmV5 Không quan tâm đến việc đi mua sắmV6 Đi mua sắm có thể giúp tiết kiệm được tiền nhờ so sánh nhiều giá cả khác nhau
Không đồng ý đồng ý
Ví dụ (P80)
• Chênh lệch tuyệt đối lớn nhất của các giá trị trên từng biến
• Căn bậc 2 của tổng các độ lệch bình phương của các giá trị trên từng biến của 2 đối tượng
• Tổng các độ lệch tuyệt đối của các giá trị trên từng biến
Bước 2: Chọn thước đo khoảng cách
Song song Tuần tự Phân chia tối ưu
Không thứ bậc
Thủ tục phân cụm
Bước 3: Chọn thủ tục phân cụm
Phân cụm thứ bậc là thủ tục được xây dựng theo một cấu trúc thứ bậc dạng hình cây. Tiến hành theo cách tích tụ lại (agglomerative) hay phân chia ra (divisive)
Phân cụm phân chia: phân chia một cụm duy nhất chứa tất cả đối tượng thành các cụm nhỏ cho đến khi mỗi đối tượng là một cụm riêng.
Phân cụm tích tụ: tích tụ mỗi cụm là một đối tượng riêng lẽ cho đến khi tất cả các đối tượng nằm trong một cụm duy nhất.
Khoảng cách liên kết (linkage method)Tổng độ lệch bình phương hay phương sai (error sum of squares
or variance method)Khoảng cách trung tâm ( centroid method)
Phân cụm thứ bậc (hierarchical clustering)
Các phương pháp phân cụm tích tụ dựa vào các khoảng cách liên kết
Khoảng cách tối thiểuCụm 1 Cụm 2
Khoảng cách tối đaCụm 1 Cụm 2
Phương pháp khoảng cách liên kết đơn
Phương pháp khoảng cách liên kết hoàn toàn
Khoảng cách trung bình
Cụm 1 Cụm 2
Phương pháp khoảng cách liên kết trung bình
Phân cụm thứ bậc (hierarchical clustering)
• Tính giá trị trung bình tất cả các biến cho từng cụm một.
• Tính khoảng cách Euclid bình phương giữa các phần tử trong cụm với trị trung bình của cụm.
• Tổng tất cả các khoảng cách bình phương.
Phương pháp phân cụm tích tụ dựa vào phương sai theo thủ Phương pháp phân cụm tích tụ dựa vào phương sai theo thủ tục Wardtục Ward
Thủ tục Ward
Phân cụm thứ bậc (hierarchical clustering)
Phương pháp phân cụm tích tụ dựa vào khoảng cách trung tâmPhương pháp phân cụm tích tụ dựa vào khoảng cách trung tâm
Khoảng cách trung tâm
Cứ mỗi lần các đối tượng được nhóm lại thì phải tính lại các trung tâm cụm
Trong số các phương pháp phân tích cụm tích tụ thì phương pháp khoảng cách trung tâm và thủ tục Ward đã được chứng minh là có kết quả tốt hơn các phương pháp khác.
Phân cụm thứ bậc (hierarchical clustering)
Phân cụm Không thứ bậc (Non - hierarchical clustering)
Thường được gọi là phân cụm K - means
Phương pháp bắt đầu tuần tự (sequential threshold): quá trình bắt đầu từ một hạt giống cụm được chọn và tất cả các đối tượng cách hạt giống này trong một khoảng cách đã được định trước sẽ nhập vào cụm này.
Phương pháp bắt đầu song song (parallel threshold): tương tự như phương pháp ở trên nhưng có nhiều hạt giống được chọn và quá trình được tiến hành song song.
Phương pháp phân chia tối ưu (optimizing partitioning): thủ tục này khác với hai phương pháp trên ở chổ các đối tượng sau khi phân vào một cụm nào đó sẽ có thể được phân lại vào cụm khác để thỏa một tiêu chuẩn tối ưu toàn bộ.
• Phải thử xác định trước số cụm• Lựa chọn hạt giống của cụm khá tùy ý
• Khối lượng tính toán ít hơn• Thời gian thực hiện nhanh hơn
Phân cụm Không thứ bậc (Non - hierarchical clustering)
Bước 1: Mở file phantichcum.sav chọn Anlalyze → Classify → Hierarchical Cluster
Các bước phân cụm thứ bậc bằng SPSS
Bước 2: Thiết lập các yếu tố cần thiết sau để thực hiện phân tích
Các bước phân cụm thứ bậc bằng SPSS
StageCluster Combined
CoefficientsStage Cluster First Appears
Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 14 16 1.000 0 0 62 6 7 2.000 0 0 73 2 13 3.500 0 0 154 5 11 5.000 0 0 115 3 8 6.500 0 0 166 10 14 8.167 0 1 97 6 12 10.500 2 0 108 9 20 13.000 0 0 119 4 10 15.583 0 6 1210 1 6 18.500 0 7 1311 5 9 23.000 4 8 1512 4 19 27.750 9 0 1713 1 17 33.100 10 0 1414 1 15 41.333 13 0 1615 2 5 51.833 3 11 1816 1 3 64.500 14 5 1917 4 18 79.667 12 0 1818 2 4 172.667 15 17 1919 1 2 328.600 16 18 0
Bảng 14.1a Agglomeration Schedule (p87)
Case 4 Clusters 3 Clusters 2 Clusters1 1 1 12 2 2 23 1 1 14 3 3 25 2 2 26 1 1 17 1 1 18 1 1 19 2 2 210 3 3 211 2 2 212 1 1 113 2 2 214 3 3 215 1 1 116 3 3 217 1 1 118 4 3 219 3 3 220 2 2 2
Bảng 14.1b Cluster Membership (p90)
Bảng Cluster Membership cho ta biết khi phân ra từ 2 cụm đến 4 cụm thì các đối tượng sẽ thuộc cụm nào.
Hình 14.7 Vertical Ichicle (p90)
Hình 14.8: Dendrogram (p91)
Bước3: Quyết định số cụm
• Phân tích lý thuyết
• Sử dụng khoảng cách giữa các cụm làm tiêu chuẩn để xác định số cụm (Phân cụm thứ bậc)
• Tỉ số giữa phương sai nội bộ nhóm và phương sai giữa các nhóm có sự thay đổi đột ngột (Phân cụm không thứ bậc)
• Qui mô tương đối của các cụm
Bước 4: Diễn tả và mô tả các cụm
Cụm số
đi mua sắm là thú vui
đi mua sắm là tốn tiền
kết hợp mua sắm với ăn uống
tìm những gì đáng mua nhất khi đi mua sắm
không quan tâm đến việc đi
mua sắm
đi mua sắm giúp tiết kiệm được tiền nhờ so sánh giá cả
V1 V2 V3 V4 V5 V6
1 5.750 3.625 6.000 3.125 1.875 3.8752 1.667 3.000 1.833 3.500 5.500 3.3333 3.500 5.833 3.333 6.000 3.500 6.000
Bước 4: Diễn tả và mô tả các cụm
Bảng 14.2: Kết quả tính toán trung bình của các biến theo từng cụm (p93)
Cụm số 1 có trị trung bình lớn ở V1 và V3 => “nhóm quan tâm và thích thú đi mua sắm”
Cụm số 2 có biến V5 => “nhóm thờ ơ với việc đi mua sắm”
Cụm số 3 có biến V2, V4, và V6 => “nhóm mua sắm quan tâm đến kinh tế”
Bước 5: Đánh giá
Phân tích cụm trên cùng một tập hợp dữ liệu với các thước đo khác nhau => so sánh kết quả
Sử dụng các phương pháp phân cụm khác nhau (thứ bậc và không thứ bậc) => so sánh kết quả
Chia dữ liệu ra làm 2 phần =>thực hiện phân tích cụm riêng cho mỗi tập dữ liệu con => so sánh các trung bình cụm giữa 2 tập dữ liệu con này
Bỏ bớt một vài biến => thực hiện phân tích cụm trên tập hợp các biến còn lại => so sánh kết quả này với kết quả khi sử dụng hết các biến cần thiết.
Thực hiện phân tích cụm không thứ bậc nhiều lần với nhiều thứ tự khác nhau => kết quả ổn định
Các bước phân cụm không thứ bậc bằng SPSS
Bước 1: chọn Anlalyze → Classify → K – Means Cluster
Các bước phân cụm không thứ bậc bằng SPSS
Bước 1: Đưa 6 biến vào ô Variables và thiết lập option như sau
Chọn 3 cụm
Bảng 14.3b: Iteration Historya
Iteration
Change in Cluster Centers
1 2 3
1 2.154 2.102 2.550
2 .000 .000 .000
Bảng 14.3c: Cluster MembershipCase Number Cluster Distance
1 3 1.414
2 2 1.323
3 3 2.550
4 1 1.404
5 2 1.848
6 3 1.225
7 3 1.500
8 3 2.121
9 2 1.756
10 1 1.143
11 2 1.041
12 3 1.581
13 2 2.598
14 1 1.404
15 3 2.828
16 1 1.624
17 3 2.598
18 1 3.555
19 1 2.154
20 2 2.102
a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is .000. The current iteration is 2. The minimum distance between initial centers is 7.746.
Diễn giải
Bảng 14.3f: ANOVA
Cluster Error
F Sig.
Mean Square df Mean Square df
di mua sam la thu vui 29.108 2 .608 17 47.888 .000
di mua sam la ton tien 13.546 2 .630 17 21.505 .000
ket hop mua sam voi an uong 31.392 2 .833 17 37.670 .000
tim mua nhung gi dang mua nhat khi di mua sam 15.712 2 .728 17 21.585 .000
khong quan tam viec di mua sam 22.538 2 .816 17 27.614 .000
co the tiet kiem nhieu khi so sanh gia ca 12.171 2 1.071 17 11.363 .001
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Bảng 14.3g: Number of Cases in each Cluster
Cluster 1 6.000
2 6.000
3 8.000
Valid 20.000
Missing .000
Diễn giải
So Sánh Phân tích nhân tố Phân tích biệt số Phân tích cụm
Giống nhau Phương pháp phân loại - Phân tích thống kê nhiều biến
Khác nhau
Mục đích sử dụng
Rút gọn và tóm lược nhiều biến nghiên cứu có tương quan với nhau để dễ dàng quản lý.
Tìm được quy tắc để xếp một quan sát mới vào một trong những nhóm đã có từ trước.
Phân loại đối tượng thành những nhóm nhỏ hoàn toàn khác biệt.
Số liệu đưa vào
Các biến được đo lường 1 cách thích hợp bằng thang đo định lượng (khoảng cách hay tỷ lệ)
- Biến phụ thuộc: định tính (biến chia nhóm).- Biến độc lập: định lượng
Tập hợp các biến định lượng có khả năng mô tả sự giống nhau giữa các đối tượng.
Quyết định số nhóm
Hiểu biết trước về các nhóm để xây dựng qui tắc phân loại
Không có thông tin trước về các nhóm hay cụm.
SO SÁNH PHÂN TÍCH NHÂN TỐ - BIỆT SỐ - CỤM
(Perceptual Map)
- Biểu diễn nhận thức của khách hàng hay khách hàng tiềm năng về đối tượng cần đánh giá.
- Định vị sản phẩm, dòng sản phẩm và thương hiệu của công ty so với đối thủ cạnh tranh.
- Bản đồ nhận thức được áp dụng trong rất nhiều trường hợp như: cảm nhận của học sinh, sinh viên đối với trường Đại học, nhận thức của các nhà đầu tư đối với các ngân hàng thương mại cổ phần chưa niêm yết…
Một số biểu đồ Nhận thức minh họa
Bản đồ Nhận thức (Bản đồ Định vị) có rất nhiều đường, nhưng để đơn giản, các nhà marketing thường chỉ sử dụng hai chiều.
Ý nghĩa của Bản đồ Nhận thức
Giúp công ty hiểu được những suy nghĩ của khách hàng về công ty và đối thủ trong cùng thị trường. Ngoài ra, bản đồ nhận thức còn giúp công ty thiết lập chiến lược marketing hiệu quả thông qua việc:
- Xây dựng chiến lược cạnh tranh- Xây dựng chiến lược truyền thông hiệu quả- Xác định cơ hội mới trên thị trường- Xây dựng chiến lược thương hiệu
Quy trình lập Bản đồ Nhận thức
1. Multidimension scaling (MDS): 1. Multidimension scaling (MDS): đo lường và thể hiện các đối tượng trong không gian đa chiều hướng hay gọi là đo lường đa hướng. Thang đo khoảng.2. Correspondence analysis (CA): 2. Correspondence analysis (CA): phân tích và thể hiện sự tương hợp giữa các đối tượng với các thuộc tính, gọi là phân tích tương hợp. Thường là thang đo tỷ lệ.
Ví dụ: Trong tiếp thị, chúng ta cần biết được khách hàng dựa vào các yếu tố nào cảm nhận về thương hiệu, qua hình logo, qua quảng cáo, các panno, áp phích…Khách hàng cảm nhận thương hiệu của Cty giống với thương hiệu nào nhất? yếu tố nào tạo nên sự khác biệt chính cho thương hiệu của ta.
Quy trình lập Bản đồ Nhận thức
Trong bước này lưu ý khách hàng ở các phân khúc khác nhau thường có những đánh giá và xây dựng bản đồ không giống nhau.
Ví dụ: Trong tiếp thị thì ta đánh giá vị trí của thương hiệu để xem chúng ta đã thực hiện tốt các công tác của chiến lượt định vị sản phẩm hay chưa? Nhận ra các yếu tố quan trọng để tạo sự khác biệt, phân khúc thị trường nào là hấp dẫn…
Quy trình lập Bản đồ Nhận thức
Trên bản đồ không chỉ biểu diễn vị trí của thương hiệu khác nhau, mà còn thể hiện thị phần của từng thương hiệu
Quy trình lập Bản đồ Nhận thức
Nhận diện những thông tin có giá trị cho việc ra quyết định từ bản đồ định vị.-Sự trùng khớp với định hướng của công ty ?-Đối thủ cạnh tranh có giống với điều mà công ty đang nghĩ ?-Vị trí tiềm năng cho thương hiệu mới ?
Quy trình lập Bản đồ Nhận thức
Cấu trúc bản đồ nhận thức. Bản đồ nhận thức có 3 đặc điểm:
1. Khoảng cách giữ 2 đối tượng thể hiện “mức độ giống nhau” của 2 đối tượng này theo cảm nhận của khách hàng.
2. Một véc tơ đoạn thẳng trên bản đồ biểu thị độ lớn và chiều hướng trong không gian Euclid của các thuộc tính.
Quy trình lập Bản đồ Nhận thức
Quy trình lập Bản đồ Nhận thức
- Nếu khách hàng không nhìn nhận thương hiệu- Nếu khách hàng nhìn nhận thương hiệu vị trí
tiềm năng cho thương hiệu mới?- Nếu phát hiện ra khe hở của thị trường
Quy trình lập Bản đồ Nhận thức
Thực hành Bản đồ Nhận thức - MDS
Mở file SPSS tên
Casual wear
data trong
folder Ban do
Nhan thuc
Bước 1: Tính điểm trung bình của từng đối tượng theo các thuộc tính.
Kỹ thuật phân tích đo lường đa hướng
(1)
(2)
(1): Chọn các biến chứa điểm đánh giá cần chạy.
(2): Chọn tab Summary Statistics
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Sau khi chạy được 5 bảng, coppy qua Excel lập bảng như sau
Variable view
Data V
iew
Thực hành Bản đồ Nhận thức - MDSMở file Excel lập bên trên qua phần mềm SPSS
Bước 2: chạy lệnh MDS để chuyển dữ liệu đánh giá các TH theo các thuộc tính thành các khoảng cách phản ánh mức độ giống nhau trong không gian đa chiều hướng.
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
(1) Variables
(2)
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
(3) Model(4)option
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Tọa độ và bản đồ vị trí của các thuộc tính trong không gian 2 chiều
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Quá trình tạo tọa độ các thương hiệu.
(2’)
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Tọa độ và bản đồ vị trí của các Thương hiệu trong không gian 2 chiều
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
(1) Copy tọa độ của thuộc tính và thương hiệu qua Excel, và nối lại như sau:
(2) Mở file Excel vừa chép các tọa độ đã nối lại bằng SPSS
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Bước 3: Vẽ bản đồ vị trí.
Chọn Simple Scatter
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
12
34
(1) Chọn các biến để vào vị trí thích hợp
(2) Chọn tab Option >> chọn nut Display Chart
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Thực hành Bản đồ Nhận thức - MDSKỹ thuật phân tích đo lường đa hướng
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Mở file SPSS tên
Data My Pham
trong folder Ban
do Nhan thuc
Bước 1: Tính tần số số người trả lời
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Chọn các biến cần chạy
Bảng tần số chạy ra được
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Bước 2: Sắp xếp tần số trong Excel và chuẩn bị dữ liệu thực hiện CA
Sắp xếp tần số đã chạy được bên SPSS, copy qua Excel lập thành bảng
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Trở lại SPSS mới, qua phần Variable View khai biến như hình bên.
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Trong Data View Cột tanso: Coppy nội
dung dữ liệu (tanso) bên Excel vào cột tanso.
Cột Attri: 15 tần số ứng với 15 thuộc tính của thương hiệu. Tương tự ta có 4 thương hiệu.
Cột brand: 15 tần số ứng với 1 brand. Tương tự ta có 4 thương hiệu.
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Bước 3: Thực hiện CA và hiệu chỉnh bản đồ
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Thực hành Bản đồ Nhận thức - CAKỹ Thuật Tương Hợp
Bản đồ thể hiện vị trí các thương hiệu đã điều chỉnh định dạng
BÀI BÁO MINH HỌA
Phân tích cụm
Phân khúc thị trường du lịch sinh thái tại thành phố Cần Thơ. Phạm Lê Hồng Nhung, Đinh Công Thành và Nguyễn Quỳnh Như. Khoa Kinh tế - QTKD, Trường Đại học Cần Thơ.
Phân khúc thị trường dựa trên sở thích: một nghiên cứu về sở thích các loại món ăn ở thanh thiếu niên. Preference-based segmentation: A study of food category preferences among teenagers. Vũ Thị Hoa và Đặng Hoàng Xuân Huy. Khoa Kinh tế - Đại học Nha Trang
Biểu đồ nhận thức How to Rate 100 Visual Stimuli Efficiently (Cách để
đánh giá 100 nhận thức hiệu quả)
Tác giả: Yaliang Chuang * and Lin-Lin Chen
Graduate School of Design, National Taiwan University of Science and Technology, Taipei, Taiwan
Nội dung: Định vị nhận thức của NTD về những mẫu ‘ghế bành’
BÀI BÁO MINH HỌA
Bản đồ nhận thức How to Rate 100 Visual Stimuli Efficiently
Một số bài nghiên cứu khác
Một số bài nghiên cứu khác