5 центров классов интерпретация полученных
compute lns=Ln(dc5/memb).
*вычисление логарифма душевого дохода.
compute lincome=ln(df14/memb).
*стандартизация переменных.
DESCRIPTIVES VARIABLES=lincome lns/SAVE .
QUICK CLUSTER zlincome zlns /MISSING=PAIRWISE /CRITERIA= CLUSTER(3) /SAVE CLUSTER /PRINT ANOVA.
На основании таблицы 7. 5 центров классов интерпретация полученных кластеров следующая:
Кластер 1 — зажиточные семьи, имеющие относительно большой доход и жилплощадь.
Кластер 2 — семьи, проживающие в квартирах с небольшой площадью, но имеющие относительно высокий доход.
Кластер 3 — семьи, имеющие низкий доход и ограниченные в жилплощади.
Кластер 4 — семьи, имеющие несколько больший доход, чем в среднем, но ограниченные в жилплощади.
Таблица 5.3. Центры кластеров (Final Cluster Centers)Cluster
| 1 | 2 | 3 | 4 |
Zscore(LINCOME) | 1.26 | 0.52 | -1.08 | -0.40 |
Zscore(LNS) | 1.35 | -0.56 | -0.86 | 0.58 |
Таблица 5.4. Дисперсионный анализ в методе k-средних (ANOVA, имееет только описательное значение)ClusterErrorFSig
| Mean Square | Df | | Mean Square | Df | | |
ZLINCOME Zscore(LINCOME) | 513.006 | 3 | .370 | 2440 | 1384.7 | 0 |
ZLNS Zscore(LNS) | 530.153 | 3 | .363 | 2491 | 1461.6 | 0 |
Рис. 5.5. Классификация семей по душевому доходу Lincome и жилплощади на человека LNS (в логарифмических шкалах).
Дисперсионный анализ (табл. 5.4) показал, что по обоим переменным различие кластеров существенно. Но о статистической значимости переменных говорить бессмысленно, поскольку гипотеза дисперсионного анализа — по сути, независимость групп и "зависимой" переменной, а в данном случае группы сформированы на основе значений "независимых" переменных.
Полезно рассмотреть график рассеяния данных по кластерам (рис. 5.5). В нашем случае, пожалуй, не стоит говорить о выделении "сгущений" точек в признаковом пространстве, скорее, программа нашла разумные границы для описания типов, выделив их в непрерывном двумерном распределении.
Содержание Назад Вперед