Проектирование систем искусственного интеллекта



     еда доставка пермь |     

Быстрый кластерный анализ - часть 3


compute lns=Ln(dc5/memb).

*вычисление логарифма душевого дохода.

compute lincome=ln(df14/memb).

*стандартизация переменных.

DESCRIPTIVES VARIABLES=lincome lns/SAVE .

QUICK CLUSTER zlincome zlns /MISSING=PAIRWISE /CRITERIA= CLUSTER(3) /SAVE CLUSTER /PRINT ANOVA.

На основании таблицы 7.5 центров классов интерпретация полученных кластеров следующая:

Кластер 1 — зажиточные семьи, имеющие относительно большой доход и жилплощадь.

Кластер 2 — семьи, проживающие в квартирах с небольшой площадью, но имеющие относительно высокий доход.

Кластер 3 — семьи, имеющие низкий доход и ограниченные в жилплощади.

Кластер 4 — семьи, имеющие несколько больший доход, чем в среднем, но ограниченные в жилплощади.

Таблица 5.3. Центры кластеров (Final Cluster Centers)Cluster
1234
Zscore(LINCOME) 1.26 0.52 -1.08 -0.40
Zscore(LNS) 1.35 -0.56 -0.86 0.58
Таблица 5.4. Дисперсионный анализ в методе k-средних (ANOVA, имееет только описательное значение)ClusterErrorFSig
Mean SquareDfMean SquareDf
ZLINCOME Zscore(LINCOME)513.0063.37024401384.70
ZLNS Zscore(LNS)530.1533.36324911461.60

Классификация семей по душевому доходу Lincome и жилплощади на человека LNS (в логарифмических шкалах).

Рис. 5.5.  Классификация семей по душевому доходу Lincome и жилплощади на человека LNS (в логарифмических шкалах).

Дисперсионный анализ (табл. 5.4) показал, что по обоим переменным различие кластеров существенно. Но о статистической значимости переменных говорить бессмысленно, поскольку гипотеза дисперсионного анализа — по сути, независимость групп и "зависимой" переменной, а в данном случае группы сформированы на основе значений "независимых" переменных.

Полезно рассмотреть график рассеяния данных по кластерам (рис. 5.5). В нашем случае, пожалуй, не стоит говорить о выделении "сгущений" точек в признаковом пространстве, скорее, программа нашла разумные границы для описания типов, выделив их в непрерывном двумерном распределении.




Содержание  Назад  Вперед