Data Mining



         

Основные характеристики пакета SAS Enterprise Miner 5.1 - часть 5


Общая методология:

  • CHAID (автоматическое выявление взаимодействия по методу хи-квадрат).
  • Деревья классификации и регрессии.
  • C 4.5.
  • Отбор деревьев на основе целевых значений прибыльности или роста с соответствующим отсечением ветвей.

Критерии расщепления: вероятностный критерий хи-квадрат, вероятностный

F-критерий, критерий Джини, критерий энтропии, уменьшение дисперсии.

Автоматический вывод идентификаторов листьев дерева в качестве входных

значений для последующего моделирования.

Отображение правил на английском языке.

Вычисление значимости переменных для предварительного отбора.

Уникальное представление консолидированной диаграммы дерева.

Интерактивная работа с деревом на настольном ПК:

  • Интерактивное расширение и обрезание деревьев.
  • Задание специальных точек разбиения, включая двоичные или многовариантные разбиения.
  • Свыше 13 динамически связанных таблиц и графиков, позволяющих произвести более качественную оценку дерева.
  • Возможность распечатать диаграмму дерева на одном или нескольких листах.

В основе - новая быстрая процедура ARBORETUM.

Нейронные сети

Узел нейронной сети:

  • Гибкие архитектуры сетей с развитыми функциями комбинирования и активации.
  • 10 методов обучения сети.
  • Предварительная оптимизация.
  • Автоматическая стандартизация входных параметров.
  • Поддержка направленных связей.

Узел самоорганизующейся нейронной сети:

  • Автоматизированное создание многоуровневых персептронов для поиска оптимальной конфигурации.
  • Выбор функций типа и активации из четырех различных типов архитектур.
  • Оценочный код PMML.

Узел нейронной сети анализа данных (DM Neural node):

  • Создание модели с уменьшением размерности и выбором функций.
  • Быстрое обучение сети.
  • Линейное и нелинейное оценивание.

Двухуровневое моделирование

  • Последовательное и параллельное моделирование для классовых и интервальных целевых признаков.
  • Выбор модели в виде дерева решений, регрессии или нейронной сети на каждом уровне.
  • Управление применением прогноза для классов к прогнозу интервалов.
  • Точная оценка экономической выгодности клиентов.

Методы вывода путем сопоставления




Содержание  Назад  Вперед