Data Mining



         

Основные характеристики пакета SAS Enterprise Miner 5.1 - часть 6


  • Метод отбора ближайших k-соседей для категоризации или прогноза наблюдений.
  • Запатентованные методы создания дерева и поиска с уменьшенной размерностью.

Множества моделей

  • Объединение прогнозов моделей для создания потенциально более сильного решения.
  • Среди методов: усреднение, мажоритарная выборка, выбор максимального значения.

Сравнение моделей

  • Сравнение нескольких моделей в рамках единой инструментальной оболочки для всех источников данных.
  • Автоматический выбор лучшей модели на основе заданного пользователем критерия.
  • Расширенная статистика соответствия и диагностики.
  • Ступенчатые диаграммы.
  • Кривые ROC.
  • Диаграммы прибылей и убытков с возможностью выбора решения.
  • Матрица неточностей (классификации).
  • График распределения вероятностных оценок классовых целевых признаков.
  • Ранжирование и распределение оценок интервальных целевых признаков.

Количественная оценка

  • Интерактивная количественная оценка узла в рамках графического интерфейса.
  • Автоматическая генерация оценочного кода на языках SAS, C, Java и PMML.
  • Моделирование сбора, кластеризации, преобразования и вычисления недостающих значений для оценочных кодов на языках SAS, C и Java.
  • Развертывание моделей в нескольких средах.

Инструментальные средства

  • Узел удаления переменных.
  • Узел слияния данных.
  • Узел метаданных, позволяющий изменять столбцы метаданных, например роль, уровень измерений и порядок.



Содержание  Назад  Вперед