Data Mining



         

Основные характеристики пакета SAS Enterprise Miner 5.1 - часть 4


  • Вычисление собственных значений и собственных векторов на основании матриц корреляции и ковариации.
  • Графики: масштабированное отклонение, логарифмические собственные значения, кумулятивные пропорциональные собственные значения.
  • Исследование выбранных основных компонентов при помощи методов предиктивного моделирования.

Исследование временных рядов:

  • Сокращение объемов транзакционных данных на основе формирования временных рядов с использованием разнообразных методов аккумуляции и преобразования.
  • Методы анализа включают сезонный анализ, анализ тенденций, анализ временных областей, сезонную декомпозицию.
  • Исследование сокращенных временных рядов при помощи методов кластерного и предиктивного моделирования.

Управление временными метриками при помощи описательных данных.

Утилита SAS Code Node

  • Обеспечивает запись кода SAS для упрощения сложных процедур подготовки и преобразования данных.
  • Позволяет использовать процедуры других продуктов SAS.
  • Поддерживает импорт внешних моделей.
  • Позволяет создавать собственные модели и узлы Enterprise Miner.
  • Содержит макропеременные, упрощающие ссылку на источники данных, переменные и т.п.
  • Имеет расширяемую логику формирования оценочного кода.

Исчерпывающие средства моделирования

  • Выбор моделей на базе обучающей, проверочной или тестовой выборки данных с использованием различных критериев, таких как: прибыли или убытки, AIC, SBC, среднеквадратичная ошибка, частота ошибок классификации, ROC, Джини, KS (Колмогорова-Смирнова).
  • Поддерживает двоичные, номинальные, порядковые и интервальные исходные данные и целевые признаки.
  • Удобный доступ к оценочному коду и всем источникам данных.
  • Отображение нескольких результатов в одном окне позволяет лучше оценить эффективность модели.

Регрессии

  • Линейная и логистическая.
  • Пошаговая, с прямой и обратной выборкой.
  • Построитель условий для уравнений: полиномиальных, основных взаимодействий, поддержка иерархии эффектов.
  • Перекрестная проверка.
  • Правила для иерархии эффектов.
  • Методы оптимизации: сопряженные градиенты, метод двойных ломаных, метод Ньютона-Рафсона с линейным или гребневым поиском, квазиньютоновский метод, метод доверительных областей.
  • Оценочный код PMML.

Деревья решений




Содержание  Назад  Вперед