Data Mining



         

Основные характеристики пакета SAS Enterprise Miner 5.1 - часть 2


  • Применение различных распределительных порогов, позволяющих исключить значения из экстремальных интервалов.
  • Объединение классовых значений, встречающихся менее n раз.

Замена данных

  • С использованием мер центрированности.
  • На основе распределения.
  • Заполнение дерева суррогатными значениями.
  • Методом усреднения расстояний.
  • С использованием устойчивых M-оценок.
  • С использованием стандартных констант.

Описательная статистика

Одномерные статистические таблицы и графики:

  • Интервальные переменные n, среднее, медиана, минимум, максимум, стандартное отклонение, масштабированное отклонение и процент отсутствия.
  • Классовые переменные число категорий, счетчики, модальные, процентные модальные, процент отсутствия.
  • Графики распределения.
  • Статистическая разбивка для каждого уровня целевых классов.

Двумерные статистические таблицы и графики:

  • Упорядоченные графики корреляции Пирсона и Спирмана.
  • Упорядоченный график хи-квадрат с возможностью группировки непрерывных исходных данных по n группам.
  • График коэффициентов вариации.

Отбор переменных по logworth-критерию.

Другие интерактивные графики:

  • "Тепловые" карты, отражающие корреляцию или ассоциацию типа хи-квадрат первоначальных значений с целевыми признаками по сегментам.
  • Графики стоимости переменных, ранжирующие первоначальные значенияна основании их стоимости по целевому признаку.
  • Распределения классовых переменных по целевым признакам и/или сегментным переменным.

Графики масштабированного среднего отклонения.

Графика/визуализация

Графики, создаваемые в пакетном и интерактивном режимах: графики разброса, гистограммы, многомерные графики, круговые диаграммы, диаграммы с областями, пузырьковые диаграммы.

Удобный Java-мастер для построения графиков:

  • Заголовки и сноски.
  • Возможность применения к данным предложения WHERE.
  • Возможность выбора из нескольких цветовых схем.
  • Простота масштабирования осей.
  • Использование данных, полученных в результате анализа в пакете.
  • Enterprise Miner, для создания специализированных графиков.

Динамическая загрузка данных в клиентское приложение при помощи нескольких методик выборки.




Содержание  Назад  Вперед