Data Mining

       

Визуализация инструментов Data Mining


Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

  • Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.
  • Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.
  • Для карт Кохонена: карты входов, выходов, другие специфические карты.
  • Для линейной регрессии в качестве визуализатора выступает линия регрессии.
  • Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

  • являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);
  • помогают интерпретировать полученный результат;
  • являются средством оценки качества построенной модели;
  • сочетают перечисленные выше функции (дерево решений, дендрограмма).


Содержание раздела