Data Mining

       

Представление данных в одном, двух и трех измерениях


К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

  • одномерное (univariate) измерение, или 1-D;
  • двумерное (bivariate) измерение, или 2-D;
  • трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

  • его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);
  • топологические особенности;
  • наличие трендов;
  • информацию о взаимном расположении данных;
  • существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

  • использование многомерных методов представления информации (они рассмотрены ниже);
  • снижение размерности до одно-, двух- или трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.


Содержание раздела