Этап 2. Постановка задачи
Постановка задачи Data Mining включает следующие шаги:
- формулировка задачи;
- формализация задачи.
Постановка задачи включает также описание статического и динамического поведения исследуемых объектов.
Пример задачи. При продвижении нового товара на рынок необходимо определить, какая группа клиентов фирмы будет наиболее заинтересована в данном товаре.
Описание статики подразумевает описание объектов и их свойств.
Пример. Клиент является объектом. Свойства объекта "клиент": семейное положение, доход за предыдущий год, место проживания.
При описании динамики описывается поведение объектов и те причины, которые влияют на их поведение.
Пример. Клиент покупает товар А. При появлении нового товара В клиент уже не покупает товар А, а покупает только товар В. Появление товара В изменило поведение клиента. Динамика поведения объектов часто описывается вместе со статикой.
Технология Data Mining не может заменить аналитика и ответить на те вопросы, которые не были заданы. Поэтому постановка задачи является необходимым этапом процесса Data Mining, поскольку именно на этом этапе мы определяем, какую же задачу необходимо решить. Иногда этапы анализа предметной области и постановки задачи объединяют в один этап.