Data Mining



         

Oracle Data Mining - часть 2


Важной особенностью системы ODM являются его технические характеристики: работа в архитектуре клиент-сервер, широкое использование техники параллельных вычислений, высокая степень масштабируемости при увеличении вычислительных ресурсов.

Характеристики Oracle Data Mining [114]:

  • Встроенные в Oracle Database алгоритмы извлечения знаний (DataMining Server).
  • DM-инфраструктура вместо готовой инструментальной среды.
  • API для разработки.

Встроенные алгоритмы извлечения знаний позволяют упростить процесс извлечения знаний, устраняют необходимость дополнительного перемещения и хранения данных. Обладают производительностью и масштабируемостью.

Oracle Data Mining API. Использование Java API для разработки на Java основано на принципах JDM (стандарт для Data Mining).

Версия Data Mining 10g поддерживает спектр алгоритмов, которые приведены в таблице 26.1.

Таблица 26.1. Алгоритмы, реализованные в Oracle Data Mining
Классификационные моделиNa_ve Bayes, Adaptive Bayes Network
Классификации и регрессионные моделиSupport Vector Machine
Поиск существенных атрибутовMinimal Descriptor Length
КластеризацияEnhanced K-means, O-cluster
Поиск ассоциацийApriory Algorithm
Выделение признаковNon-Negative Matrix Factorization

Особенность алгоритмов, реализованных в Oracle Data Mining, состоит в том, что все они работают непосредственно с реляционными базами данных и не требуют выгрузки и сохранения данных в специальных форматах. Кроме собственно алгоритмов, в опцию ODM входят средства подготовки данных, оценки результатов, применения моделей к новым наборам данных. Использовать все эти возможности можно как на программном уровне с помощью Java API или PL/SQL API, так и с помощью графической среды ODM Client, которая ориентирована на работу аналитиков, решающих задачи прогнозирования, выявления тенденций, сегментации и другие.




Содержание  Назад  Вперед