Data Mining

       

Описательная статистика


Описательная статистика (Descriptive statistics ) - техника сбора и суммирования количественных данных, которая используется для превращения массы цифровых данных в форму, удобную для восприятия и обсуждения.

Цель описательной статистики - обобщить первичные результаты, полученные в результате наблюдений и экспериментов.

Пусть дан набор данных А, представленный в таблице 8.1.

Таблица 8.1. Набор данных Аxy
39
27
412
515
617
719
821
923,4
1025,6
1127,8

Выбрав в меню Сервис "Пакет анализа" и выбрав инструмент анализа "Описательная статистика", получаем одномерный статистический отчет, содержащий информацию о центральной тенденции и изменчивости или вариации входных данных.

В состав описательной статистики входят такие характеристики: среднее; стандартная ошибка; медиана; мода; стандартное отклонение; дисперсия выборки; эксцесс; асимметричность; интервал; минимум; максимум; сумма; счет.

Отчет "Описательная статистика" для двух переменных их набора данных А приведен в таблице 8.2.

Таблица 8.2. Описательная статистика для набора данных Аxy
Среднее6,517,68
Стандартная ошибка0,9574271082,210922382
Медиана6,518
Стандартное отклонение3,0276503546,991550456
Дисперсия выборки9,16666666748,88177778
Эксцесс-1,2-1,106006058
Асимметричность0-0,128299221
Интервал920,8
Минимум27
Максимум1127,8
Сумма65176,8
Счет1010
Наибольший (1)1127,8
Наименьший (1)27
Уровень надежности (95,0%)2,165852245,001457714

Рассмотрим, что же представляют собой характеристики описательной статистики.



Содержание раздела