Описательная статистика
Материал из MachineLearning.
м (оформление) |
|||
Строка 8: | Строка 8: | ||
Для более глубоких выводов о природе рассматриваемых данных используется [[индуктивная статистика]]. | Для более глубоких выводов о природе рассматриваемых данных используется [[индуктивная статистика]]. | ||
- | В рамках описательной статистики | + | В рамках описательной статистики применяются следующие простейшие техники: |
:* Графическое представление данных. | :* Графическое представление данных. | ||
:* Табличное представление данных. | :* Табличное представление данных. | ||
Строка 16: | Строка 16: | ||
:* Показать, в какой степени похожи различные рассматриваемые объекты. | :* Показать, в какой степени похожи различные рассматриваемые объекты. | ||
:* Показать, в чём и насколько они различны. | :* Показать, в чём и насколько они различны. | ||
- | При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего | + | При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи наиболее чаще всего применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего. |
- | Для решения второй задачи чаще всего | + |
Версия 09:38, 30 декабря 2008
Описательная статистика — один из разделов статистической науки, в рамках которого изучаются методы описания и представления основных свойств данных. Позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Применение описательной статистики включает следующие этапы:
- Сбор данных
- Категоризация данных
- Обобщение данных
- Представление данных
Для более глубоких выводов о природе рассматриваемых данных используется индуктивная статистика.
В рамках описательной статистики применяются следующие простейшие техники:
- Графическое представление данных.
- Табличное представление данных.
- Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.
Обобщающие статистики используются для решения двух противоположных задач:
- Показать, в какой степени похожи различные рассматриваемые объекты.
- Показать, в чём и насколько они различны.
При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи наиболее чаще всего применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.