Описательная статистика

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (оформление)
(категория)
 
(3 промежуточные версии не показаны)
Строка 6: Строка 6:
# Представление данных
# Представление данных
-
Для более глубоких выводов о природе рассматриваемых данных используется [[Индуктивная статистика]].
+
Для более глубоких выводов о природе рассматриваемых данных используется [[индуктивная статистика]].
-
В рамках описательной статистики используются следующие простейшие техники:
+
В рамках описательной статистики применяются следующие простейшие техники:
:* Графическое представление данных.
:* Графическое представление данных.
:* Табличное представление данных.
:* Табличное представление данных.
:* Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.
:* Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.
-
Обобщающие статистики используются для решения двух противоположных задач:
+
Обобщающие статистики используются для решения двух основных задач:
-
:* Показать, в какой степени похожи различные рассматриваемые объекты.
+
:* Показать общее в характере совокупности данных.
-
:* Показать, в чём и насколько они различны.
+
:* Показать, в чём и насколько данные различны.
-
При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего используются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения.
+
При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.
-
Для решения второй задачи чаще всего используются такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.
+
 
 +
[[Категория:Прикладная статистика]]

Текущая версия

Описательная статистика — один из разделов статистической науки, в рамках которого изучаются методы описания и представления основных свойств данных. Позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Применение описательной статистики включает следующие этапы:

  1. Сбор данных
  2. Категоризация данных
  3. Обобщение данных
  4. Представление данных

Для более глубоких выводов о природе рассматриваемых данных используется индуктивная статистика.

В рамках описательной статистики применяются следующие простейшие техники:

  • Графическое представление данных.
  • Табличное представление данных.
  • Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.

Обобщающие статистики используются для решения двух основных задач:

  • Показать общее в характере совокупности данных.
  • Показать, в чём и насколько данные различны.

При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.

Личные инструменты