Обобщённое среднее

Материал из MachineLearning.

Версия от 01:01, 12 ноября 2009; Vokov (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Содержание

Типы средних

Средней величиной по Коши является любая функция f(x_1, x_2,...,x_n) такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел x_1, x_2,...,x_n, и не больше, чем максимальное из этих чисел.

Среднее по Колмогорову для действительных чисел x_1,\ldots,x_n — величина вида

M(x_1,\ldots,x_n) = \phi^{-1} \  \left( \frac{ \phi (x_1)+ \cdots +\phi (x_n) }{n}\right)

где \phi — непрерывная строго монотонная функция, а \phi^{-1} — функция, обратная к \phi. При \phi(x)=x получают среднее арифметическое, при \phi(x) = \log x — среднее геометрическое, при \phi(x) = x^{-1} — среднее гармоническое, при \phi(x) = x^2 — среднее квадратическое, при \phi(x) = x^\alpha, \ \alpha \not= 0 — среднее степенное.

Такая функция M обладает свойствами непрерывности, монотонности по каждому x_i, симметричности. Среднее от одинаковых чисел равно их общему значению.

В соответствии с теорией измерений для усреднения данных, измеренных в шкале интервалов, из всех средних Колмогорова можно использовать только среднее арифметическое, а для усреднения данных, измеренных в шкале отношений, из всех средних Колмогорова можно использовать только степенные средние и среднее геометрическое

Виды средних

Выборочное среднее - это приближение теоретического среднего распределения, основанное на выборке из него. Пусть x_1,\ldots,x_n - выборка из распределения вероятности. Тогда её выборочным средним называется случайная величина

\bar{X} = \frac{1}{n} \sum\limits_{i=1}^n X_i.


Мода — значение во множестве наблюдений, которое встречается наиболее часто. Иногда в совокупности встречается более чем одна мода (например: 2, 6, 6, 6, 8, 9, 9, 9, 10; мода = 6 и 9). В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило мультимодальность указывает на то, что набор данных не подчиняется нормальному распределению.

Мода, как средняя величина, может употребляется для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, черный, синий, белый, синий, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства.

Медиана (50-й процентиль, квантиль 0,5) — возможное значение признака, которое делит ранжированную совокупность (вариационный ряд выборки) на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана.

Средние в порядковой шкале

Из всех средних по Коши допустимыми средними в порядковой шкале являются только члены вариационного ряда (порядковые статистики). В качестве среднего для данных, измеренных в порядковой шкале, можно использовать, в частности, медиану (при нечетном объеме выборки). При четном же объеме следует применять один из двух центральных членов вариационного ряда - как их иногда называют, левую медиану или правую медиану. Моду тоже можно использовать - она всегда является членом вариационного ряда. Но никогда нельзя рассчитывать среднее арифметическое, среднее геометрическое и т.д.

Ссылки

Личные инструменты