Обобщённое среднее
Материал из MachineLearning.
(Новая: {{UnderConstruction|Баранов Александр}}) |
|||
Строка 1: | Строка 1: | ||
- | {{ | + | {{TOCright}} |
+ | <!-- <tex></tex> --> | ||
+ | '''Средней величиной по Коши''' является любая функция <tex>f(x_1, x_2,...,x_n)</tex> такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел <tex>x_1, x_2,...,x_n</tex>, и не больше, чем максимальное из этих чисел. | ||
+ | |||
+ | '''Среднее по Колмогорову''' для действительных чисел <tex>x_1,\ldots,x_n</tex> — величина вида | ||
+ | |||
+ | <tex>M(x_1,\ldots,x_n) = \phi^{-1} \ \left( \frac{ \phi (x_1)+ \cdots +\phi (x_n) }{n}\right)</tex> | ||
+ | |||
+ | где <tex>\phi</tex> — непрерывная строго монотонная функция, а <tex>\phi^{-1}</tex> — функция, обратная к <tex>\phi</tex>. При <tex>\phi(x)=x</tex> получают среднее арифметическое, при <tex>\phi(x) = \log x</tex> — среднее геометрическое, при <tex>\phi(x) = x^{-1}</tex> — среднее гармоническое, при <tex>\phi(x) = x^2</tex> — среднее квадратическое, при <tex>\phi(x) = x^\alpha, \ \alpha \not= 0</tex> — среднее степенное. | ||
+ | |||
+ | Такая функция <tex>M</tex> обладает свойствами непрерывности, монотонности по каждому <tex>x_i</tex>, симметричности. Среднее от одинаковых чисел равно их общему значению. | ||
+ | |||
+ | В соответствии с [[теория измерений|теорией измерений]] для усреднения данных, измеренных в шкале интервалов, из всех средних Колмогорова можно использовать только среднее арифметическое, а для усреднения данных, измеренных в шкале отношений, из всех средних Колмогорова можно использовать только степенные средние и среднее геометрическое | ||
+ | |||
+ | '''Выборочное среднее''' - это приближение теоретического среднего распределения, основанное на выборке из него. | ||
+ | Пусть <tex>x_1,\ldots,x_n</tex> - [[Выборка|выборка]] из [[Распределение вероятности|распределения вероятности]]. Тогда её выборочным средним называется [[случайная величина]] | ||
+ | :<tex>\bar{X} = \frac{1}{n} \sum\limits_{i=1}^n X_i</tex>. | ||
+ | |||
+ | |||
+ | '''Мода''' — значение во множестве наблюдений, которое встречается наиболее часто. Иногда в совокупности встречается более чем одна мода ''(например: 2, 6, 6, 6, 8, 9, 9, 9, 10; мода = 6 и 9)''. В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило мультимодальность указывает на то, что набор данных не подчиняется [[Нормальное распределение|нормальному распределению]]. | ||
+ | |||
+ | Мода, как средняя величина, может употребляется для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — ''белый, черный, синий, белый, синий, белый'' — мода будет равна ''белому'' цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства. | ||
+ | |||
+ | '''Медиана''' ''(50-й процентиль, [[квантиль]] 0,5)'' — возможное значение признака, которое делит ранжированную совокупность ([[вариационный ряд]] выборки) на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана. | ||
+ | |||
+ | |||
+ | == Ссылки == | ||
+ | |||
+ | * [http://ru.wikipedia.org/wiki/%D0%A1%D1%80%D0%B5%D0%B4%D0%BD%D0%B5%D0%B5_%D0%9A%D0%BE%D0%BB%D0%BC%D0%BE%D0%B3%D0%BE%D1%80%D0%BE%D0%B2%D0%B0]Wikipedia - среднее по Колмогорову | ||
+ | * [http://mmphome.1gb.ru/index.php?pid=show&id=248] А.И. Орлов - Эконометрика | ||
+ | * [http://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%B4%D0%B0_(%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0)] Wikipedia - Мода |
Версия 22:37, 11 января 2009
|
Средней величиной по Коши является любая функция такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел , и не больше, чем максимальное из этих чисел.
Среднее по Колмогорову для действительных чисел — величина вида
где — непрерывная строго монотонная функция, а — функция, обратная к . При получают среднее арифметическое, при — среднее геометрическое, при — среднее гармоническое, при — среднее квадратическое, при — среднее степенное.
Такая функция обладает свойствами непрерывности, монотонности по каждому , симметричности. Среднее от одинаковых чисел равно их общему значению.
В соответствии с теорией измерений для усреднения данных, измеренных в шкале интервалов, из всех средних Колмогорова можно использовать только среднее арифметическое, а для усреднения данных, измеренных в шкале отношений, из всех средних Колмогорова можно использовать только степенные средние и среднее геометрическое
Выборочное среднее - это приближение теоретического среднего распределения, основанное на выборке из него. Пусть - выборка из распределения вероятности. Тогда её выборочным средним называется случайная величина
- .
Мода — значение во множестве наблюдений, которое встречается наиболее часто. Иногда в совокупности встречается более чем одна мода (например: 2, 6, 6, 6, 8, 9, 9, 9, 10; мода = 6 и 9). В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило мультимодальность указывает на то, что набор данных не подчиняется нормальному распределению.
Мода, как средняя величина, может употребляется для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, черный, синий, белый, синий, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства.
Медиана (50-й процентиль, квантиль 0,5) — возможное значение признака, которое делит ранжированную совокупность (вариационный ряд выборки) на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана.