Функция распределения

Материал из MachineLearning.

(Различия между версиями)

Версия 14:24, 9 ноября 2009

Определение

Функция распределения случайной величины $X$ - это числовая функция, которая имеет вид:

$F_X(t)=P(X<t)$ , $t\in\mathbb{R}$ .

Обозначение $F_X$ используется для того, чтобы подчеркнуть, о какой случайной величине идет речь; если это ясно из контекста, то часто индекс опускают и обозначают функцию распределения просто $F(t)$

Свойства

Функция распределения $F(t)$ определена на всей числовой оси и обладает следующими свойствами, вытекающими из свойств вероятностной меры:

1. $0\le F(t)\le 1$

2. $\lim_{t\to-\infty}F(t)=0$ , $\lim_{t\to+\infty}F(t)=1$ .

3. Функция распределения является неубывающей: если $t_1<t_2$ , то $F(t_1)\le F(t_2)$

4. Функция распределения непрерывна слева: $\lim_{t\to x-0}F(t)=F(x)$ для любого $x\in\mathbb{R}$ .

Примечание. Последнее свойство обозначает, какие значения принимает функция распределения в точках разрыва. Иногда определение функции распределения формулируют с использованием нестрогого неравенства: $P(X\le t)$ . В этом случае непрерывность слева заменяется на непрерывность справа: $F(t)\to F(x)$ при $t\to x+0$ . Никакие содержательные свойства функции распределения при этом не меняются, поэтому данный вопрос является лишь терминологическим.

Свойства 1-4 являются характеристическими, т.е. любая функция $F(t)$ , удовлетворяющая этим свойствам, является функцией распределения некоторой случайной величины.

Функция распределения задает распределение вероятностей случайной величины однозначно. Фактически, она является универсальным и наиболее наглядным способом описания этого распределения.

Чем сильнее функция распределения растет на заданном интервале числовой оси, тем выше вероятность попадания случайной величины в этот интервал. Если вероятность попадания в интервал равна нулю, то функция распределения на нем постоянна.

В частности, вероятность того, что случайная величина $X$ примет заданное значение $x$ , равна скачку функции распределения в данной точке:

$P(X=x)=\lim_{t\to x+0}F(t)-\lim_{t\to x-0}F(t)$ .

Если функция распределения непрерывна в точке $x$ , то вероятность принять данное значение для случайной величины равна нулю. В частности, если функция распределения непрерывна на всей числовой оси (при этом и соответствующее распределение называется непрерывным), то вероятность принять любое заданное значение равна нулю.

Из определения функции распределения вытекает, что вероятность попадания случайной величины в интервал, замкнутый слева и открытый справа, равна:

$P(a\le X < b) = F(b)-F(a)$

С помощью данной формулы и указанного выше способа нахождения вероятности попадания в любую заданную точку, легко определяются вероятности попадания случайной величины в интервалы других типов: $(a,b)$ , tex>[a,b]</tex> и tex>(a,b]</tex>. Далее, по теореме о продолжении меры, можно однозначно продолжить меру на все борелевские множества числовой прямой $\mathcal{B}(\mathbb{R})$ . Для того, чтобы применить эту теорему, требуется показать, что таким образом определенная на интервалах мера является на них сигма-аддитивной; при доказательстве этого в точности используются свойства 1-4 (в частности, свойство непрерывности слева 4, поэтому отбросить его нельзя).

Генерация случайной величины, имеющей заданное распределение

Рассмотрим случайную величину $X$ , имеющую функцию распределения $F_X(t)$ . Предположим, что $F_X(t)$ непрерывна. Рассмотрим случайную величину

$Z=F_X(X)$ .

Легко показать, что тогда $Z$ будет иметь равномерное распределение на отрезке $[0,1]$ .

Обратно, пусть случайная величина $Z$ имеет равномерное распределение на отрезке $[0,1]$ , а $F(t)$ - произвольная функция распределения (т.е. удовлетворяет свойствам 1-4). Тогда случайная величина

$X=F^{-1}(Z)$

имеет функцию распределения $F(t)$ . Это верно для любых функций распределения (не обязательно непрерывных), однако при этом обратная функция должна быть доопределена в точках разрыва следующим образом (в точках непрерывности это определения совпадает с обычным):

$F^{-1}(z)=\sup\{t:F(t)\le z\}$ .

Данное свойство дает универсальный способ генерации случайной величины, имеющей заданное распределение, с помощью величины, равномерно распределенной на отрезке $[0,1]$ . Именно поэтому при построении генераторов псевдослучайных чисел обычно ограничиваются именно этим распределением.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A4%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F»

Категория: Материалы по теории вероятностей

@@ Строка 29: / Строка 29: @@
 В частности, вероятность того, что случайная величина <tex>X</tex> примет заданное значение <tex>x</tex>, равна скачку функции распределения в данной точке:
-<center><tex>P(X=x)=\lim_{t\tox+0}F(t)-\lim_{t\to x-0}F(t)</tex>.</center>
+<center><tex>P(X=x)=\lim_{t\to x+0}F(t)-\lim_{t\to x-0}F(t)</tex>.</center>
 Если функция распределения непрерывна в точке <tex>x</tex>, то вероятность принять данное значение для случайной величины равна нулю. В частности, если функция распределения непрерывна на всей числовой оси (при этом и соответствующее распределение называется '''непрерывным'''), то вероятность принять любое заданное значение равна нулю.

Функция распределения

Материал из MachineLearning.

Версия 14:24, 9 ноября 2009

Определение

Свойства

Генерация случайной величины, имеющей заданное распределение

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты