Функция распределения

Материал из MachineLearning.

Перейти к: навигация, поиск

Определение

Функция распределения случайной величины X - это числовая функция, которая имеет вид:

F_X(t)=P(X<t), t\in\mathbb{R}.

Обозначение F_X используется для того, чтобы подчеркнуть, о какой случайной величине идет речь; если это ясно из контекста, то часто индекс опускают и обозначают функцию распределения просто F(t)

Свойства

Функция распределения F(t) определена на всей числовой оси и обладает следующими свойствами, вытекающими из свойств вероятностной меры:

1. 0\le F(t)\le 1

2. \lim_{t\to-\infty}F(t)=0, \lim_{t\to+\infty}F(t)=1.

3. Функция распределения является неубывающей: если t_1<t_2, то F(t_1)\le F(t_2)

4. Функция распределения непрерывна слева: \lim_{t\to x-0}F(t)=F(x) для любого x\in\mathbb{R}.

Примечание. Последнее свойство обозначает, какие значения принимает функция распределения в точках разрыва. Иногда определение функции распределения формулируют с использованием нестрогого неравенства: P(X\le t). В этом случае непрерывность слева заменяется на непрерывность справа: F(t)\to F(x) при t\to x+0. Никакие содержательные свойства функции распределения при этом не меняются, поэтому данный вопрос является лишь терминологическим.

Свойства 1-4 являются характеристическими, т.е. любая функция F(t), удовлетворяющая этим свойствам, является функцией распределения некоторой случайной величины.

Функция распределения задает распределение вероятностей случайной величины однозначно. Фактически, она является универсальным и наиболее наглядным способом описания этого распределения.

Чем сильнее функция распределения растет на заданном интервале числовой оси, тем выше вероятность попадания случайной величины в этот интервал. Если вероятность попадания в интервал равна нулю, то функция распределения на нем постоянна.

В частности, вероятность того, что случайная величина X примет заданное значение x, равна скачку функции распределения в данной точке:

P(X=x)=\lim_{t\to x+0}F(t)-\lim_{t\to x-0}F(t).

Если функция распределения непрерывна в точке x, то вероятность принять данное значение для случайной величины равна нулю. В частности, если функция распределения непрерывна на всей числовой оси (при этом и соответствующее распределение называется непрерывным), то вероятность принять любое заданное значение равна нулю.

Из определения функции распределения вытекает, что вероятность попадания случайной величины в интервал, замкнутый слева и открытый справа, равна:

P(a\le X < b) = F(b)-F(a)

С помощью данной формулы и указанного выше способа нахождения вероятности попадания в любую заданную точку, легко определяются вероятности попадания случайной величины в интервалы других типов: (a,b), tex>[a,b]</tex> и tex>(a,b]</tex>. Далее, по теореме о продолжении меры, можно однозначно продолжить меру на все борелевские множества числовой прямой \mathcal{B}(\mathbb{R}). Для того, чтобы применить эту теорему, требуется показать, что таким образом определенная на интервалах мера является на них сигма-аддитивной; при доказательстве этого в точности используются свойства 1-4 (в частности, свойство непрерывности слева 4, поэтому отбросить его нельзя).

Генерация случайной величины, имеющей заданное распределение

Рассмотрим случайную величину X, имеющую функцию распределения F_X(t). Предположим, что F_X(t) непрерывна. Рассмотрим случайную величину

Z=F_X(X).

Легко показать, что тогда Z будет иметь равномерное распределение на отрезке [0,1].

Обратно, пусть случайная величина Z имеет равномерное распределение на отрезке [0,1], а F(t) - произвольная функция распределения (т.е. удовлетворяет свойствам 1-4). Тогда случайная величина

X=F^{-1}(Z)

имеет функцию распределения F(t). Это верно для любых функций распределения (не обязательно непрерывных), однако при этом обратная функция должна быть доопределена в точках разрыва следующим образом (в точках непрерывности это определение совпадает с обычным определением обратной функции):

F^{-1}(z)=\sup\{t:F(t)\le z\}.

Данное свойство дает универсальный способ генерации случайной величины, имеющей заданное распределение, с помощью величины, равномерно распределенной на отрезке [0,1]. Именно поэтому при построении генераторов псевдослучайных чисел обычно ограничиваются именно этим распределением.

Личные инструменты