Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)

Материал из MachineLearning.

(Различия между версиями)

Версия 08:01, 2 августа 2008

Содержание

1 Общая постановка задачи
2 Частная постановка задачи
3 Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям (обратная композиция)
4 Сглаживание и подгонка совместной плотности (без декомпозии к маргинальны плотностям)
5 Ссылки
6 Литература

Общая постановка задачи

Задача состоит в восстановлении дискретной функции плотности вероятности $f(\omega_t)$ (где $\omega_t$ - элементарные исходы, зависящие от времени $t \in [0, T], T < \infty$ , $\omega_t = ( \delta_D(t-t^{(1)}_1)) * 1 + \delta_D(t-t^{(1)}_2)) * 1 + ... , \delta_D(t-t^{(2)}_1)) * 1 + \delta_D(t-t^{(2)}_2)) * 1 + ... , ) \in ( (0|1) , (0|1) , ..., (0|1) )$ , где $\delta_D(.)$ - дельта-функция Дирака. То есть, проще говоря, события разного вида $j$ происходят в случайные моменты времени $t^{(j)}_k$ ) ) при условии, что заданы условия на $P(\omega_{A_i}) = X_{A_i}$ (где $\omega_{A_i}$ - суперпозиция финальных исходов (интегрированных по времени: $\omega = \int_{0}^{T} {w_t dt} = (i_1, ...,i_D);\; i_k \in Z_{0,+} \; ( k=1,D )$ )), $P(.)$ - функция распределения вероятностей, $X_{A_i}$ - заданные вероятности, $i = 1,...,K$ ).

Эмпирические частоты для $\omega_t$ заданы.

В качестве функционала качества предлагается использовать: $q(Pr^*)=(1/n \sum_ {X \in \Omega_X} {Pr\{ X \} / Pr^*\{ X \} } - 1)^2$ , где $Pr^*$ - оценки на вероятности исходов, которые строятся из элементарных исходов интегрированием по времени и суперпозицией получившихся исходов; сумма берется по полному набору исходов (n - полное число исходов в $\Omega_X$ ), $Pr\{ X \}$ - истинные значения вероятностей.

Частная постановка задачи

В частном случае: D=2, $P(\omega_{A_1}) = \sum_{i>j; i,j \in Z_{0,+}} {Pr\{(i,j)\}} = Q_1, \; P(\omega_{A_2}) = \sum_{i<j; i,j \in Z_{0,+}} {Pr\{(i,j)\}} = Q_2, \; P(\omega_{A_3}) = \sum_{i+j \le T; i,j \in Z_{0,+}} {Pr\{(i,j)\}} = Q_3$

В качестве функционала качества можно принять среднее среди функционалов качества для интегральных по времени исходов для деления всего времени на M одинаковых интервалов: $q(Pr^*)= 1/M \sum_{l=1,M}(1/n_l \sum_ {X_l \in \Omega_{X_l}} {Pr_l\{ X \} / Pr_l^*\{ X_l \} } - 1)^2$ , где $X_l = \int_{M/T*(l-1) + \delta_+}^{M/T * l} { ( \omega^(1)_t }, \omega^(2)_t ) dt }$ ( $\delta_+$ - положительное бесконечно малое число введено, чтобы не учитывать два раза события на границе интервала). Для M=2 и D=2 множество $X_l$ превращается в множество типа $(i_1,j_1)$ , а множество функции плотности вероятности для двух интервалов превращается в $((i_1,j_1),(i_2,j_2))$ , где $(i_1,j_1)$ - количества событий типа i и j, соответственно, которые произошли в интервале [0,T].

Известны результаты реализации этого случайного процесса, из которых можно построить эмпирическую плотность распределения $f*(\omega_t)$ .

Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям (обратная композиция)

Проблемы:

допустимость перехода к маргинальных плотностям;
выбор класса функции плотности вероятностей;
выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции плотности распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)).
метод подгонки совместной плотности для удовлетворения связям. (1) Для случая одного интервала разбиения: , . (2) Для случая двух интервалов разбиения: .
1. статистические свойства метода подгонки;
2. возможность введения в квадратичное выражение констант $С_{i,j}$ , зависящих от эмпирических данных.
статистические свойства и свойства функционала качества итоговой оценки плотности.

Сглаживание и подгонка совместной плотности (без декомпозии к маргинальны плотностям)

Ссылки

Литература

Это незавершённая статья. Вы поможете проекту, исправив и дополнив её.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%B4%D0%B8%D1%81%D0%BA%D1%80%D0%B5%D1%82%D0%BD%D1%8B%D1%85_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9_%D0%BF%D1%80%D0%B8_%D0%B4%D0%BE%D0%BF%D0%BE%D0%BB%D0%BD%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D1%85_%D0%BE%D0%B3%D1%80%D0%B0%D0%BD%D0%B8%D1%87%D0%B5%D0%BD%D0%B8%D1%8F%D1%85_%D0%BD%D0%B0_%D0%B2%D0%B5%D1%80%D0%BE%D1%8F%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D0%BD%D0%B5%D0%BA%D0%BE%D1%82%D0%BE%D1%80%D1%8B%D1%85_%D1%81%D0%BE%D0%B1%D1%8B%D1%82%D0%B8%D0%B9_%28%D0%B2%D0%B8%D1%80%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D1%81%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%29»

Категории: Незавершённые статьи | Прикладная статистика | Виртуальные семинары

@@ Строка 16: / Строка 16: @@
 : Известны результаты реализации этого случайного процесса, из которых можно построить эмпирическую плотность распределения <tex>f*(\omega_t)</tex>.
-== Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям ==
+== Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям (обратная композиция) ==
 Проблемы:
 * допустимость перехода к маргинальных плотностям;
-* выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)).
+* выбор класса функции плотности вероятностей;
+* выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции плотности распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)).
+* метод подгонки совместной плотности для удовлетворения связям. (1) Для случая одного интервала разбиения: <tex>\min_{[ Pr**\{(i,j)\}; \lambda_k ; \sum_{i,j=0,N} {Pr**\{(i,j)\} < 1]}}{\; \; \sum_{i,j = 0,N} {( (Pr_i*\{(i)\} \, Pr_j*\{(j)\}) - Pr**\{(i,j)}\} ) ^2 + \sum_{k=1,3} { \lambda_k \, ( Pr*\{\omega_{A_k}\} - Q_k)} } </tex>, <tex>Pr**\{(i,j)\} = \int_{0}^{T}{f**(\omega_t) dt}</tex>. (2) Для случая двух интервалов разбиения: <tex>\min_{[ Pr**\{((i_1,j_1),(i_2,j_2))\}; \lambda_k ; \sum_{i1,j1,i2,j2=0,N} {Pr**\{((i1,j1),(i2,j2))\}} < 1 ]}{\; \; \sum_{i1,i2,j1,j2 = 0,N} {( (Pr_{i_1}*\{(i_1)\} \, Pr_{j_1}*\{(j_1)\} \, Pr_{i_2}*\{(i_2)\} \, Pr_{j_2}*\{(j_2)\}) - Pr**\{((i_1,j_1),(i_2,j_2))}\} ) ^2 + \sum_{k=1,3} { \lambda_k \, ( Pr*\{\omega_{A_k}\} - Q_k)} } </tex>.
+*# статистические свойства метода подгонки;
+*# возможность введения в квадратичное выражение констант <tex>С_{i,j}</tex>, зависящих от эмпирических данных.
+* статистические свойства и свойства функционала качества итоговой оценки плотности.
+== Сглаживание и подгонка совместной плотности (без декомпозии к маргинальны плотностям) ==
 == Ссылки ==

Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)

Материал из MachineLearning.

Версия 08:01, 2 августа 2008

Содержание

Общая постановка задачи

Частная постановка задачи

Сглаживание и подгонка совместной плотности (без декомпозии к маргинальны плотностям)

Ссылки

Литература

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты