Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)
Материал из MachineLearning.
м (→Общая постановка задачи) |
м (/* Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворе) |
||
Строка 16: | Строка 16: | ||
: Известны результаты реализации этого случайного процесса, из которых можно построить эмпирическую плотность распределения <tex>f*(\omega_t)</tex>. | : Известны результаты реализации этого случайного процесса, из которых можно построить эмпирическую плотность распределения <tex>f*(\omega_t)</tex>. | ||
- | == Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям == | + | == Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям (обратная композиция) == |
Проблемы: | Проблемы: | ||
* допустимость перехода к маргинальных плотностям; | * допустимость перехода к маргинальных плотностям; | ||
- | * выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)). | + | * выбор класса функции плотности вероятностей; |
+ | * выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции плотности распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)). | ||
+ | * метод подгонки совместной плотности для удовлетворения связям. (1) Для случая одного интервала разбиения: <tex>\min_{[ Pr**\{(i,j)\}; \lambda_k ; \sum_{i,j=0,N} {Pr**\{(i,j)\} < 1]}}{\; \; \sum_{i,j = 0,N} {( (Pr_i*\{(i)\} \, Pr_j*\{(j)\}) - Pr**\{(i,j)}\} ) ^2 + \sum_{k=1,3} { \lambda_k \, ( Pr*\{\omega_{A_k}\} - Q_k)} } </tex>, <tex>Pr**\{(i,j)\} = \int_{0}^{T}{f**(\omega_t) dt}</tex>. (2) Для случая двух интервалов разбиения: <tex>\min_{[ Pr**\{((i_1,j_1),(i_2,j_2))\}; \lambda_k ; \sum_{i1,j1,i2,j2=0,N} {Pr**\{((i1,j1),(i2,j2))\}} < 1 ]}{\; \; \sum_{i1,i2,j1,j2 = 0,N} {( (Pr_{i_1}*\{(i_1)\} \, Pr_{j_1}*\{(j_1)\} \, Pr_{i_2}*\{(i_2)\} \, Pr_{j_2}*\{(j_2)\}) - Pr**\{((i_1,j_1),(i_2,j_2))}\} ) ^2 + \sum_{k=1,3} { \lambda_k \, ( Pr*\{\omega_{A_k}\} - Q_k)} } </tex>. | ||
+ | *# статистические свойства метода подгонки; | ||
+ | *# возможность введения в квадратичное выражение констант <tex>С_{i,j}</tex>, зависящих от эмпирических данных. | ||
+ | * статистические свойства и свойства функционала качества итоговой оценки плотности. | ||
+ | |||
+ | == Сглаживание и подгонка совместной плотности (без декомпозии к маргинальны плотностям) == | ||
== Ссылки == | == Ссылки == |
Версия 08:01, 2 августа 2008
Общая постановка задачи
Задача состоит в восстановлении дискретной функции плотности вероятности (где - элементарные исходы, зависящие от времени , , где - дельта-функция Дирака. То есть, проще говоря, события разного вида происходят в случайные моменты времени ) ) при условии, что заданы условия на (где - суперпозиция финальных исходов (интегрированных по времени: )), - функция распределения вероятностей, - заданные вероятности, ).
Эмпирические частоты для заданы.
В качестве функционала качества предлагается использовать: , где - оценки на вероятности исходов, которые строятся из элементарных исходов интегрированием по времени и суперпозицией получившихся исходов; сумма берется по полному набору исходов (n - полное число исходов в ), - истинные значения вероятностей.
Частная постановка задачи
В частном случае: D=2,
В качестве функционала качества можно принять среднее среди функционалов качества для интегральных по времени исходов для деления всего времени на M одинаковых интервалов: , где ( - положительное бесконечно малое число введено, чтобы не учитывать два раза события на границе интервала). Для M=2 и D=2 множество превращается в множество типа , а множество функции плотности вероятности для двух интервалов превращается в , где - количества событий типа i и j, соответственно, которые произошли в интервале [0,T].
- Известны результаты реализации этого случайного процесса, из которых можно построить эмпирическую плотность распределения .
Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям (обратная композиция)
Проблемы:
- допустимость перехода к маргинальных плотностям;
- выбор класса функции плотности вероятностей;
- выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции плотности распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)).
- метод подгонки совместной плотности для удовлетворения связям. (1) Для случая одного интервала разбиения: , . (2) Для случая двух интервалов разбиения: .
- статистические свойства метода подгонки;
- возможность введения в квадратичное выражение констант , зависящих от эмпирических данных.
- статистические свойства и свойства функционала качества итоговой оценки плотности.