Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Общая постановка задачи

Задача состоит в восстановлении дискретной функции плотности вероятности f(\omega_t) (где \omega_t - элементарные исходы, зависящие от времени t \in [0, T], T < \infty, \omega_t = ( \delta_D(t-t^{(1)}_1)) * 1 + \delta_D(t-t^{(1)}_2)) * 1 + ... , \delta_D(t-t^{(2)}_1)) * 1 + \delta_D(t-t^{(2)}_2)) * 1 + ... , ) \in ( (0|1) , (0|1) , ..., (0|1) ), где \delta_D(.) - дельта-функция Дирака. То есть, проще говоря, события разного вида j происходят в случайные моменты времени t^{(j)}_k) ) при условии, что заданы условия на P(\omega_{A_i}) = X_{A_i} (где \omega_{A_i} - суперпозиция финальных исходов (интегрированных по времени: \omega = \int_{0}^{T} {w_t dt} = (i_1, ...,i_D);\; i_k \in Z_{0,+} \; ( k=1,D ))), P(.) - функция распределения вероятностей, X_{A_i} - заданные вероятности, i = 1,...,K).

Эмпирические частоты для \omega_t заданы.

В качестве функционала качества предлагается использовать: q(Pr^*)=(1/n  \sum_ {X \in \Omega_X} {Pr\{ X \} / Pr^*\{ X \} } - 1)^2, где Pr^* - оценки на вероятности исходов, которые строятся из элементарных исходов интегрированием по времени и суперпозицией получившихся исходов; сумма берется по полному набору исходов (n - полное число исходов в \Omega_X), Pr\{ X \} - истинные значения вероятностей.

Частная постановка задачи

В частном случае: D=2, P(\omega_{A_1}) = \sum_{i>j; i,j \in Z_{0,+}} {Pr\{(i,j)\}} = Q_1, \; P(\omega_{A_2}) = \sum_{i<j; i,j \in Z_{0,+}} {Pr\{(i,j)\}} = Q_2, \; P(\omega_{A_3}) = \sum_{i+j \le T; i,j \in Z_{0,+}} {Pr\{(i,j)\}} = Q_3

В качестве функционала качества можно принять среднее среди функционалов качества для интегральных по времени исходов для деления всего времени на M одинаковых интервалов: q(Pr^*)= 1/M \sum_{l=1,M}(1/n_l  \sum_ {X_l \in \Omega_{X_l}} {Pr_l\{ X \} / Pr_l^*\{ X_l \} } - 1)^2, где X_l = \int_{M/T*(l-1) + \delta_+}^{M/T * l} { (  \omega^(1)_t }, \omega^(2)_t ) dt } (\delta_+ - положительное бесконечно малое число введено, чтобы не учитывать два раза события на границе интервала). Для M=2 и D=2 множество X_l превращается в множество типа (i_1,j_1), а множество функции плотности вероятности для двух интервалов превращается в ((i_1,j_1),(i_2,j_2)), где (i_1,j_1) - количества событий типа i и j, соответственно, которые произошли в интервале [0,T].

Известны результаты реализации этого случайного процесса, из которых можно построить эмпирическую плотность распределения f*(\omega_t).

Проблема выбора функции и параметризации для маргинальных плотностей (декомпозиция) и подгонка совместной плотности для удовлетворения связям

Проблемы:

  • допустимость перехода к маргинальных плотностям;
  • выбор метода оценки параметров. Хорош ли метод максимального правдоподобия для оценки параметров функции распределения, если при оценивании используются только интегральные по времени величины (интегральные эмпирическая функция и интегральная функция распределения вероятностей)).

Ссылки

Литература

Личные инструменты