Обсуждение:Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)

Материал из MachineLearning.

(Различия между версиями)

Версия 08:33, 17 сентября 2008

Содержание

1 Обсуждение
2 Дальнейшее обобщение задачи. Другие проблемы
3 Особенности восстановления плотности через максимизацию правдоподобия (для интегральных исходов)
4 Особенности восстановления многомерной совместной плотности распределения на основе принципа максимального правдоподобия
5 Полезные статьи

Обсуждение

> ...Время считается дискретным...
1. Подход, в котором плотность вначале представляется как непрерывная функция времени, мне представляется лучшим. Поскольку в таком подходе можно выбирать различное число интервалов разбиения. Интересно, что

$\omega = \int_{0}^{T} {w_t dt} = (i_1, ...,i_D) = super(seq_{l=1,M} {\int_{T/M*(l-1)+\delta_+}^{T/M*l} {w_t dt}}) = super ( (s^{(1)}_1,...,s^{(1)}_D),...,(s^{(M)}_1,...,s^{(M)}_D)) = (s^{(1)}_1,...,s^{(1)}_D) | ... | (s^{(M)}_1,...,s^{(M)}_D)$ , где seq - операция построения последовательности, а super (или $|$ ) - операция суперпозиции (сложения) многомерных дискретных элементарных исходов ( $s^{(r)}_k$ - число исходов типа k в интервале r).| ADY 11:31, 6 августа 2008 (MSD)

> ...это приводит к появлению дополнительных ограничений типа равенств в задаче максимизации правдоподобия;...
1. Это справедливо только в параметрическом случае и в случае, когда обратные функции (которые появятся при решении связей) будут удовлетворять некоторым условиям? | ADY 11:31, 6 августа 2008 (MSD)
2. Максимизация правдоподобия - только один из методов получения оценок (пусть даже и с "хорошими" свойствами).
> ...выборка может быть «немного» неоднородной;...
1. Если вводить веса (через ядро), то, такое впечатление, это эквивалентно тому, что мы делаем выборку однородной, но во всех функционалах учитываем веса. Если решение пойдет по этому пути, тогда можно подумать на тему введения весов для каждого элемента эмпирических данных? | ADY 11:31, 6 августа 2008 (MSD)

Дальнейшее обобщение задачи. Другие проблемы

При восстановлении плотности (для выбранного числа интервалов) в качестве функционала качества хотелось бы принять описанный функционал:

$q(Pr')= 1/M \sum_{l=1,M}(1/n_l \sum_ {X_l \in \Omega_{X_l}} {Pr_l\{ X \} / Pr_l'\{ X_l \} } - 1)^2$ . Возможно, этот функционал можно как-то упростить.

Нужны критерии для сравнения различных плотностей и схема тестирования.
Хотелось бы построить доверительные интервалы для оценок плотностей. При построении доверительных интервалов можно отказаться от квадратичного функционала при оценки вероятностей сверху использовать минимизацию:

$q(Pr')= 1/M \sum_{l=1,M}(1/n_l \sum_ {X_l \in \Omega_{X_l}} {Pr_l\{ X \} / Pr_l'\{ X_l \} } - 1)$ , а при оценки снизу минимизировать: $q(Pr')= - 1/M \sum_{l=1,M}(1/n_l \sum_ {X_l \in \Omega_{X_l}} {Pr_l\{ X \} / Pr_l'\{ X_l \} } - 1)$ , для $Pr_l'\{ X_l \} > \epsilon$ (где $\epsilon$ - мин. допустимая оценка на вероятность).

В задаче, оценки на вероятность всегда имеют некоторую естественную ошибку (обозначим ее $\epsilon_0$ ), не связанную с величиной выборки. Ее природа в невозможности точно отнести эмпирические данные к одному из семейству распределений. Поэтому, нет смысла строить бесконечно точные оценки (точные оценки в пределе): достаточно строить оценки, точноcть которых быстро стремиться к $\epsilon_0$ при росте числа элементов выборки. В частной постановке задачи $\epsilon_0 = 10^{-3}$ .

| ADY 12:13, 6 августа 2008 (MSD)

Условие задачи можно расширить, учитывая дополнительное условие, что со всеми эмпирическими данными (то есть данными о реализациях изучаемого случайного процесса) идут некоторые оценки значений связей $P_j$ . Следовательно, выборки и выделение различных распределений, можно генерировать на основе этих данных о связях (и, соответственно, появляется новая задача - разбиение всех эмпирических данных на классы, согласно эмпирических данным и оценкам на значения $P_j$ ). | ADY 16:18, 11 августа 2008 (MSD)
Стоит также задача, как наиболее оптимально, выделить маргинальные частотные плотности $\nu_i(\{i\})$ и $\nu_j(\{j\})$ из совместной эмпирической плотности $\nu_{i,j}(\{i,j\})$ . Допустимость независимого выделения этих плотностей, например, как $\nu_i(\{i\}) = \nu_i(\{i, \every j \in \{0,1,...\}\})$ , требует дополнительного анализа, поскольку в этом случае $\nu_i(\{0\}) \nu_j(\{0\}) \ne \nu_{i,j}(\{0,0\})$ , хотя известно, что $\nu_{i,j}(\{0,0\})$ - вполне нормальная оценка для $P_{i,j}(\{0,0\})$ . | ADY 16:13, 20 августа 2008 (MSD)

Особенности восстановления плотности через максимизацию правдоподобия (для интегральных исходов)

Есть впечатление, что восстановления плотности через максимизацию правдоподобия для интегральных исходов имеет некоторые особенности. Например, в следующей картинке видно, что оценка "угадывает" наличие "горба", но "не угадывает" локальные свойства горба (что, в самом деле, вполне логично). Видно, что оценкой плотности для последнего интервала пользоваться скорей всего нельзя.
Синим закрашена область - плотность события $P\{\omega_{i,i+1} = 0\}$ (где $\omega_{i,i+1}$ - число событий в i-ом интервале). Точками показана та же самая плотность, параметры которой оценены по максимуму правдоподобия.

| ADY 11:44, 8 августа 2008 (MSD)

Особенности восстановления многомерной совместной плотности распределения на основе принципа максимального правдоподобия

Стоит задача найти оценку плотности распределения событий в интервалах (в каждом из которых может произойти 0 или 1 событие) таким образом, чтобы все частные плотности, то есть плотности, которые получаются из общей при условии, что события в начальных интервалах уже реализовались, тоже, так или иначе, удовлетворяли принципу максимального правдоподобия. Общая плотность имеет вид: $f_1 * f_2 ... * f_N$ . Где f_k - функция распределения событий в k-ом интервале. $f_k(q=0)=p0(k) \:\: (f_k(q=1)=1-p0(k))$ . Для конкретной задачи можно запостулировать следующий параметрический вид функций распределений в интервале:

$p0(n)=p0*Exp(- n \tau_1)$ , для $n<n'$
$p0(n)=p0*Exp(- n' \tau_1)$ , для $n'' \ge n \ge n'$
$p0(n)=p0*Exp(- n' \tau_1 + (n-n'') \tau_2)$ , для $N \ge n \g n''$

Полезные статьи

Изображение:MDL Histogram density estimation.pdf

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9E%D1%86%D0%B5%D0%BD%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%B4%D0%B8%D1%81%D0%BA%D1%80%D0%B5%D1%82%D0%BD%D1%8B%D1%85_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9_%D0%BF%D1%80%D0%B8_%D0%B4%D0%BE%D0%BF%D0%BE%D0%BB%D0%BD%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D1%85_%D0%BE%D0%B3%D1%80%D0%B0%D0%BD%D0%B8%D1%87%D0%B5%D0%BD%D0%B8%D1%8F%D1%85_%D0%BD%D0%B0_%D0%B2%D0%B5%D1%80%D0%BE%D1%8F%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D0%BD%D0%B5%D0%BA%D0%BE%D1%82%D0%BE%D1%80%D1%8B%D1%85_%D1%81%D0%BE%D0%B1%D1%8B%D1%82%D0%B8%D0%B9_%28%D0%B2%D0%B8%D1%80%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D1%81%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%29»

@@ Строка 37: / Строка 37: @@
 Стоит задача найти оценку плотности распределения событий в интервалах (в каждом из которых может произойти 0 или 1 событие) таким образом, чтобы все частные плотности, то есть плотности, которые получаются из общей при условии, что события в начальных интервалах уже реализовались, тоже, так или иначе, удовлетворяли принципу максимального правдоподобия.
-Общая плотность имеет вид: <tex>f_1 * f_2 ... * f_N</tex>. Где f_k - функция распределения событий в k-ом интервале. <tex>f_k(q=0)=p0(k) (f_k(q=1)=1-p0(k))</tex>.
+Общая плотность имеет вид: <tex>f_1 * f_2 ... * f_N</tex>. Где f_k - функция распределения событий в k-ом интервале. <tex>f_k(q=0)=p0(k) \:\: (f_k(q=1)=1-p0(k))</tex>.
 Для конкретной задачи можно запостулировать следующий параметрический вид функций распределений в интервале:
-<tex>p0(n)=p0*Exp(- n \tau_1)</tex>, для <tex>n<n'</tex>
+* <tex>p0(n)=p0*Exp(- n \tau_1)</tex>, для <tex>n<n'</tex>
-<tex>p0(n)=p0*Exp(- n' \tau_1)</tex>, для <tex>n'' \ge n \ge n'</tex>
+* <tex>p0(n)=p0*Exp(- n' \tau_1)</tex>, для <tex>n'' \ge n \ge n'</tex>
-<tex>p0(n)=p0*Exp(- n' \tau_1 + (n-n'') \tau_2)</tex>, для <tex>n<n'</tex>
+* <tex>p0(n)=p0*Exp(- n' \tau_1 + (n-n'') \tau_2)</tex>, для <tex>N \ge n \g n''</tex>
 == Полезные статьи ==
 [[Изображение:MDL Histogram density estimation.pdf]]

Обсуждение:Оценивание дискретных распределений при дополнительных ограничениях на вероятности некоторых событий (виртуальный семинар)

Материал из MachineLearning.

Версия 08:33, 17 сентября 2008

Содержание

Обсуждение

Дальнейшее обобщение задачи. Другие проблемы

Особенности восстановления плотности через максимизацию правдоподобия (для интегральных исходов)

Особенности восстановления многомерной совместной плотности распределения на основе принципа максимального правдоподобия

Полезные статьи

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты