Участник:Kropotov/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: :Функция Беллмана <tex>V_n(j)</tex> в момент времени <tex>n</tex> для состояния <tex>j</tex> соответствует стоимости опт...)
(Содержимое страницы заменено на «== Задание №1 по спецкурсу БММО 2010 ==»)
Строка 1: Строка 1:
-
:Функция Беллмана <tex>V_n(j)</tex> в момент времени <tex>n</tex> для состояния <tex>j</tex> соответствует стоимости оптимальной траектории при условии, что в момент времени <tex>n</tex> мы находимся в состоянии <tex>j</tex>. Такая оптимальная траектория для каждого состояния является единственной. Соответственно, для каждого состояния мы знаем, в частности, из какого начального состояния мы в него попали и сколько времени мы до этого находились в том или ином состоянии (для разных состояний начальные состояния будут, вообще говоря, разными). Что касается состояний в следующий момент времени, то их учитывать не нужно. В момент времени <tex>n</tex> мы считаем вероятность того, что оптимальная траектория находится в состоянии <tex>j</tex> и, быть может, это состояние <tex>j</tex> продолжится и дальше. При переходе к моменту времени <tex>n+1</tex> в том случае, если произошел переход между состояниями, то при подсчете <tex>V_{n+1}(j)</tex> мы скорректируем значение <tex>V_n(j)</tex> с учетом новых знаний.
+
== Задание №1 по спецкурсу БММО 2010 ==

Версия 18:37, 9 октября 2010

Задание №1 по спецкурсу БММО 2010

Личные инструменты