Определение гиперпараметров для MVR

Материал из MachineLearning.

Версия от 08:57, 13 апреля 2009; Strijov (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Перейти к: навигация, поиск

Это незавершённая статья. Вы поможете проекту, исправив и дополнив её.

При максимизации вероятности появления данных D для гиперпараметров α и β мы получаем:

$\ln p(D|\alpha , \beta ) = -E_W^{MP} - \frac{1}{2}\sum_{j=1}^{W}\frac{1}{\lambda_j+\alpha} +\frac{W}{2\alpha}$

Отсюда, приравнивая логарифм к 0, получаем выражение для α.

$2\alpha E_{MP}^W = W - \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}$

Выражаем γ - мера числа хорошо обусловленных параметров модели:

$\gamma = \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}$

Далее, находя оптимальное β, получим, что

$2 \beta E_D^{MP}= N - \sum_{j=1}^{W}\frac{\lambda_j}{\lambda_j+\alpha}$

Таким образом, на каждом шаге у нас для модели определены гиперпараметры α,β,γ. При этом β определена для всей модели, а α и γ для каждой функции из суперпозиции. Так как оптимизация параметров w дает нам положительно определенную форму гессиана, его собственные значения λ больше нуля, и, таким образом, γ меньше нуля.

Мы имеем следующий итерационный процесс пересчета α и γ:

$\alpha_{ij}^{new} = \frac{W-\gamma_i}{E_W(b_{ij})}$

$\gamma = \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}$

Процесс сходится, так как увеличение α ведет к увеличению γ, что на следующем шаге ведет к уменьшению α.

Код, считающий гиперпараметры:

   for m=1:limit
       gamma(m)=0;
       for i=1:size(Model.wFound,2)
           gamma(m)=gamma(m)+max(alpha)/(lambda(i)+max(alpha));
       end
       for i=1:size(Model.wFound,2)
           alpha(i)=(size(Model.wFound,2)-gamma(m))/Model.wFound(i)^2
       end
       beta(m)=(size(y,1)-gamma(m))/Model.errTest;
   end

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B3%D0%B8%D0%BF%D0%B5%D1%80%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%D0%B4%D0%BB%D1%8F_MVR»

Категория: Незавершённые статьи

Определение гиперпараметров для MVR

Материал из MachineLearning.

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты