Описание окрестности точки наибольшего правдоподобия моделей (пример)

Материал из MachineLearning.

(Различия между версиями)

Версия 00:35, 15 декабря 2010

Содержание

1 Постановка задачи
2 Порождение свободных переменных
3 Алгоритм
4 Вычислительный эксперимент
5 Исходный код
6 Литература

Постановка задачи

Пусть,

$X = \{\mathbf{x}_j\}^m_{j=1}$ - множество из m свободных переменных, $\{x_j\}^m_{i=j} \in\mathbb{R}^n$ , где n - размерность пространства, $\mathbf{y}\in\mathbb{R}^n$ - зависимая переменная.

Рассмотрим следующую линейную модель регрессии, описывающую связь между свободными и зависимой переменными

$\mathbf{y} = X \mathbf{w} + \mathbf{\varepsilon}$ (1)

где $\varepsilon \in N(0, \sigma^2)$ - нормальное распределение.

задача?

Порождение свободных переменных

Множества измеряемых признаков бывает недостаточно для построения модели удовлетворительного качества. Требуется расширить множество признаков с помощью функциональных преобразований.

Предлагается следующий способ порождения новых признаков:

Пусть задано множество свободных переменных $Z = \{\xi_u\}^U_{u=1}$ и конечное множество порождающих функций $G = \{g_v\}^V_{v=1}$ .

Обозначим $a_i = g_v(\xi_u)$ , где индекс $i = (v - 1)U + u$ .

Рассмотрим декартово произведение $Z \times G$ , где элементу $(g_v,\xi_u)$ ставится в соответствие суперпозиция $g_v(\xi_u)$ , однозначно определяемая индексами $v,u$ .

В качестве модели, описывающей отношение между зависимой переменной $y$ и свободными переменными $a_i$ , используется полином Колмогорова-Габора:

$y=w_0+\sum_{\alpha=1}^{UV}w_{\alpha}a_{\alpha} + \sum_{\alpha=1}^{UV}\sum_{\beta=1}^{UV}w_{{\alpha}{\beta}}a_{\alpha}a_{\beta} + \ldots +\sum_{\alpha=1}^{UV}\ldots\sum_{\psi=1}^{UV}w_{{\alpha} \ldots {\psi}}a_{\alpha}\ldots a_{\psi}$ ,

где $\mathbf{w} = (w_0, w_{\alpha}, w_{\alpha\beta}, \ldots , w_{{\alpha} \ldots {\psi}})^T$ и ${\alpha, \beta, \ldots , \psi = 1 \ldots UV}$ .

$\{0\} \cup \{\alpha\} \cup \{\alpha,\beta\} \cup \ldots \cup \{\alpha,\beta \ldots \psi\} \rightarrow \Omega$ - множество индексов, размерности N.

$\xi_u~ \longrightarrow\longrightarrow\longrightarrow^{g_v}\longrightarrow\longrightarrow ~g_v(\xi_u) ~=^{def} a_i~\longrightarrow\longrightarrow^{\prod^{UV}_{\alpha=1}}\longrightarrow^{\ldots}\longrightarrow^{\prod^{UV}_{\psi=1}}\longrightarrow ~x_j$

Возвращаясь к формуле (1):

$y^i = \sum_{j=1}^{N}w_jx^i_j + \varepsilon^i$ (2)

Алгоритм

Вычислительный эксперимент

Исходный код

Литература

Стрижов В.В Методы выбора регрессионных моделей. — ВЦ РАН, 2010.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9E%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BE%D0%BA%D1%80%D0%B5%D1%81%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D1%82%D0%BE%D1%87%D0%BA%D0%B8_%D0%BD%D0%B0%D0%B8%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B5%D0%B3%D0%BE_%D0%BF%D1%80%D0%B0%D0%B2%D0%B4%D0%BE%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D1%8F_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29»

@@ Строка 9: / Строка 9: @@
-<center><tex>\mathbf{y} = X \mathbf{w} + \mathbf{\varepsilon},</tex></center>
+<center><tex>\mathbf{y} = X \mathbf{w} + \mathbf{\varepsilon}</tex>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;     (1)</center>
@@ Строка 40: / Строка 40: @@
 <tex>\xi_u~ \longrightarrow\longrightarrow\longrightarrow^{g_v}\longrightarrow\longrightarrow ~g_v(\xi_u) ~=^{def} a_i~\longrightarrow\longrightarrow^{\prod^{UV}_{\alpha=1}}\longrightarrow^{\ldots}\longrightarrow^{\prod^{UV}_{\psi=1}}\longrightarrow  ~x_j</tex>
+Возвращаясь к формуле (1):
+<center><tex>y^i = \sum_{j=1}^{N}w_jx^i_j + \varepsilon^i</tex> &nbsp;&nbsp;&nbsp;(2)</center>
 == Алгоритм ==
@@ Строка 54: / Строка 57: @@
 |год          = 2010
 }}
+&nbsp;

Описание окрестности точки наибольшего правдоподобия моделей (пример)

Материал из MachineLearning.

Версия 00:35, 15 декабря 2010

Содержание

Постановка задачи

Порождение свободных переменных

Алгоритм

Вычислительный эксперимент

Исходный код

Литература

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты