Статистический отчет при создании моделей

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Описание решения)
(Постановка задачи)
Строка 9: Строка 9:
Задана выборка <tex>(x_i,\ y_i)_{i=1}^l \in \mathbb{X} \times \mathbb{Y}</tex>.
Задана выборка <tex>(x_i,\ y_i)_{i=1}^l \in \mathbb{X} \times \mathbb{Y}</tex>.
Обозначеним:
Обозначеним:
-
* <tex> X = \(x_1 <br> \ \vdots\ <br> x_l\)</tex> &nbsp;&#151; матрица информации;
+
* <tex> X = \(x_1 <br> \ \vdots\ <br> x_l\)</tex> &nbsp;&#151; матрица информации или матрица плана;
* <tex> w = \(w_1<br> \ \vdots <br> w_n\)</tex> &nbsp;&#151; вектор параметров;
* <tex> w = \(w_1<br> \ \vdots <br> w_n\)</tex> &nbsp;&#151; вектор параметров;
* <tex> y = \(y_1<br>\ \vdots<br>y_l\) </tex> &nbsp;&#151; целевой вектор.
* <tex> y = \(y_1<br>\ \vdots<br>y_l\) </tex> &nbsp;&#151; целевой вектор.

Версия 16:28, 27 сентября 2011

Содержание

В данной работе приведен обзор статистических методов оценивания качества регрессионных моделей, используемых популярными программами машинного обучения и статистической обработки данных. Приведены примеры вычисления и анализа полученных оценок.

Постановка задачи

Имеется пространство объектов-строк \mathbb{X} = \mathbb{R}^n и пространство ответов \mathbb{Y} = \mathbb{R}. Задана выборка (x_i,\ y_i)_{i=1}^l \in \mathbb{X} \times \mathbb{Y}. Обозначеним:

  •  X = \(x_1 <br> \ \vdots\ <br> x_l\)  — матрица информации или матрица плана;
  •  w = \(w_1<br> \ \vdots <br> w_n\)  — вектор параметров;
  •  y = \(y_1<br>\ \vdots<br>y_l\)  — целевой вектор.

Будем считать, что зависимость

y(x) = f(x) + \epsilon(x),

где f(x)  — некоторая неслучайная функция, \epsilon(x)  — случайная величина, с нулевым математически ожиданием. В моделях многомерной линейной регрессии предполагается, что неслучайная составляющая имеет вид:

 f(x) = <w, \ x> .

Требуется численно оценить качество модели при заданном векторе параметров  w.

Описание решения

В качестве оценки для w в статье будем использовать решение методом наименьших квадратов:

 \hat w = (X^T X)^{-1} X^T y.

Вычислительный эксперимент

Исходный код и полный текст работы

Смотри также

Литература

Данная статья является непроверенным учебным заданием.
Студент: Юрий Янович
Преподаватель: В.В. Стрижов
Срок: 28 мая 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Личные инструменты