Часто используемые регрессионные модели
Материал из MachineLearning.
Ниже приведены модели, которые используются при регрессионном анализе измеряемых данных. Параметры моделей обозначены латинскими и греческими буквами: , — свободная и зависимая переменные. Все параметры и переменные принадлежат действительным числам. При соединении параметров в вектор , для представления модели в виде параметры присоединяются в лексикографическом порядке, то есть в том порядке, в котором они появляются, если представить формулу регрессионной модели в виде строки.
В список не вошли универсальные параметрические модели, например, нейронная сеть — многослойный перcептрон, функции радиального базиса, полиномы Лагранжа, полиномы Чебышёва. Также не вошли непараметрические модели. Оба эти класса требуют специального описания.
Содержание |
Нелинейные модели
Нелинейные регрессионные модели — модели вида
которые не могут быть представлены в виде скалярного произведения
Здесь — параметры регрессионной модели, свободная переменная из пространства , — зависимая переменная, — случайная величина и — функция из некоторого заданного множества.
- Экспонента, , с линейным коэффициентом, . Распространена двухкомпонентная экспоненциальная модель, . Модель может быть использована, в частности, если коэффициент изменения величины свободной переменной пропорционален ее начальной величине.
- Ряд Фурье, . Используется для описания периодических сигналов.
- Сумма гауссианов, . Используется для аппроксимации пиков. Коэффициент является амплитудой, — смещение, коэффициент отражает ширину пика. Всего в сумме может быть до пиков.
- Моном, , с линейным коэффициентом, . Используется при моделировании размерности физических или химических величин. Например, количество некоторого реагирующего в химической реакции вещества как правило, пропорциональна концентрации этого вещества, возведенного в некоторую степень.
- Рациональный полином, . Принято считать коэффициент перед единицей. Например, если , такое соглашение позволит получить уникальные числитель и знаменатель.
- Сумма синусов, . Здесь — амплитуда, — частота, — фаза некоторого периодического процесса.
- Распределение Вейбулла, двухпараметрическое, . Параметр является масштабирующим, а параметр определяет форму кривой. Трехпараметрическое распределение Вейбулла, со смещением , .
- Логарифмическая сигмоида, , используются в нейронных сетях, например в MLP, в качестве функций активации.
- Тангенциальная сигмоида, , также используются в качестве функций активации.
Линейные модели
- Полином, и его частный случай прямая . Следует помнить, что полиномы высоких степеней крайне неустойчивы и могут неадекватно описывать измеряемые данные.
- Гипербола, , а также прочие нелинейные функции с линейно-входящими параметрами: тригонометрические функции , гиперболический синус , корневые и обратно-корневые функции. Эти функции используются в финансовом анализе и других приложениях.
Этот список не является жестко заданным. Выбираемая регрессионная модель зависит прежде всего от экспертных предположений относительно моделируемого явления.
Смотри также
Литература
- Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Издательский дом «Вильямс». 2007.
- Гордин В. А. Как это посчитать? Обработка метеорологической информации на компьютере. Идеи, методы, задачи. МЦНМО, 2006.