Участник:Lr2k/Песочница

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Введение

Постановка математической задачи

Одной из основных задач численного анализа является задача об интерполяции функций. Пусть на отрезке a\le \x\le \b задана сетка \omega=\{x_i:x_0=a<x_1<\cdots<x_i<\cdots<x_n=b\} и в её узлах заданы значения функции y(x), равные y(x_0)=y_0,\cdots,y(x_i)=y_i,\cdots,y(x_n)=y_n. Требуется построить интерполянту — функцию f(x), совпадающую с функцией y(x) в узлах сетки:

( 1 )

f(x_i)=y_i, i=0,1,\cdots,n.

Основная цель интерполяции — получить быстрый (экономичный) алгоритм вычисления значений f(x) для значений x, не содержащихся в таблице данных.

Интерполируюшие функции f(x), как правило строятся в виде линейных комбинаций некоторых элементарных функций:

f(x)=\sum_{k=0}^N {c_k\Phi_k(x)},

где \{\Phi_k(x)\} — фиксированный линейно независимые функции, c_0, c_1, \cdots, c_n — не определенные пока коэффициенты.

Из условия (1) получаем систему из n+1 уравнений относительно коэффициентов \{c_k\}:

\sum_{k=0}^N {c_k\Phi_k(x_i)}=y_i, i=0,1,\cdots,n.

Предположим, что система функций \Phi_k(x) такова, что при любом выборе узлов a<x_1<\cdots<x_i<\cdots<x_n=b отличен от нуля определитель системы:

\Delta(\Phi) = \begin{vmatrix} \Phi_0(x_0) & \Phi_1(x_0) & \cdots & \Phi_n(x_0) \\\Phi_0(x_1) & \Phi_1(x_1) & \cdots & \Phi_n(x_1)\\ \cdots & \cdots & \cdots & \cdots \\\Phi_0(x_n) & \Phi_1(x_n) & \cdots & \Phi_n(x_n)\end{vmatrix}.

Тогда по заданным y_i (i=1,\cdots, n) однозначно определяются коэффициенты c_k (k=1,\cdots, n).

Изложение метода

Интерполяция кубическими сплайнами является частным случаем кусочно-полиномиальной интерполцией. В этом специальном случае между любыми двумя соседними узлами функция интерполируется кубическим полиномом. его коэффициенты на каждом интервале определяются из условий сопряжения в узлах:

f_i=y_i,

f'(x_i-0)=f'(x_i+0),

f''(x_i-0)=f''(x_i+0), i=1, 2, \cdots, n-1.

Кроме того, на границе при x=x_0 и x=x_n ставятся условия

( 2 )

f''(x_0)=0, f''(x_n)=0.

Будем искать кубический полином в виде

( 3 )

f(x)=a_i+b_i(x-x_{i-1})+c_i(x-x_{i-1})^2+d_i(x-x_{i-1})^3, x_{i-1}\le \x\le \x_i.

Из условия f_i=y_i имеем

( 4 )

f(x_{i-1})=a_i=y_{i-1},

f(x_i)=a_i+b_ih_i+c_ih_i^2+d_ih_i^3=y_i,

h_i=x_i-x_{i-1}, i=1, 2, \cdots, n-1.

Вычислим производные:

f'(x)=b_i+2c_i(x-x_{i-1})+3d_i(x-x_{i-1})^2,

f''(x)=2c_i+6d_i(x-x_{i-1}), x_{i-1}\le \x\le \x_i,

и потребуем их непрерывности при x=x_i:

( 5 )

b_{i+1}=b_i+2c_ih_i + 3d_ih_i^2,

c_{i+1}=c_i+3d_ih_i, i=1, 2, \cdots, n-1.

Общее число неизвестных коэффициентов, очевидно, равно 4n, число уравнений (4) и (5) равно 4n-2. Недостающие два уравнения получаем из условия (2) при x=x_0 и x=x_n:

c_1=0, c_n+3d_nh_n=0.

Выражение из (5) d_i=\frac{c_{i+1}-c_i}{3h_i}, подставляя это выражение в (4) и исключая a_i=y_{i-1}, получим

b_i=\[\frac{y_i-y_{i-1}}h_i\]-\frac{1}{3}h_i(c_{i+1}+2c_i),  i=1, 2, \cdots, n-1,

b_n=\[\frac{y_n-y_{n-1}}h_n\]-\frac{2}{3}h_nc_n,.

Подставив теперь выражения для b_i, b_{i+1} и d_i в первую формулу (5), после несложных преобразований получаем для определения c_i разностное уравнение второго порядка

( 6 )

h_ic_i+2(h_i+h_{i+1})c_{i+1}+h_{i+1}c_{i+2}=s\left(\frac{y_{i+1}-y_i}{h_{i+1}} - \frac{y_{i+1}-y_i}{h_{i+1}}\right), i=1, 2, \cdots, n-1.

С краевыми условиями

( 7 )

c_1=0, c_{n+1}=0.

Условие c_{n+1}=0 эквивалентно условию c_n+3d_nh_n=0 и уравнению c_{i+1} = c_i+d_ih_i. Разностное уравнение (6) с условиями (7) можно решить методом прогонки, представив в виде системы линейных алгебраических уравнений вида ~A*x=F, где матрица ~A имеет следующий вид:

A = \begin{pmatrix} C_1 & B_1 & 0   & 0   & \cdots & 0 & 0
                         \\ A_2 & C_2 & B_2 & 0   & \cdots & 0 & 0
                         \\ 0   & A_3 & C_3 & B_3 & \cdots & 0 & 0 
                         \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots 
                         \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots 
                         \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & B_{n-1}
                         \\ 0 & 0 & 0 & 0 & \cdots & A_{n} & C_{n}
            \end{pmatrix}, где A_i=h_i, i=2, \cdots, n, B_i = h_{i+1}, i=1, \cdots, n-1 и C_i=2(h_i+h_{i+1}), i =1, \cdots, n



Метод прогонки

Трёхдиагональной матрицей называют матрицу следующего вида:

<math>A = \begin{pmatrix} C_1 & B_1 & 0 & 0 & \cdots & 0 & 0
                        \\ A_2 & C_2 & B_2 & 0   & \cdots & 0 & 0
                        \\ 0   & A_3 & C_3 & B_3 & \cdots & 0 & 0 
                        \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots 
                        \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots 
                        \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & B_{n-1}
                        \\ 0 & 0 & 0 & 0 & \cdots & A_{n} & C_{n}
           \end{pmatrix}
 </math>.

Системы линейных алгебраических уравнений с такими матрицами встречаются при решении многих задач математики и физики. Краевые условия <math>x_1</math> и <math>x_n</math>, которые берутся из контекста задачи, задают первую и последнюю строки. Так краевое условие первого рода <math>F(x=x_1)=F_1</math> определит перую строку в виде <math>C_1=1</math>, <math>B_1=0</math>, а условие второго рода <math>dF/dx(x=x_1)=F_1</math> будет соответствовать значениям <math>C_1=-1</math>, <math>B_1=1</math>.

Для решения систем вида <math>~A*x=F</math> используется метод прогонки, основанный на предположении, что искомые неизвестные связаны рекуррентным соотношением:

<math>x_i = \alpha_{i+1}x_{i+1} + \beta_{i+1}\,\!
 </math>     , где <math>~i=1,n-1</math>                                     (1)

Используя это соотношение, выразим xi-1 и xi через xi+1 и подставим в i-e уравнение:

<math>
  \left(A_i\alpha_i\alpha_{i+1} + C_i\alpha_{i+1} + B_i\right)x_{i+1} + A_i\alpha_i\beta_{i+1} + A_i\beta_i + C_i\beta_{i+1} - F_i = 0
 </math>,

где Fi - правая часть i-го уравнения. Это соотношение будет выполняться независимо от решения, если потребовать

<math>\begin{matrix}
  A_i\alpha_i\alpha_{i+1} + C_i\alpha_{i+1} + B_i = 0\end{matrix}</math>
<math>\begin{matrix}
  A_i\alpha_i\beta_{i+1} + A_i\beta_i + C_i\beta_{i+1} - F_i = 0
 \end{matrix}</math>

Отсюда следует:

<math>
  \alpha_{i+1} = {-B_i \over A_i\alpha_i + C_i}\,\!
 </math>


<math>
  \beta_{i+1} = {F_i - A_i\beta_i \over A_i\alpha_i + C_i}
 \,\!</math>

Из первого уравнения получим:

<math>
  \alpha_2 = {-B_1 \over C_1}
 \,\!</math>.
<math>
  \beta_2 = {F_1 \over C_1}
 \,\!</math>.

После нахождения прогоночных коэффициентов <math>\alpha</math> и <math>\beta</math>, используя уравнение (1), получим решение системы. При этом,

<math>
  x_n = {F_n-A_n\beta_n \over C_n+A_n\alpha_n} \,\!
 </math>

Числовой пример

Вычислим по формулам прямоугольников и трапеций при n=2 интеграл

( 14 )

I=\int_{0}^{\pi/2}{\sin(x)dx} = 1

В данном случае


P_2=\frac{\pi}{4}(\sin(\frac{\pi}{8})+\sin(\frac{3\pi}{8}))=1.026172

T_2=\frac{\pi}{4}(\frac{1}{2}\sin(0)+\sin(\frac{\pi}{4})+\frac{1}{2}\sin(\frac{\pi}{2}))=0.948059

Зная точный ответ (14), найдем погрешности

( 15 )

\alpha_2=-0.026172,\beta_2=0.051941

Вторая производная функции \sin(x) на отрезке [0,\pi/2] отрицательна, ее модуль не превышает единицы: M_2=1. Величина погрешностей (15) удовлетворяет неравенствам (9) и (13):

|\alpha_2|\le \frac{1}{96}(\frac{\pi}{2})^3<0.041,|\beta_2|\le \frac{1}{48}(\frac{\pi}{2})^3<0.081

Рекомендации программисту

Автоматический выбор шага интегрирования

Величина погрешности численного интегрирования зависит как от шага сетки h, так и от гладкости подынтегральной функции f(x). Например, в оценку (11), наряду с h, входит величина

M_{2,i}=\underset{x\in [x_{i-1},x_i]}{max}|f''(x)|,

которая может сильно меняться от точки к точке и, вообще говоря, заранее неизвестна. Если величина погрешности велика, то ее можно уменьшить путем измельчения сетки на данном отрезке [x_{i-1},x_i]. Для этого прежде всего надо уметь апостериорно, т.е. после проведения расчета, оценивать погрешность.

Апостериорную оценку погрешности можно осуществить методом Рунге. Пусть какая-то квадратурная формула имеет на частичном отрезке порядок точности m, т.е. I_i-I_{h,i}\approx c_i h_i^m. Тогда

I_i-I_{h/2,i}\approx c_i (\frac{h_i}{2})^m,

откуда получим

( 16 )

I_i-I_{h,i}\approx 2^m (I_i-I_{h/2,i}),

( 17 )

I_i-I_{h/2,i}\approx \frac{I_{h/2,i}-I_{h,i}}{2^m-1}

Возможность апостериорно оценивать погрешность позволяет вычислять интеграл (1) с заданной точностью \epsilon >0 путем автоматического выбора шага интегрирования h_i. Пусть используется составная квадратурная формула

I\approx I_h=\sum_{i=1}^N{I_{h,i}}

где I_{h,i} - квадратурная сумма на частичном отрезке, причем на каждом частичном отрезке используется одна и та же квадратурная формула (например, формула трапеций). Проведем на каждом частичном отрезке [x_{i-1},x_i] все вычисления дважды, один раз - с шагом h_i и второй раз - с шагом 0.5h_i и оценим погрешность по правилу Рунге (17).

Если для заданного \epsilon >0 будут выполняться неравенства

( 18 )

|I_i-I_{h/2,i}|\approx \frac{|I_{h/2,i}-I_{h,i}|}{2^m-1} \le \frac{\epsilon h_i}{b-a},i=1,2,...,N,

то получим

|I-I_h/2|\le \frac{\epsilon}{b-a}\sum_{i=1}^N{h,i}=\epsilon,

т.е. будет достигнута заданная точность \epsilon.

Если же на каком-то из частичных отрезков оценка (18) не будет выполняться, то шаг на этом отрезке надо измельчить еще в два раза и снова оценить погрешность. Измельчение сетки на данном отрезке следует проводить до тех пор, пока не будет достигнута оценка вида (18). Заметим, что для некоторой функции f(x) такое измельчение может продолжаться слишком долго. Поэтому в соответствующей программе следует предусмотреть ограничение сверху на число измельчений,а также вожможность увеличения \epsilon.

Таким образом, автоматический выбор шага интегрирования приводит к тому, что интегрирование ведется с крупным шагом на участках плавного изменения функции f(x) и с мелким шагом - на участках быстрого изменения f(x). Это позволяет при заданной точности \epsilon уменьшить количество вычислений значений f(x) по сравнению с расчетом на сетке с постоянным шагом. Подчеркнем, что для нахождения сумм I_{h/2,i} не надо пересчитывать значения f(x) во всех узлах, достаточно вычислять f(x) только в новых узлах.

Заключение

Список литературы

  • А.А.Самарский, А.В.Гулин.  Численные методы М.: Наука, 1989.
  • А.А.Самарский.  Введение в численные методы М.: Наука, 1982.
Личные инструменты