Участник:Василий Ломакин/Псевдообратная матрица
Материал из MachineLearning.
Псевдообратные матрицы — обобощение обратных матриц в математике и, в частности, в линейной алгебре. Псевдообратная матрица к матрице обозначается . Наиболее известно псевдообращение Мура — Пенроуза, которое было независимо описано Э. Х. Муром и Роджером Пенроузом. Концепцию псевдообратных интегрирующих операторов в 1903 году представил Фредгольм. Термин «обобщенное обращение» иногда используется как синоним для псевдообращения. Псевдообращение можно понимать как наилучшую апроксимацию (по методу наименьших квадратов) решения соответствующей системы линейных уравнений (см. далее в применении). Псевдообращение определено для любых матриц над действительными и комплексными числами. Псевдообратная матрица может быть вычислена с помощью собственного представления матрицы.
Содержание |
Определение
называется псевдообратной матрицей для матрицы , если она удовлетворяет следующим критериям:
- ( является слабым обращением в мультипликативной полугруппе);
- (это означает, что — эрмитова матрица);
- ( - тоже эрмитова матрица).
Здесь - эрмитова сопряжённая матрица M. Для матриц над полем действительных чисел .
Существует эквивалентный способ задания псевдообратной матрицы через предел обратных:
-
(смотрите регуляризация Тихонова). Этот предел существует, даже если и не определены.
Свойства
- Псевдообращение обратимо, более того, эта операция обратна самой себе:
. - Псевдообращение нулевой матрицы равно транспонированию.
- Псевдообращение комутирует с транспонированием, сопряжением и эрмитовым сопряжением:
,
,
- Псевдообратное произведения матрицы на скаляр равно соответствующему произведению матрицы на обратное число :
, для ≠ 0. - Если псевдообратная матрица для уже известна, она может быть использовано для вычисления :
. - Аналогично, если матрица уже известна:
.
Особые случаи
- Если столбцы матрицы линейно независимы, тогда матрица обратима. В таком случае псевдообратная матрица задаётся формулой
Это эквивалентно тому, что в первой части определения через предел убирается слагаемое с . Отсюда следует что - левая обратная матрица для A: .
- Если строки матрицы линейно независимы, тогда матрица обратима. В таком случае псевдообратная матрица задаётся формулой
Это эквивалентно тому, что во второй части определения через предел убирается слагаемое с . Отсюда следует, что — правая обратная матрица для A: .
- Если и столбцы и строки линейно независимы (что верно для квадратных невырожденных матриц), псевдообращение равно обращению:
- Если A и B таковы, что произведение определено, и
- либо ,
- либо ,
- либо столбцы линейно независимы и строки линейно независимы,
- тогда
- .
- Псевдообращение можно применять и к скалярам, и к векторам. Это подразумевает, что их будут считать матрицами. Псевдообратный к скаляру — ноль, если — ноль, и обратный к в противном случае:
-
- Псевдообратный для нулевого вектора - транспонированый нулевой вектор. Псевдообратный для иного вектора - сопряжённый транспонированный вектор, делённый на квадрат своей длины:
-
Для доказательства достаточно проверить, что эти величины удовлетворяют определению псевдообратных.
Происхождение
Если существует, то
что порождает понятие псевдообращения
- .
Вычисление
Пусть k - ранг матрицы A размера . Тогда A может быть представлена как , где B — матрица размера и C — матрица размера . Тогда
-
Если A имеет полнострочный ранг, то есть k = m, тогда в качестве B может быть выбрана единичная матрица и формула сокращается до . Аналогично, если A имеет полностолбцовый ранг, то есть, k = n, имеем
Простейший вычислительный путь получения псевдообратной матрицы — использование собственного представления матрицы (СПМ).
Если — собственное представление A, тогда Для диагональной матрицы, такой как , псевдообратная вычисляется обращением каждого ненулевого элемента на диагонали.
Существуют оптимизированые подходы для вычисления псевдоинверсии блочных матриц.
Если псевдоинверсия известна для некой матрицы и нужно найти псевдоинверсию для аналогичной матрицы, иногда она может быть вычислена с помощью специальных алгоритмов, требующих меньшего количества расчётов. В частности, если аналогичная матрица отличается от начальной на один изменённый, добавленный или удалённый столбец или строку — существуют накопительные алгоритмы, которые могут использовать взаимосвязь между матрицами.
Применение
Псевдоинверсия реализирует решение метода наименьших квадратов для системы линейных уравнений.
При этом для данной системы ищется вектор , котрый минимизирует невязку , где обозначает евклидову норму.
Общее решение неоднородной системы представимо как сумма частного решения неоднородной системы и общего решения соответствующей однородной системы .
Лемма: Если существует, тогда решение всегда представимо как сумма решения псевдообратного решения неоднородной системы и решения однородной системы:
Доказательство:
.
Здесь вектор случаен (с точностью до размерности). В двух других членах есть псевдообратная матрица . Переписав её в форме , приведём выражение к форме:
Первый член — псевдообратное решение. В терминах метода наименьших квадратов — это наилучшее приближение к настоящему решению. Это значит, что корректирующий член имеет минимальную евклидову норму. Следующий член даёт решение однородной системы , потому что — оператор проектирования на ядро оператора A, тогда как — оператор проектирования на образ оператора A.
- Псевдообращение обратимо, более того, эта операция обратна самой себе: