Изображение:Mae architecture.svg

Материал из MachineLearning.

Перейти к: навигация, поиск

Mae_architecture.svg (SVG-файл, номинально 1071 × 441 пикселов, размер файла: 19 КБ)

Функциональный конвейер Masked Autoencoder (MAE): из входного изображения удаляется до 75-80% патчей, тяжелый ViT-кодировщик извлекает признаки только из видимой части, а легкий ViT-декодер реконструирует исходные пиксели на основе скрытых векторов и маска-токенов.

История файла

Нажмите на дату/время, чтобы просмотреть как тогда выглядел файл.

Дата/времяУчастникРазмер объектаРазмер файлаПримечание
текущий20:36, 18 июня 2026Vsevolod Peretiatko (Обсуждение | вклад)1071 × 44119 КБФункциональный конвейер Masked Autoencoder (MAE): из входного изображения удаляется до 75-80% патчей, тяжелый ViT-кодировщик извлекает признаки только из видимой части, а легкий ViT-декодер реконструирует исходные пиксели на основе скрытых векторов и маска-токенов.

Следующие страницы ссылаются на данный файл:

Личные инструменты