Результаты поиска

Материал из MachineLearning.

По запросу «Transformer»

Перейти к: навигация, поиск

Страницы с названием «Transformer» не существует.

Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.

Ниже показаны 20 результатов, начиная с № 1.


Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

Нет совпадений в названиях статей

Совпадения в текстах статей

  1. Алгебра над алгоритмами и эвристический поиск закономерностей (54 356 байт)
    59: | [[Media:Transformer.pdf|слайды]]
  2. Прогнозирование (47 383 байта)
    85: # '''Temporal Fusion Transformer (TFT)''': специализированная и...
  3. Методы анализа текстов (семинар, К.В.Воронцов) (8344 байта)
    66: ...ний. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д.
  4. Глубинное обучение (курс лекций)/2019 (7469 байт)
    60: ...> [https://arxiv.org/abs/1706.03762 A paper about Transformer]<br> [https://arxiv.org/abs/1810.04805 A paper ab...
  5. Математические методы анализа текстов (МФТИ) / 2021 (11 422 байта)
    122: Архитектура transformer.
  6. Моя первая научная статья (практика, В.В. Стрижов)/Группы 774, 794, весна 2020 (112 220 байт)
    770: ...ers.nips.cc/paper/7181-attention-is-all-you-need] Transformer architecture
    773: * «Базовый алгоритм»: Transformer model. The input sequence is a SMILES representat...
    774: ...onal Graph Convolution Neural Network, Encoder of Transformer. The method is applied to solve yield predictions...
  7. Математические методы анализа текстов (курс лекций) / осень 2020 (15 171 байт)
    117: Архитектура transformer.
  8. Математические методы анализа текстов (ВМК МГУ) / 2021 (11 369 байт)
    83: RNN, LSTM. Transformer.
  9. Моя первая научная статья (лекции и практика, В.В. Стрижов)/Группы 874, 821, 813, весна 2021 (120 239 байт)
    335: ...ers.nips.cc/paper/7181-attention-is-all-you-need] Transformer architecture
    338: * «Базовый алгоритм»: Transformer model. The input sequence is a SMILES representat...
    339: ...onal Graph Convolution Neural Network, Encoder of Transformer. The method is applied to solve yield predictions...
  10. Математические методы прогнозирования/Осень 2022 (61 096 байт)
    88: * RNN, LSTM, attention, transformer models
  11. Компьютерное зрение (19 510 байт)
    55: ...я (Attention). Модели класса Vision Transformer (ViT), такие как '''SETR''' (Zheng et al....
  12. Трансформер (модель) (13 457 байт)
    6: '''Трансфо́рмер''' (англ. Transformer) — архитектура [[Нейронная ...
    90: ...омпьютерное зрение''' — Vision Transformer (ViT) делит изображение на па...
  13. Механизм внимания (10 099 байт)
    68: ...омпьютерное зрение''' — Vision Transformer (ViT) применяет self-attention к пат...
  14. Диффузионная модель (10 337 байт)
    40: ...следних моделях (DiT — Diffusion Transformer) U-Net заменяется [[Трансформ...
  15. Ранжирование (47 401 байт)
    176: [[Изображение:Transformer ranking architectures.svg|thumb|center|850px|Ри...
  16. Адаптация низкого ранга (21 271 байт)
    47: ...мпьютерное зрение]]''': [[Vision Transformer]] (ViT), свёрточные нейронные ...
  17. Самостоятельное обучение (55 524 байта)
    175: * [[Vision Transformer]] (ViT) — адаптация классичес...
  18. Смесь экспертов (56 297 байт)
    116: === Архитектура Switch Transformer ===
    120: ...ставлена архитектура '''Switch Transformer'''<ref>{{статья
    134: ...итивного шума:''' Авторы Switch Transformer показали, что при жестком в...
    138: ...нженерной оптимизации Switch Transformer позволил масштабировать н...
    182: ...ическая схема Шазира и Switch Transformer относится к классу стратег...
  19. Квантование нейронных сетей (27 481 байт)
    74: ...жных архитектур (например, Transformer) PTQ может быть нестабильным...
    139: * Архитектуры на основе Transformer имеют свои особенности: self-...
    160: * '''GPTQ''' (Generative Pre-trained Transformer Quantization) — метод пост-трени...
    194: ... облегчения INT8-квантования Transformer-моделей.
  20. Контекстное обучение (10 810 байт)
    13: ...р (архитектура нейросетей)|Transformer]]) из-за квадратичной завис...

Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)



Искать в пространствах имён:

Показывать перенаправления
Искать
Личные инструменты