Обсуждение:Механизм внимания

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: == Промпт для генерации статьи == Статья сгенерирована с помощью '''Claude Sonnet 4''' (claude-sonnet-4-6). '''Промпт:''' <blo...)
(Убран шаблон из текста промпта)
 
(1 промежуточная версия не показана)
Строка 1: Строка 1:
== Промпт для генерации статьи ==
== Промпт для генерации статьи ==
-
Статья сгенерирована с помощью '''Claude Sonnet 4''' (claude-sonnet-4-6).
+
Промпт, использованный для генерации статьи «Механизм внимания» с помощью LLM Claude Sonnet 4:
-
'''Промпт:'''
+
Напиши подробную энциклопедическую статью для вики-сайта MachineLearning.ru на тему
 +
«Механизм внимания» (Attention mechanism) в нейронных сетях на русском языке.
 +
 +
Требования к статье:
 +
1. Структура: введение с определением, история (seq2seq, Bahdanau attention), математическое
 +
описание (scaled dot-product attention, multi-head attention), виды механизмов внимания
 +
(self-attention, cross-attention, causal attention), применения в трансформерах, сравнение
 +
с RNN/LSTM.
 +
2. Формат: wiki-разметка MediaWiki, заголовки разделов через ==, математические формулы
 +
через <tex>...</tex>.
 +
3. Включи минимум 5 внутренних ссылок на другие статьи вики.
 +
4. Добавь категории в конце: [[Категория:Машинное обучение]], [[Категория:Нейронные сети]],
 +
[[Категория:Обработка естественного языка]].
 +
5. Добавь раздел «Литература» с 4-6 ключевыми источниками.
 +
6. Включи формулы: функция внимания Attention(Q,K,V), масштабированное скалярное произведение,
 +
multi-head attention.
 +
7. Не добавляй шаблон шаблон well — он будет добавлен отдельно.
 +
 +
Статья должна быть академической, информативной, с правильной вики-разметкой.
-
<blockquote>
+
-- Emil Petrov
-
Напиши подробную статью на русском языке для вики-проекта MachineLearning.ru о механизме внимания (attention mechanism) в нейронных сетях.
+
-
 
+
-
Включи: мотивировку (проблема узкого места RNN-энкодера), базовый механизм Bahdanau с формулами (энергия, softmax, контекстный вектор), scaled dot-product attention трансформера с формулой, три типа внимания (self, cross, masked), многоголовое внимание с формулами, интерпретируемость, эффективные варианты (Sparse Attention, FlashAttention, GQA), применения вне NLP.
+
-
 
+
-
Оформи в вики-разметке с формулами в <tex>, внутренними ссылками, категориями, примечаниями, литературой.
+
-
</blockquote>
+
-
 
+
-
— [[Участник:Emil Petrov|Emil Petrov]] ~~~~
+

Текущая версия

Промпт для генерации статьи

Промпт, использованный для генерации статьи «Механизм внимания» с помощью LLM Claude Sonnet 4:

 Напиши подробную энциклопедическую статью для вики-сайта MachineLearning.ru на тему
 «Механизм внимания» (Attention mechanism) в нейронных сетях на русском языке.
 
 Требования к статье:
 1. Структура: введение с определением, история (seq2seq, Bahdanau attention), математическое
    описание (scaled dot-product attention, multi-head attention), виды механизмов внимания
    (self-attention, cross-attention, causal attention), применения в трансформерах, сравнение
    с RNN/LSTM.
 2. Формат: wiki-разметка MediaWiki, заголовки разделов через ==, математические формулы
    через ....
 3. Включи минимум 5 внутренних ссылок на другие статьи вики.
 4. Добавь категории в конце:,,.
 5. Добавь раздел «Литература» с 4-6 ключевыми источниками.
 6. Включи формулы: функция внимания Attention(Q,K,V), масштабированное скалярное произведение,
    multi-head attention.
 7. Не добавляй шаблон шаблон well — он будет добавлен отдельно.
 
 Статья должна быть академической, информативной, с правильной вики-разметкой.

-- Emil Petrov

Личные инструменты