Материал из MachineLearning.
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Промпт
Статья сгенерирована Claude Opus 4.8.
Ты специалист в области машинного обучения, профессор в ведущем техническом университете и популяризатор науки. Напиши статью для русскоязычной вики-энциклопедии MachineLearning.ru на тему «XGBoost».
Статья должна быть полезна как новичку (понятно даются определения, популярно объясняются идеи, сначала интуиция — потом формула), так и профессионалу (строгие выкладки, актуальные научные результаты, полезные ссылки). Тон — академический и живой, как хороший учебник, а не сухой реферат.
Содержательные акценты:
— Ядро статьи — теория: регуляризованная целевая функция, разложение потерь второго порядка (Тейлор, градиент g_i и гессиан h_i), вывод оптимальных весов листьев и оценки структуры (structure score), критерий расщепления Gain, точный и аппроксимированный поиск расщеплений, учёт разреженности, усадка и подвыборка признаков.
— Обязательно вывести формулы, а не декларировать их: показывать переход интуиция → выкладка → результат.
— Включить минимум один неочевидный для эксперта факт. Здесь это обоснование взвешенного квантильного эскиза: переписывание упрощённой цели как взвешенной квадратичной ошибки с псевдо-метками −g_i/h_i и весами h_i.
— Отдельный раздел — сравнение с LightGBM и CatBoost по ключевым различающимся компонентам (стратегия роста дерева, GOSS/EFB, упорядоченные целевые статистики и ordered boosting, симметричные деревья), с практическим итогом «когда что выбирать».
Структура (обязательный порядок разделов):
вводные 2–3 абзаца без заголовка → Историческая справка → Постановка задачи → Алгоритм (с вложенными подразделами) → Свойства (Преимущества / Ограничения) → Сравнение с LightGBM и CatBoost → Применение → См. также → Ссылки → Литература → категории.
Оформление — вики-разметка MachineLearning.ru:
— Все формулы через теги <tex>...</tex>. Выключные формулы с отбивкой <br />.
— Соблюдать ограничения движка texvc: все надстрочные индексы в фигурных скобках (^{d}, а не ^d); не использовать \tfrac (только \frac); не использовать кириллицу внутри \text{...}; двоеточие в множествах заменять на \mid; двоеточие вида F : R^d → R выносить в текст; индекс у закрывающей скобки оборачивать через \bigr\}_{...}; вертикальную черту с размером — через \left.\right| вместо \bigg|.
— Внутренние ссылки через [[...]], список литературы — ненумерованный (через *), источники-статьи оформлять шаблоном {{статья}}.
— Сноски <ref> не использовать (движок их не поддерживает): отсылки давать в скобках прямо в тексте вида (Chen, Guestrin, 2016), полные описания — в разделе Литература.
— Не включать блоки кода: это энциклопедия, а не туториал.
— Не использовать слова-паразиты «очевидно», «следует отметить», «легко видеть».
ЧЕКЛИСТ ПЕРЕД ПУБЛИКАЦИЕЙ:
- [ ] {{TOCright}} на второй строке
- [ ] Вводный абзац 2–3 абзаца без заголовка
- [ ] Есть == Историческая справка ==
- [ ] Разделы вложены (=== внутри ==)
- [ ] Все выключные формулы с <br /> до и после
- [ ] Нет \}_{...} — заменено на \bigr\}_{...}
- [ ] Нет \colon и : в формулах с \mathbb — вынесено в текст
- [ ] Нет \bigg| — заменено на \left.\right|
- [ ] Нет \tfrac — заменено на \frac
- [ ] Нет кириллицы внутри \text{...}
- [ ] Все ^x — заменены на ^{x}
- [ ] Сноски <ref> проверены; если ошибка — заменить на отсылки в скобках
- [ ] Литература через {{статья}} / {{книга}} / {{cite web}}, список через *
- [ ] Есть == Ссылки == с внешними URL
- [ ] Категории в конце
- [ ] Нет блоков кода
- [ ] Пустая строка между разделами
- [ ] Есть минимум один неочевидный факт для эксперта
- [ ] Промпт оформлен в Обсуждении через <pre style="white-space: pre-wrap;">