Результаты поиска

Материал из MachineLearning.

По запросу «Actor-critic»

Перейти к: навигация, поиск

Страницы с названием «Actor-critic» не существует.

Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.

Ниже показаны 9 результатов, начиная с № 1.


Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

Нет совпадений в названиях статей

Совпадения в текстах статей

  1. Глубинное обучение (курс лекций)/2017 (6378 байт)
    63: ...nbsp;2017 || align="center"|10 || Policy based и actor-critic алгоритмы в обучении с под...
  2. Глубинное обучение (курс лекций)/2019 (7469 байт)
    103: | 25 Nov. 2019 || align="center"|12 || Actor-critic approach in RL || No ||
  3. Обучение с подкреплением (курс лекций) / 2020 (10 952 байта)
    118: | Policy gradient theorem. Advantage Actor-Critic (A2C).
    125: ...://hackernoon.com/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752 Комикс про A2C]
    149: | Deep Deterministic Policy Gradient (DDPG). Soft Actor-Critic (SAC).
  4. Обучение с подкреплением (курс лекций) / 2021 (11 837 байт)
    143: | Policy gradient подход. Advantage Actor-Critic (A2C).
    149: ...://hackernoon.com/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752 Комикс про A2C]
    181: * [https://arxiv.org/pdf/1801.01290.pdf Soft Actor-Critic (SAC)]
  5. Обучение с подкреплением (курс лекций) / 2022 (13 327 байт)
    179: | Policy gradient подход. Advantage Actor-Critic (A2C).
    185: ...://hackernoon.com/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752 Комикс про A2C]
    228: * [https://arxiv.org/pdf/1801.01290.pdf Soft Actor-Critic (SAC)]
  6. Обучение с подкреплением (курс лекций) / 2023 (12 238 байт)
    158: | Policy gradient подход. Advantage Actor-Critic (A2C).
    164: ...://hackernoon.com/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752 Комикс про A2C]
    200: * [https://arxiv.org/pdf/1801.01290.pdf Soft Actor-Critic (SAC)]
  7. Обучение с подкреплением (курс лекций) / 2024 (13 893 байта)
    187: | Policy gradient подход. Advantage Actor-Critic (A2C).
    193: ...://hackernoon.com/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752 Комикс про A2C]
    222: * [https://arxiv.org/pdf/1801.01290.pdf Soft Actor-Critic (SAC)]
  8. Методы обучения с подкреплением (16 087 байт)
    61: === Методы Actor-critic ===
    63: Методы [[Actor-critic]] объединяют два подхода. К...
    116: * [[Actor-critic]]
  9. Group Relative Policy Optimization (14 700 байт)
    9: В классических actor-critic-методах, включая [[Proximal Policy ...

Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)



Искать в пространствах имён:

Показывать перенаправления
Искать