Пространственно-временная графовая нейронная сеть

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Постановка задачи)
 
(2 промежуточные версии не показаны)
Строка 1: Строка 1:
-
{{well|Статья написана с использованием LLM '''GPT-5.5''' и проверена участником [[Участник:Arsenii Kolesnikov|Arsenii Kolesnikov]] 15:17, 2 июля 2026 (MSD)}}
+
{{well|Статья написана с использованием LLM '''GPT-5.5''' и проверена участником [[Участник:Arsenii Kolesnikov|Arsenii Kolesnikov]] 16:53, 2 июля 2026 (MSD)}}
== Введение ==
== Введение ==
-
'''Пространственно-временная графовая нейронная сеть''' (англ. ''spatio-temporal graph neural network'', STGNN) — класс графовых нейронных сетей, то есть [[Искусственная нейронная сеть|нейросетевых]] моделей, работающих с данными на графах предназначенных для моделирования данных, в которых одновременно важны структура связей между объектами и изменение их состояний во времени. Типичные примеры — транспортные сети, энергосистемы, промышленные установки, метеорологические станции, финансовые рынки и многосенсорные системы мониторинга.
+
'''Пространственно-временная графовая нейронная сеть''' (англ. ''spatio-temporal graph neural network'', STGNN) — класс графовых нейронных сетей, предназначенных для моделирования данных, в которых одновременно важны структура связей между объектами и изменение их состояний во времени. Типичные примеры — транспортные сети, энергосистемы, промышленные установки, метеорологические станции, финансовые рынки и многосенсорные системы мониторинга.
Обычная модель [[Временной ряд|временного ряда]] часто рассматривает каждый сигнал отдельно или как компоненту общего вектора. При этом структура взаимодействий между датчиками, узлами сети или физическими объектами задаётся слабо. Обычная графовая нейронная сеть, наоборот, хорошо учитывает связи между вершинами, но не всегда явно описывает динамику. Пространственно-временная графовая модель совмещает эти два уровня описания.
Обычная модель [[Временной ряд|временного ряда]] часто рассматривает каждый сигнал отдельно или как компоненту общего вектора. При этом структура взаимодействий между датчиками, узлами сети или физическими объектами задаётся слабо. Обычная графовая нейронная сеть, наоборот, хорошо учитывает связи между вершинами, но не всегда явно описывает динамику. Пространственно-временная графовая модель совмещает эти два уровня описания.
Строка 25: Строка 25:
К типичным задачам относятся:
К типичным задачам относятся:
* [[Прогнозирование]] значений в вершинах;
* [[Прогнозирование]] значений в вершинах;
-
* [[Детекция аномалий и робастные методы]] в многомерных временных рядах;
+
* обнаружение аномалий в многомерных временных рядах;
* классификация состояния системы;
* классификация состояния системы;
* восстановление пропущенных измерений;
* восстановление пропущенных измерений;
Строка 78: Строка 78:
== Пример: охлаждение центра обработки данных ==
== Пример: охлаждение центра обработки данных ==
-
В системе охлаждения [[Центр обработки данных|центра обработки данных]] вершинами графа могут быть датчики температуры, влажности, серверные стойки, кондиционеры, холодильные машины и зоны машинного зала. Рёбра могут отражать:
+
В системе охлаждения центра обработки данных вершинами графа могут быть датчики температуры, влажности, серверные стойки, кондиционеры, холодильные машины и зоны машинного зала. Рёбра могут отражать:
* физическую близость;
* физическую близость;
* направление воздушных потоков;
* направление воздушных потоков;
Строка 104: Строка 104:
== См. также ==
== См. также ==
-
* [[Графовая нейронная сеть]]
 
* [[Временной ряд]]
* [[Временной ряд]]
-
* [[Обнаружение аномалий]]
 
* [[Прогнозирование]]
* [[Прогнозирование]]
* [[Механизм внимания]]
* [[Механизм внимания]]
-
* [[Инкрементное обучение]]
 
== Литература ==
== Литература ==
Строка 116: Строка 113:
[[Категория:Нейронные сети]]
[[Категория:Нейронные сети]]
-
[[Категория:Графовые модели]]
+
[[Категория:Машинное обучение]]
-
[[Категория:Временные ряды]]
+
[[Категория:Прогнозирование]]
-
[[Категория:Обнаружение аномалий]]
+
[[Категория:Энциклопедия анализа данных]]
[[Категория:Энциклопедия анализа данных]]

Текущая версия

Статья написана с использованием LLM GPT-5.5 и проверена участником Arsenii Kolesnikov 16:53, 2 июля 2026 (MSD)


Содержание

Введение

Пространственно-временная графовая нейронная сеть (англ. spatio-temporal graph neural network, STGNN) — класс графовых нейронных сетей, предназначенных для моделирования данных, в которых одновременно важны структура связей между объектами и изменение их состояний во времени. Типичные примеры — транспортные сети, энергосистемы, промышленные установки, метеорологические станции, финансовые рынки и многосенсорные системы мониторинга.

Обычная модель временного ряда часто рассматривает каждый сигнал отдельно или как компоненту общего вектора. При этом структура взаимодействий между датчиками, узлами сети или физическими объектами задаётся слабо. Обычная графовая нейронная сеть, наоборот, хорошо учитывает связи между вершинами, но не всегда явно описывает динамику. Пространственно-временная графовая модель совмещает эти два уровня описания.

Постановка задачи

Пусть система задаётся графом

G=(V,E),

где V — множество вершин, а E — множество рёбер. Вершины могут соответствовать датчикам, станциям, серверным стойкам или физическим узлам. В момент времени t наблюдается матрица признаков

X_t \in \mathbb{R}^{|V|\times d},

где каждая строка содержит признаки одной вершины. Задача состоит в построении модели

\hat{X}_{t+1:t+h}=f_\theta(G,X_{t-p+1},\ldots,X_t),

которая использует как граф связей, так и историю наблюдений.

К типичным задачам относятся:

  • Прогнозирование значений в вершинах;
  • обнаружение аномалий в многомерных временных рядах;
  • классификация состояния системы;
  • восстановление пропущенных измерений;
  • моделирование распространения возмущений по сети.

Интуитивная идея

Пространственная часть модели отвечает на вопрос: какие вершины влияют друг на друга. Например, температура в одной зоне машинного зала зависит не только от локального датчика, но и от соседних стоек, воздушных потоков и режима работы охлаждающих устройств.

Временная часть отвечает на вопрос: как состояние меняется. Один и тот же скачок температуры может быть нормальным при кратковременной нагрузке и аномальным, если он развивается вместе с изменением давления, влажности или мощности охлаждения.

Поэтому STGNN обычно строит два механизма:

  • графовую агрегацию информации от соседних вершин;
  • временную модель, учитывающую историю состояний.

Математическая схема

Один слой графовой агрегации можно записать в общем виде:

H_t^{(l+1)}=\sigma\left(\sum_{k=0}^{K} A_k H_t^{(l)} W_k^{(l)}\right),

где H_t^{(l)} — скрытые представления вершин, A_k — матрицы связей или степеней соседства, W_k^{(l)} — обучаемые параметры, \sigma — нелинейность.

Временная часть может быть задана рекуррентным блоком, одномерной свёрткой или механизмом внимания:

Z_t = \Phi_\theta(H_{t-p+1},\ldots,H_t).

Итоговый прогноз строится из скрытого представления Z_t. В разных архитектурах меняются способ построения графа, вид агрегации и механизм учёта времени.

Основные архитектуры

DCRNN использует диффузионную свёртку на ориентированном графе и рекуррентную структуру для прогнозирования трафика[1].

STGCN заменяет рекуррентные блоки сочетанием графовой свёртки и временной свёртки, что ускоряет обучение и делает модель полностью свёрточной[1].

Graph WaveNet вводит адаптивную матрицу зависимостей, которая обучается по данным и может выявлять скрытые связи между вершинами[1].

Модели с графовым вниманием используют обучаемые веса связей и позволяют интерпретировать, какие вершины сильнее повлияли на прогноз или сигнал аномальности.

Обнаружение аномалий

В задаче обнаружения аномалий модель часто обучается на нормальном режиме работы системы. Затем строится прогноз или реконструкция:

\hat{X}_t=f_\theta(G,X_{t-p},\ldots,X_{t-1}).

Оценка аномальности может быть задана ошибкой:

s_t=\|X_t-\hat{X}_t\|.

Если s_t превышает порог, состояние считается подозрительным. Аномалия может быть локальной, когда отклоняется один датчик, или системной, когда нарушается согласованность многих связанных сигналов.

Пример: охлаждение центра обработки данных

В системе охлаждения центра обработки данных вершинами графа могут быть датчики температуры, влажности, серверные стойки, кондиционеры, холодильные машины и зоны машинного зала. Рёбра могут отражать:

  • физическую близость;
  • направление воздушных потоков;
  • общие контуры охлаждения;
  • статистическую корреляцию временных рядов;
  • связь между управляющим воздействием и температурным откликом.

Простая пороговая система обнаружит перегрев только после выхода температуры за допустимый диапазон. STGNN может обнаружить более ранний признак проблемы: например, температура в одной зоне растёт быстрее ожидаемого при нормальной мощности охлаждения и при несогласованном поведении соседних датчиков. Такой подход полезен для предиктивного обслуживания, поскольку позволяет искать не только явные аварии, но и нарушение нормальной пространственно-временной динамики.

Достоинства и ограничения

Достоинства:

  • явный учёт структуры системы;
  • работа с многосенсорными данными;
  • способность обнаруживать распределённые аномалии;
  • применимость к транспорту, энергетике, промышленности и мониторингу инфраструктуры.

Ограничения:

  • качество зависит от выбора или обучения графа;
  • модель чувствительна к пропускам и шумам;
  • интерпретация сложнее, чем у пороговых правил;
  • при смене режима работы возможны ложные срабатывания;
  • вычислительная сложность растёт с числом вершин и длиной истории.

См. также

Литература

Личные инструменты