Анализ поведения по сигналам носимых устройств

Материал из MachineLearning.

Перейти к: навигация, поиск

Короткий адрес: http://bit.ly/2r3y70F

Содержание

Проекты

Задача

  • Название: Порождение признаков с помощью локально-аппроксимирующих моделей
  • Задача: Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
  • Данные:
    • WISDM (Kwapisz, J.R., G.M. Weiss, and S.A. Moore. 2011. Activity recognition using cell phone accelerometers. ACM SigKDD Explorations Newsletter. 12(2):74–82.), USC-HAD или сложнее. Данные акселерометра (Human activity recognition using smart phone embedded sensors: A Linear Dynamical Systems method, W Wang, H Liu, L Yu, F Sun - Neural Networks (IJCNN), 2014)
    • (Временной ряд (библиотека примеров), раздел Accelerometry).
  • Литература:
    • Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471-1483.[1]
    • Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.URL
    • Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. URL
    • Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. URL
    • Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. URL
    • Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. URL
    • Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. URL
    • Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145. [2]
    • Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. [3]
  • Базовый алгоритм: Описан в работе Кузнецова, Ивкина.
  • Решение: Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
  • Новизна: Создан стандарт построения локально-аппроксимирующих моделей.
  • Авторы: С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов

Данные, ссылки на коллекции

Smartphone Dataset for Human Activity Recognition, created 08/2017/
This dataset contains data from 30 users within the age group of 22-79 years.
A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.
This dataset contains data from 60 users.
Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,
high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.
Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.
“PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).”
WISDM

Библиографические коллекции

Категория:Статьи

https://doi.org/10.1109/TNNLS.2016.2531089
https://doi.org/10.1007/s10444-016-9483-y
https://doi.org/10.1007/s00521-015-2039-0
https://doi.org/10.1016/j.neucom.2018.02.074
https://academic.oup.com/biostatistics/advance-article/doi/10.1093/biostatistics/kxx070/4788724
https://doi.org/10.1016/j.ins.2018.02.041
https://doi.org/10.1016/j.asoc.2017.11.037
https://doi.org/10.1016/j.asoc.2018.01.002
https://doi.org/10.1002/bimj.201700021
http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics
Aligned Cluster Analysis for Temporal Segmentation of Human Motion
Feng Zhou, Fernando De la Torre
Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.
Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.
Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно плавно и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.
http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162
Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion
Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.
https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf
Temporal Segmentation of Facial Behavior
Fernando De la Torre
Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их в динамические выражения лица (видимо, слова).
Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.
Затем они хотят выделять слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв) и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.
Статья написана достаточно мутно
http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf
Segmenting Motion Capture Data into Distinct Behaviors
Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos
Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения

Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки

http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf
O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data
Тоже PCA, для разрезов берутся
1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.
2) минимумы угловой скорости, видимо, из тех же соображений
http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf
further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion
http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf
P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.
Developed a string-based motif-finding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.
1) уменьшают размерность с помощью PCA
2) каждому отсчету времени - по букве с помощью k-means кластеризации
3) повторения одной и той же буквы сокращаются до одного
4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами подразумевает возможность построить разумное соответствие между ними

Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?

5) Для порождающих целей строится направленный граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.
https://doi.org/10.1007/s11063-017-9592-8
https://web.stanford.edu/~hallac/GGS.pdf
http://eprints.lse.ac.uk/64863/8/Fryzlewicz_Multiple%20change-point%20detection_2017_published%20LSERO.pdf
https://doi.org/10.1177/0278364917713116
https://doi.org/10.1109/JSEN.2017.2703859
https://doi.org/10.1117/12.2262918
https://doi.org/10.1145/3014812.3014875
https://doi.org/10.1145/3056540.3076194
https://doi.org/10.1016/j.procs.2016.05.345
https://doi.org/10.1177/1550147716683687
https://doi.org/10.1109/35021BIGCOMP.2015.7072841
https://dl.acm.org/citation.cfm?id=2997017
https://doi.org/10.1016/j.ins.2017.11.045
http://www.mdpi.com/1424-8220/18/4/1126/htm
http://www.mdpi.com/1424-8220/18/2/623/htm
https://doi.org/10.1007/s11042-015-3188-y
https://doi.org/10.1142/S021951941850015X
https://doi.org/10.1016/j.ins.2017.11.045
Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article
Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.
Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.
Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.
Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.
Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.
Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).
Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov
Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article