Анализ поведения по сигналам носимых устройств

Материал из MachineLearning.

Перейти к: навигация, поиск

Короткий адрес: http://bit.ly/2r3y70F

Содержание

Проекты

Задача

  • Название: Порождение признаков с помощью локально-аппроксимирующих моделей
  • Задача: Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
  • Данные:
    • WISDM (Kwapisz, J.R., G.M. Weiss, and S.A. Moore. 2011. Activity recognition using cell phone accelerometers. ACM SigKDD Explorations Newsletter. 12(2):74–82.), USC-HAD или сложнее. Данные акселерометра (Human activity recognition using smart phone embedded sensors: A Linear Dynamical Systems method, W Wang, H Liu, L Yu, F Sun - Neural Networks (IJCNN), 2014)
    • (Временной ряд (библиотека примеров), раздел Accelerometry).
  • Литература:
    • Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471-1483.[1]
    • Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.URL
    • Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. URL
    • Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. URL
    • Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. URL
    • Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. URL
    • Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. URL
    • Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145. [2]
    • Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. [3]
  • Базовый алгоритм: Описан в работе Кузнецова, Ивкина.
  • Решение: Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
  • Новизна: Создан стандарт построения локально-аппроксимирующих моделей.
  • Авторы: С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов

Данные, ссылки на коллекции

Smartphone Dataset for Human Activity Recognition, created 08/2017/
This dataset contains data from 30 users within the age group of 22-79 years.
A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.
This dataset contains data from 60 users.
Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,
high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.
Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.
“PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).”
WISDM

Библиографические коллекции

Категория:Статьи

http://libgen.asia/db54d550f5d5e7c8612212517e59adf0/fuchs2010.pdf
Эталон
Andre Gensler, Bernhard Sick. Novel Criteria to Measure Performance of Time Series
Segmentation Techniques // In: T. Seidl, M. Hassani, C. Beecks (Eds.): Proceedings of the LWA 2014 Workshops: KDML, IR, FGWM, Aachen, Germany, 8-10 September 2014
http://www.cl.cam.ac.uk/~ab818/StepDetectionSmartphones.pdf
обзор подходов к выдлению куска, где человек идет, и шагов на этом куске
Many algorithms search instead for the periods inherent in the cyclic nature of walking [1, 18, 24]. Technically the cycle is
across a stride (two steps), although a sensor sited along the body’s mid-axis can exhibit a one-step period if the user’s gait
is symmetric. Typical stride frequencies are around 1–2 Hz, a range that few activities other than walking exhibit.
http://nitarc.be/map/bachelor/Olaf/Sources/Projectcode%20Filters/Papers/Automatic%20Step%20Detection%20in%20the%20Accelerometer%20Signal.pdf
H. Ying, C. Silex, A. Schnitzer, S. Leonhardt, and M.Schiek,
“Automatic step detection in the accelerometer signal.”
1) определение пиков и их подсчет (trshold method, adaptive/dynamic treshold ).
2) Pan-Tompkins: применяется набор фильтров, после чего сигнал имеет дискретный вид типа -1 0 1
3) С использованием модели - сравнение с шаблоном (template matching) - DTW или кросскорреляция
http://nitarc.be/map/paper/AMBIT_ThuerVerwimp.pdf
Step Detection Algorithms for Accelerometers
Применяют все перечисленное + на выделенных шагах ищут момент heel strike - вроде как тоже модель
http://www.am.sanken.osaka-u.ac.jp/~makihara/pdf/accv2010_phase.pdf
Phase Registration of a Single Quasi-Periodic Signal Using Self Dynamic Time Warping
3 Hz-filtering: nobody can walk with a speed of more than three steps per second. [Accelerometry based assessment of gait parameters in children, https://www.mcroberts.nl/files/Brandes.pdf]
http://www.stat.tamu.edu/~suhasini/teaching613/walker71.pdf
Walker, A. M. (1971) On the estimation of a harmonic component in a time series with stationary independent residuals. Biometrika 58, 21–36.
Приближаем сигнал моделью вида сумма синусоид с различными частотами + шум и приближаем все это наименьшими квадратами
По понятным причинам не очень хорошо работает для квазипериодических рядов
http://www.jstor.org/stable/3212772
Hannan, E. J. (1973) The estimation of frequency. Journal of Applied Probability 10, 510–9.
Почти такая же классика - максимизация периодограммы, асимптотически эквивалентная наименьшим квадратам (Quinn, B. G. (2009) Recent advances in rapid frequency estimation. DigitalSignalProcessing 19, 942–8, http://linkinghub.elsevier.com.sci-hub.org/retrieve/pii/S1051200408000559)
как правило, осуществляется с помощью FFT
http://biomet.oxfordjournals.org.sci-hub.org/content/78/3/489.short
B.G. Quinn, J.M. Fernandes, A fast efficient technique for the estimation of frequency, Biometrika 78 (1991) 489–498
Расширение методов фильтрации, основанных на применении FFT/максимизации периодограммы - поволяет отказаться от прдположений о независимости ошибок в модели
Ряд приближается моделью ARMA(2,2), частота оценивается итеративно
http://cseweb.ucsd.edu/~saul/papers/nmf_nips04.pdf
Sha, F. and Saul, L. K. (2005) Real-time pitch determination of one or more voices by nonnegative matrix factorization
Рассматривают аргумент гармоники как меняющуюся во времени фазу, а частоту определют как ее проиводную (instatenious frequency, IF). Также вводят понятие фундаментальной частоты - это самая низкая частота. Фундаментальная частота определяется как неподвижная точка преобразования, определяемого как производная фазы фурье-компонент (short time FT) исходного сигнала по времени. Неотрицательное разложение матриц используется для выделения разных голосов в обработке речи.
http://www.wakayama-u.ac.jp/~kawahara/PSSws/k012.pdf
Kawahara, H., Katayose, H., Cheveigne, A. de and Patterson, R. D. (1999) Fixed point analysis of frequency to instantaneous frequency mapping for
accurate estimation of f0 and periodicity
Развитие метода, предложенного в предыдущей статье: среди всех неподвижных точек выбирается точка с наименьшей оценкой Carrier-to-noise ratio. Для оценки C/N ration используется соображние о необходимости выполения основного тригонометрического тождества для первой и второй прозводных выделенного процесса. Также предлагается использовать квадратичное приближение кривых частоты-фазы для устранения размытия в области высоких частот (непонятная часть)
http://qspace.qu.edu.qa/bitstream/handle/10576/10682/Boashash_1992_Proceedings%20of%20IEEE_tutorial%20on%20IF%20algorithms%20&%20applications.pdf?sequence=1
Boashash, B. (1992b) Estimating and interpreting the instantaneous frequency of a signal–part 2: algorithms and applications
переписывает множество оценок частоты непрерывного сигнала в дискретном случае
On multiple pattern extraction using singular value decomposition
Partha Pratim Kanjilal, Sarbani Palit
IEEE transactions on signal processing, Vol. 43, No. 6, pp. 1536-1540. 1995.


Robust method for periodicity detection and characterization of irregular cyclical seriesin terms of embedded periodic components, 1999
P. P. Kanjilal, J. Bhattacharya and G. Saha
Про устойчивость сингулярного разложения: SVD is the most robust null-space detector
of a matrix compared to other eigen decompositions [22]; it is numerically well conditioned and can be computed in a numerically stable way. The efficiency of SVD in noise separation and in estimating embedding dimension is well established [23]
http://people.duke.edu/~mk176/publications/KumarEtAl_CRB_JofHydrology.pdf
Выбор главных компонент на основе анализа пространства сингулярные величины главных компонент - соответствующие им частоты
https://doi.org/10.1109/TNNLS.2016.2531089
https://doi.org/10.1007/s10444-016-9483-y
https://doi.org/10.1007/s00521-015-2039-0
https://doi.org/10.1016/j.neucom.2018.02.074
https://academic.oup.com/biostatistics/advance-article/doi/10.1093/biostatistics/kxx070/4788724
https://doi.org/10.1016/j.ins.2018.02.041
https://doi.org/10.1016/j.asoc.2017.11.037
https://doi.org/10.1016/j.asoc.2018.01.002
https://doi.org/10.1002/bimj.201700021
http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics
Aligned Cluster Analysis for Temporal Segmentation of Human Motion
Feng Zhou, Fernando De la Torre
Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.
Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.
Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно плавно и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.
http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162
Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion
Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.
https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf
Temporal Segmentation of Facial Behavior
Fernando De la Torre
Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их в динамические выражения лица (видимо, слова).
Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.
Затем они хотят выделять слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв) и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.
Статья написана достаточно мутно
http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf
Segmenting Motion Capture Data into Distinct Behaviors
Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos
Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения
Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения
Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки
http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf
O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data
Тоже PCA, для разрезов берутся
1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.
2) минимумы угловой скорости, видимо, из тех же соображений
http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf
further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion
http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf
P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.
Developed a string-based motif-finding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.
1) уменьшают размерность с помощью PCA
2) каждому отсчету времени - по букве с помощью k-means кластеризации
3) повторения одной и той же буквы сокращаются до одного
4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами подразумевает возможность построить разумное соответствие между ними
Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?
5) Для порождающих целей строится направленный граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.
https://doi.org/10.1007/s11063-017-9592-8
https://web.stanford.edu/~hallac/GGS.pdf
http://eprints.lse.ac.uk/64863/8/Fryzlewicz_Multiple%20change-point%20detection_2017_published%20LSERO.pdf
https://doi.org/10.1177/0278364917713116
https://doi.org/10.1109/JSEN.2017.2703859
https://doi.org/10.1117/12.2262918
https://doi.org/10.1145/3014812.3014875
https://doi.org/10.1145/3056540.3076194
https://doi.org/10.1016/j.procs.2016.05.345
https://doi.org/10.1177/1550147716683687
https://doi.org/10.1109/35021BIGCOMP.2015.7072841
https://dl.acm.org/citation.cfm?id=2997017
https://doi.org/10.1016/j.ins.2017.11.045
http://www.mdpi.com/1424-8220/18/4/1126/htm
http://www.mdpi.com/1424-8220/18/2/623/htm
https://doi.org/10.1007/s11042-015-3188-y
https://doi.org/10.1142/S021951941850015X
https://doi.org/10.1016/j.ins.2017.11.045
Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article
Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.
Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.
Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.
Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.
Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.
Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).
Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov
Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article
Личные инструменты