Анализ поведения по сигналам носимых устройств

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Проекты)
(Библиографические коллекции)
 
(53 промежуточные версии не показаны)
Строка 3: Строка 3:
== Проекты ==
== Проекты ==
-
===Задача 1 ===
 
-
* '''Название''': Аппроксимация границ радужки глаза
 
-
* '''Задача''': По изображению человеческого глаза определить окружности, аппроксимирующие внутреннюю и внешнюю границу радужки.
 
-
* '''Данные''': Растровые монохромные изображения, типичный размер 640*480 пикселей (однако, возможны и другие размеры)[http://www.bath.ac.uk/elec-eng/research/sipg/irisweb/], [http://www.cb-sr.ia.ac.cn/IrisDatabase.htm].
 
-
* '''Литература''':
 
-
** Адуенко А.А. Выбор мультимоделей в задачах классификации (научный руководитель В.В. Стрижов). Московский физико-технический институт, 2017. [http://www.frccsc.ru/sites/default/files/docs/ds/002-073-05/diss/11-aduenko/11-Aduenko_main.pdf?626]
 
-
** К.А.Ганькин, А.Н.Гнеушев, И.А.Матвеев Сегментация изображения радужки глаза, основанная на приближенных методах с последующими уточнениями // Известия РАН. Теория и системы управления, 2014, № 2, с. 78–92.
 
-
** Duda, R. O. Use of the Hough transformation to detect lines and curves in pictures / R. O. Duda, P. E. Hart // Communications of the ACM. 1972. Vol. 15, no. 1. Pp.
 
-
* '''Базовый алгоритм''': Ефимов Юрий. Поиск внешней и внутренней границ радужки на изображении глаза методом парных градиентов, 2015.
 
-
* '''Решение''': См. [[Media:Iris_circle_problem.pdf | Iris_circle_problem.pdf]]
 
-
* '''Новизна''': Предложен быстрый беспереборный алгоритм аппроксимации границ с помощью линейных мультимоделей.
 
-
* '''Консультант''': Александр Адуенко (автор Стрижов В.В., эксперт Матвеев И.А.)
 
-
===Задача 2 ===
 
-
* '''Название''': Оценка оптимального объема выборки
 
-
* '''Задача''': В условиях недостаточного числа дорогостоящих измерений требуется спрогнозировать оптимальный объем пополняемой выборки.
 
-
* '''Данные''': Выборки измерений в медицинской диагностике, в частности, выборка иммунологических маркеров.
 
-
* '''Литература''':
 
-
** Мотренко А.П. Материалы по алгоритмам оценки оптимального объема выборки в репозитории MLAlgorithms[http://svn.code.sf.net/p/mlalgorithms/code/PhDThesis/Motrenko/doc/], [http://svn.code.sf.net/p/mlalgorithms/code/Group874/Motrenko2014KL/].
 
-
* '''Базовый алгоритм''': Алгоритмы оценки объема выборки при .
 
-
* '''Решение''': Исследование свойств пространства параметров при пополнении выборки.
 
-
* '''Новизна''': Предложена новая методология прогнозирования объема выборки, обоснованная с точки зрения классической и байесовской статистики.
 
-
* '''Авторы''': А.М. Катруца, В.В. Стрижов, эксперт А.П. Мотренко
 
-
===Задача 3 ===
+
===Задача===
-
* '''Название''': Восстановление структуры прогностической модели по вероятностному представлению
+
-
* '''Задача''': Требуется восстановить дерево суперпозиции по порожденному графу вероятностей связей.
+
-
* '''Данные''': Сегменты временных, пространственно-временных рядов (и текстовые коллекции).
+
-
* '''Литература''':
+
-
** Работы Tommy Yakkola и других в LinkReview [https://docs.google.com/document/d/1j-1eZ4Az05yBR3GvgZusqFVIZeE_HcZDawZDzz41zS4/edit?usp=sharing].
+
-
* '''Базовый алгоритм''': Метод ветвей и границ, динамическое пограммирование при построении полносвязного графа.
+
-
* '''Решение''': Построение модели в виде GAN, VAE порождает взвешенный граф, NN аппроксимирует структуру дерева.
+
-
* '''Новизна''': Предложен способ оштрафовать граф за то, что он не является деревом. Предложен способ прогнозирования структур прогностических моделей.
+
-
* '''Авторы''': А.М. Катруца, В.В. Стрижов
+
-
 
+
-
===Задача 4 ===
+
-
* '''Название''': Распознавание текста на основе скелетного представления толстых линий и сверточных сетей
+
-
* '''Задача''': Требуется построить две CNN, одна распознает растровое представление изображения, другая векторное.
+
-
* '''Данные''': Шрифты в растровом представлении.
+
-
* '''Литература''': Список работ [http://www.machinelearning.ru/wiki/images/a/a2/Morozov2017Synthesis_of_medicines.pdf], в частности arXiv:1611.03199 и
+
-
* '''Базовый алгоритм''': Сверточная сеть для растрового изображения.
+
-
* '''Решение''': Требуется предложить способ свертывания графовых структур, позволяющий породить информативное описание скелета толстой линии.
+
-
* '''Новизна''': Предложен способ повышения качества распознавания толстых линий за счет нового способа порождения их описаний.
+
-
* '''Авторы''': Л.М. Местецкий, И.А. Рейер, В.В. Стрижов
+
-
 
+
-
===Задача 5 ===
+
* '''Название''': Порождение признаков с помощью локально-аппроксимирующих моделей
* '''Название''': Порождение признаков с помощью локально-аппроксимирующих моделей
* '''Задача''': Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
* '''Задача''': Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
Строка 62: Строка 19:
** Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. [http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group874/Motrenko2014TSsegmentation/JBHI/MotrenkoStrijov2014RV2.pdf?format=raw URL]
** Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. [http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group874/Motrenko2014TSsegmentation/JBHI/MotrenkoStrijov2014RV2.pdf?format=raw URL]
** Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. [http://strijov.com/papers/Ignatov2015HumanActivity.pdf URL]
** Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. [http://strijov.com/papers/Ignatov2015HumanActivity.pdf URL]
 +
** Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145. [http://strijov.com/papers/AnikeyevPenkin2017Splines.pdf]
 +
** Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. [http://strijov.com/papers/Isachenko2018AccelerometerAIDM.pdf]
* '''Базовый алгоритм''': Описан в работе Кузнецова, Ивкина.
* '''Базовый алгоритм''': Описан в работе Кузнецова, Ивкина.
* '''Решение''': Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
* '''Решение''': Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
Строка 67: Строка 26:
* '''Авторы''': С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов
* '''Авторы''': С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов
-
===Задача 6 ===
+
== Данные, ссылки на коллекции ==
-
* '''Название''': Декодирование сигналов мозга и прогнозирование намерений
+
-
* '''Задача''': Требуется построить модель, восстанавливающую движение конечностей по кортикограмме.
+
-
* '''Данные''': neurotycho.org [http://neurotycho.org/]
+
-
* '''Литература''':
+
-
** Нейчев Р.Г., Катруца А.М., Стрижов В.В. Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования // Заводская лаборатория. Диагностика материалов, 2016, 82(3) : 68-74. [http://strijov.com/papers/Neychev2015FeatureSelection.pdf]
+
-
** MLAlgorithms: Motrenko, Isachenko (submitted)
+
-
* '''Базовый алгоритм''': Partial Least Squares[https://en.wikipedia.org/wiki/Partial_least_squares_regression]
+
-
* '''Решение''': Создать алгоритм выбора признаков, альтернативный PLS и учитывающий неортогональную структуру взаимозависимости признаков.
+
-
* '''Новизна''': Предложен способ выбора признаков, учитывающий закономерности как и независимой, так и в зависимой переменной.
+
-
* '''Авторы''': Р.В. Исаченко, В.В. Стрижов
+
-
===Задача 7 ===
+
*https://data.world/uci/smartphone-dataset-for-human-activity-recognition
-
* '''Название''': Автоматическое определение релевантности параметров нейросети.
+
: Smartphone Dataset for Human Activity Recognition, created 08/2017/
-
* '''Задача''': Рассматривается задача нахождения устойчивой (и не избыточной по параметрам) структуры нейросети. Для отсечения избыточных параметров предлагается ввести априорные вероятностные предположения о распределении параметров и удалить из нейросети неинформативные параметры методом Белсли. Для настройки априорного распределения предлагается использовать градиентные методы.
+
: This dataset contains data from 30 users within the age group of 22-79 years.
-
* '''Данные''': Выборка рукописных цифр MNIST
+
-
* '''Базовый алгоритм''': Optimal Brain Damage, прореживание на основе вариацинного вывода. Структуру итоговой модели предлагается сравнивать с моделью, полученной алгоритмом AdaNet.
+
-
* '''Литература''':
+
-
** [https://arxiv.org/pdf/1502.03492.pdf] Градиентные методы оптимизации гиперпараметров.
+
-
** [http://proceedings.mlr.press/v48/luketina16.pdf] Градиентные методы оптимизации гиперпараметров.
+
-
** [http://yann.lecun.com/exdb/publis/pdf/lecun-90b.pdf] Optimal Brain Damage.
+
-
** [https://arxiv.org/abs/1607.01097] AdaNet
+
-
** [http://strijov.com/papers/SanduleanuStrijov2011FeatureSelection_Preprint.pdf] Метод Белсли
+
-
* '''Авторы''': О.Ю. Бахтеев, В.В. Стрижов
+
-
===Задача 8 ===
+
*http://extrasensory.ucsd.edu/
-
* '''Название''': Предсказание графовой структуры нейросетевой модели.
+
: A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.
-
* '''Задача''': Рассматривается задача нахождения устойчивой (и не избыточной по параметрам) структуры сверточной нейросети. Предлагается предсказывать структуру нейросети с использованием doubly-recurrent нейросетей. В качестве обучающей выборки предлагается использовать структуры моделей, показавших хорошее качество на подвыборках небольшой мощности.
+
: This dataset contains data from 60 users.
-
* '''Данные''': Выборки MNIST, CIFAR-10
+
-
* '''Базовый алгоритм''': случайный поиск. Возможно сравнение с работами по обучению с подкреплением.
+
-
* '''Литература''':
+
-
** [https://pdfs.semanticscholar.org/e7bd/0e7a7ee6b0904d5de6e76e095a6a3b88dd12.pdf] doubly-recurrent нейросети.
+
-
** [https://arxiv.org/pdf/1707.07012] Схожий подход с использованием обучения с подкреплением.
+
-
* '''Авторы''': О.Ю. Бахтеев. В.В. Стрижов
+
-
===Задача 9===
+
*https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:78937/tab/1
-
* '''Название''': Deep Learning for reliable detection of tandem repeats in 3D protein structures [[Media:Strijov_3D_CNN.pdf|подробнее в PDF]]
+
: Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,
-
* '''Задача''': Deep learning algorithms pushed computer vision to a level of accuracy comparable or higher than a human vision. Similarly, we believe that it is possible to recognize the symmetry of a 3D object with a very high reliability, when the object is represented as a density map. The optimization problem includes i) multiclass classification of 3D data. The output is the order of symmetry. The number of classes is ~10-20 ii) multioutput regression of 3D data. The output is the symmetry axis (a 3-vector). The input data are typically 24x24x24 meshes. The total amount of these meshes is of order a million. Biological motivation : Symmetry is an important feature of protein tertiary and quaternary structures that has been associated with protein folding, function, evolution, and stability. Its emergence and ensuing prevalence has been attributed to gene duplications, fusion events, and subsequent evolutionary drift in sequence. Methods to detect these symmetries exist, either based on the structure or the sequence of the proteins, however, we believe that they can be vastly improved.
+
: high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.
-
* '''Данные''': Synthetic data are obtained by ‘symmetrizing’ folds from top8000 library (http://kinemage.biochem.duke.edu/databases/top8000.php).
+
-
* '''Литература''': Our previous 3D CNN: [https://arxiv.org/abs/1801.06252] Invariance of CNNs (and references therein): [https://hal.inria.fr/hal-01630265/document], [https://arxiv.org/pdf/1706.03078.pdf]
+
-
* '''Базовой алгоритм''': A prototype has already been created using the Tensorflow framework [4], which is capable to detect the order of cyclic structures with about 93% accuracy. The main goal of this internship is to optimize the topology of the current neural network prototype and make it rotational and translational invariant with respect to input data. [4] [https://www.tensorflow.org/]
+
-
* '''Решение''': The network architecture needs to be modified according to the invariance properties (most importantly, rotational invariance). Please see the links below [https://hal.inria.fr/hal-01630265/document],
+
-
[https://arxiv.org/pdf/1706.03078.pdf] The code is written using the Tensorflow library, and the current model is trained on a single GPU (Nvidia Quadro 4000)of a desktop machine.
+
-
* '''Новизна''': Applications of convolutional networks to 3D data are still very challenging due to large amount of data and specific requirements to the network architecture. More specifically, the models need to be rotationally and transnationally invariant, which makes classical 2D augmentation tricks loosely applicable here. Thus, new models need to be developed for 3D data.
+
-
* '''Авторы''': эксперт Sergei Grudinin, консультанты Guillaume Pages, Vadim Strijov
+
-
===Задача 10===
+
*https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:76131
-
* '''Название''': Semi-supervised representation learning with attention
+
: Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.
-
* '''Задача''': обучение векторных представлений с использованием механизма attention, благодаря которому значительно выросло качество машинного перевода. Предлагается использовать его в сети архитектуры encoder-decoder для получения векторов фрагментов текста произвольной длины.
+
-
* '''Данные''': Предлагается рассмотреть две выборки: Microsoft Paraphrase Corpus (небольшой набор предложений, https://www.microsoft.com/en-us/download/details.aspx?id=52398) и PPDB(набор коротких сегментов, не всегда корректная разметка. http://sitem.herts.ac.uk/aeru/ppdb/en/)
+
-
* '''Литература''':
+
-
1. Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin. Attention Is All You Need (https://arxiv.org/abs/1706.03762).
+
-
2. John Wieting, Mohit Bansal, Kevin Gimpel, Karen Livescu. Towards Universal Paraphrastic Sentence Embeddings (https://arxiv.org/abs/1511.08198).
+
-
3. Ryan Kiros, Yukun Zhu, Ruslan Salakhutdinov, Richard S. Zemel, Antonio Torralba, Raquel Urtasun, Sanja Fidler. Skip-Thought Vectors (https://arxiv.org/abs/1506.06726).
+
-
4. Keras seq2seq (https://github.com/farizrahman4u/seq2seq).
+
-
* '''Базовый алгоритм''': решение [3] или векторные представления, полученные с использованием seq2seq [].
+
-
* '''Решение''': в задаче предлагается обучить векторные представления для фраз, используя механизм attention и метод частичного обучения. В качестве внутреннего функционала качества предлагается использовать усовершенствованную функцию ошибки из [2]. В качестве прикладной задачи можно рассмотреть задачу детектирования перефразирований и сентимент-анализ. Причем, исходя из результатов, полученный в [1], можно сделать предположение о том, что механизм attention в большей степени влияет на получение универсальных векторов для фраз, чем архитектура сети. Предлагается протестировать эту гипотезу с использованием двух различных архитектур - стандартной рекуррентной и feed-forward сети.
+
-
* '''Новизна''': новый метод.
+
-
* '''Авторы''': Рита Кузнецова, консультант
+
-
=== Задача 11 ===
+
*http://physionet.org/
-
* '''Название''': Выбор интерпретируемых мультимоделей в задачах кредитного скоринга
+
: “PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).
-
* '''Задача''': Задача кредитного скоринга заключается в определении уровня кредитоспособности заемщика. Для этого используется анкета заемщика, содержащая как числовые (возраст, доход), так и категориальные признаки (пол, профессия). Требуется, имея историческую информацию о возвратах кредитов другими заемщиками, определить, вернет ли заемщик кредит. Данные могут быть разнородными (например, в случае наличия в стране разных регионов по доходу), и для адекватной классификации потребуется несколько моделей. Необходимо определить оптимальное число моделей. По набору параметров моделей необходимо составить портрет заемщика.
+
-
* '''Данные''': Предлагается рассмотреть пять выборок из репозиториев UCI и Kaggle, мощностью от 50000 объектов.
+
-
* '''Литература''': Диссертация А.А. Адуенко \MLAlgorithms\PhDThesis; С. Bishop, Pattern recognition and machine learning, последняя глава; 20 years of Mixture experts.
+
-
* '''Базовой алгоритм''': Кластеризация и построение независимых моделей логистической регрессии, Адабуст, Решающий лес (с ограничениями на сложность), Смесь экспертов.
+
-
* '''Решение''': Предлагается алгоритм выбора мультимодели (смеси моделей или смеси экспертов) и определения оптимального числа моделей.
+
-
* '''Новизна''': Предлагается функция расстояния между моделями, в которых распределения параметров заданы на разных носителях.
+
-
* '''Авторы''': А.В. Гончаров, В.В. Стрижов.
+
-
=== Задача 12 ===
+
*http://www.cis.fordham.edu/wisdm/dataset.php
-
* '''Название''': Порождение признаков, инвариантных к изменению частоты временного ряда.
+
-
* '''Задача''': Неформально: есть набор временных рядов определенной частоты (s1), причем интересующая нас информация различима и при меньшей частоте дискретизации (например, отсчеты происходят каждую миллисекунду, а интересующие нас события происходят на интервале 0.1 с). Данные ряды интегрируются, снижая частоту в 10 раз (т.е. каждые 10 значений просто суммируются) и получается набор временных рядов s2.Предлагается найти такие преобразования над временным рядом, зависящие от частоты, что временные ряды высокой частоты s1и более низкой частоты s2 будут описываться одинаково. Формально: Задан набор временных рядов s1, ..., sNSс высокой частотой дискретизации 1. Целевая информация (например, движение рукой/cуточное колебание цены/…) различима и при меньшей частоте дискретизации 2 < 1. Необходимо найти такое отображение f: S G, -частота ряда, что оно будет порождать похожие признаковые описания для рядов различной частоты. Т.е.
+
-
f* = argminf E(f1(s1) -f2(s2)) , где E- некоторая функция ошибки.
+
-
* '''Данные''': Наборы временных рядов физической активности людей с акселерометров; временные ряды ЭЭГ человека; временные ряды энергопотребления городов/промышленных объектов. Ссылка на выборку: репозиторий UCI, наши выборки по ЭЭГ и акселерометрам.
+
-
* '''Литература''': См выше про Акселерометры
+
-
* '''Базовой алгоритм''': Преобразование Фурье.
+
-
* '''Решение''': Построение автоэнкодера с частично фиксированным внутренним представлением в виде того же временного ряда с меньшей частотой.
+
-
* '''Новизна''': Для временных рядов отсутствует “общепринятый подход” к анализу, в отличие, например, от анализа изображений. Если посмотреть на проблему отвлеченно, сейчас кот определяется так же хорошо, как и кот, занимающий вдвое меньшее пространство на изображении. Напрашивается аналогия с временными рядами. Тем более, природа данных в картинках и во временных рядах похожа: в картинках иерархия между значениями есть по двум осям (x и y), а во временных рядах - по одной - по оси времени. Гипотеза заключается в том, что сходные с анализом изображений методы позволят получить качественные результаты. Полученное признаковое представление может в дальнейшем использоваться для классификации и предсказания временных рядов.
+
-
* '''Авторы''': Р. Г. Нейчев, В.В. Стрижов.
+
-
=== Задача 13 ===
+
: WISDM
-
* '''Название''': Deep learning for RNA secondary structure prediction
+
-
* '''Задача''': RNA secondary structure is an important feature which defines RNA functional properties. Its importance can be illustrated by the fact, that it is evolutionary preserved and some types of functional RNAs always * have the same secondary structure, for example all tRNAs fold into cloverleaf. As secondary structure often defines functions, knowing RNAs secondary structure may help investigate functions of novel RNA molecules. RNA folding is not as easy as DNA folding, because RNA is single stranded molecule which forms complicated base-pairing interactions, while DNA mostly exists as fully base paired double helices. Current methods of RNA structure prediction rely on experimentally evaluated thermodynamic rules, but with thermodynamics alone only 80% of structures can be accurately predicted. We propose an AI-driven method for predicting RNA secondary structure inspired by neural machine translation model.
+
-
* '''Данные''': RNA sequences in form of strings of characters
+
-
* '''Литература''': https://arxiv.org/abs/1609.08144
+
-
* '''Базовой алгоритм''': https://www.ncbi.nlm.nih.gov/pubmed/16873527
+
-
* '''Решение''': Deep learning recurrent encoder-decoder model with attention
+
-
* '''Новизна''': Currently RNA secondary structure prediction still remains unsolved problem and to the best of our knowledge DL approach has never been introduced in the literature before
+
-
* '''Авторы''': консультант Мария Попова
+
-
=== Задача 14 ===
+
== Библиографические коллекции ==
-
to be done
+
-
* '''Название''': Предсказание музыкальных плейлистов пользователей в рекомендательной системе.
+
-
* '''Задача''':
+
-
* '''Данные''': [https://recsys-challenge.spotify.com конкурса конференции RecSys'18].
+
-
* '''Литература''':
+
-
*# ''Воронцов К.В.'' [[Media:voron17survey-artm.pdf|Обзор вероятностных тематических моделей]]. 2017.
+
-
* '''Базовой алгоритм''':
+
-
* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
+
-
* '''Новизна''':
+
-
* '''Авторы''': К.В.Воронцов.
+
-
=== Задача 15 ===
+
[[:Категория:Статьи]]
-
to be done
+
-
* '''Название''': Иерархическое тематическое моделирование текстовой коллекции
+
-
* '''Задача''': (варианты: новостной поток на русском / выпускные работы студентов на русском / научные статьи на английском / научпоп на русском).
+
-
* '''Данные''':
+
-
* '''Литература''':
+
-
*# ''Воронцов К.В.'' [[Media:voron17survey-artm.pdf|Обзор вероятностных тематических моделей]]. 2017.
+
-
* '''Базовой алгоритм''':
+
-
* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
+
-
* '''Новизна''':
+
-
* '''Авторы''': К.В.Воронцов
+
-
=== Задача 16 ===
+
*[[Способы оценки качества и сравнения результатов]]
-
to be done
+
: http://libgen.asia/db54d550f5d5e7c8612212517e59adf0/fuchs2010.pdf
-
* '''Название''': Анализ банковских транзакционных данных физических лиц для выявления паттернов потребления клиентов.
+
:: Эталон
-
* '''Задача''':
+
:: Andre Gensler, Bernhard Sick. Novel Criteria to Measure Performance of Time Series
-
* '''Данные''':
+
:: Segmentation Techniques // In: T. Seidl, M. Hassani, C. Beecks (Eds.): Proceedings of the LWA 2014 Workshops: KDML, IR, FGWM, Aachen, Germany, 8-10 September 2014
-
* '''Литература''':
+
-
*# ''Воронцов К.В.'' [[Media:voron17survey-artm.pdf|Обзор вероятностных тематических моделей]]. 2017.
+
*[[Основные проблемы анализа поведения и классификации движений]]
-
* '''Базовой алгоритм''':
+
-
* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
+
-
* '''Новизна''':
+
-
* '''Авторы''': К.В.Воронцов, консультанты Роза Айсина, Филипп Никитин.
+
-
=== Задача 17 ===
+
*[[Построение суперпозиций движений]]
-
to be done
+
-
* '''Название''': Анализ банковских транзакционных данных юридических лиц для выявления видов экономической деятельности компаний.
+
-
* '''Задача''':
+
-
* '''Данные''':
+
-
* '''Литература''':
+
-
*# ''Айсина Р.М.'' [[Media:2017AysinaBsc.pdf|Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным]].
+
-
* '''Базовой алгоритм''':
+
-
* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
+
-
* '''Новизна''': задача восстановления структуры товарно-денежных потоков в отрасли по банковским транзакционным данным ранее не ставилась.
+
-
* '''Авторы''': К.В.Воронцов, консультант Роза Айсина.
+
-
=== Задача 18 ===
+
*[[Алгоритмы подсчета числа/выделения шагов по данным акселерометра]]
-
* '''Название''': Сравнение нейросетевых и непрерывно-морфологических методов в задаче детекции текста (Text Detection).
+
-
* '''Задача''': Automatically Detect Text in Natural Images.
+
-
* '''Данные''': синтетические сгенерированные данные + подготовленная выборка фотографий + [https://vision.cornell.edu/se3/coco-text-2/ COCO-Text dataset] + [http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BD%D0%BA%D1%83%D1%80%D1%81_Avito.ru-2014:_%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D0%BD%D0%BE%D0%B9_%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%B8_%D0%BD%D0%B0_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F%D1%85 Конкурс Avito 2014].
+
-
* '''Литература''': [https://vision.cornell.edu/se3/wp-content/uploads/2016/01/1601.07140v1.pdf COCO benchmark], [https://vision.cornell.edu/se3/wp-content/uploads/2016/01/1601.07140v1.pdf One of a state-of-the-art architecture]
+
-
* '''Базовой алгоритм''': [https://github.com/eragonruan/text-detection-ctpn code] + морфологические методы, [http://www.machinelearning.ru/wiki/images/f/f1/Avito.ru-2014_Ulyanov_presentation.pdf Avito 2014 winner's solution].
+
-
* '''Решение''': Предлагается сравнить работы нескольких state-of-the-art алгоритмов, которым нужна обширная обучающая выборка, с морфологическими методы, требующие небольшого числа данных. Предлагается определить границы применимости тех или иных методов.
+
-
* '''Новизна''': предложить алгоритм, основанный на использовании как нейросетевых, так и морфологических методов (решение задачи word detection).
+
-
* '''Авторы''': И.Н. Жариков.
+
-
* '''Эксперт''': Л.М. Местецкий (морфологические методы).
+
-
== Данные, ссылки на коллекции ==
+
: http://www.cl.cam.ac.uk/~ab818/StepDetectionSmartphones.pdf
 +
:: обзор подходов к выдлению куска, где человек идет, и шагов на этом куске
 +
:: Many algorithms search instead for the periods inherent in the cyclic nature of walking [1, 18, 24]. Technically the cycle is
 +
:: across a stride (two steps), although a sensor sited along the body’s mid-axis can exhibit a one-step period if the user’s gait
 +
:: is symmetric. Typical stride frequencies are around 1–2 Hz, a range that few activities other than walking exhibit.
-
== Библиографические коллекции ==
+
:http://nitarc.be/map/bachelor/Olaf/Sources/Projectcode%20Filters/Papers/Automatic%20Step%20Detection%20in%20the%20Accelerometer%20Signal.pdf
 +
:: H. Ying, C. Silex, A. Schnitzer, S. Leonhardt, and M.Schiek,
 +
:: “Automatic step detection in the accelerometer signal.”
 +
:: 1) определение пиков и их подсчет (trshold method, adaptive/dynamic treshold ).
 +
:: 2) Pan-Tompkins: применяется набор фильтров, после чего сигнал имеет дискретный вид типа -1 0 1
 +
:: 3) С использованием модели - сравнение с шаблоном (template matching) - DTW или кросскорреляция
-
[[:Категория:Статьи]]
+
: http://nitarc.be/map/paper/AMBIT_ThuerVerwimp.pdf
 +
:: Step Detection Algorithms for Accelerometers
 +
:: Применяют все перечисленное + на выделенных шагах ищут момент heel strike - вроде как тоже модель
-
*[[Основные проблемы анализа поведения и классификации движений]]
+
: http://www.am.sanken.osaka-u.ac.jp/~makihara/pdf/accv2010_phase.pdf
 +
:: Phase Registration of a Single Quasi-Periodic Signal Using Self Dynamic Time Warping
 +
:: 3 Hz-filtering: nobody can walk with a speed of more than three steps per second. [Accelerometry based assessment of gait parameters in children, https://www.mcroberts.nl/files/Brandes.pdf]
-
*[[Построение суперпозиций движений]]
+
*[[Работы по выделению периода для периодических и квазипериодических временных рядов]]
 +
 
 +
: http://www.stat.tamu.edu/~suhasini/teaching613/walker71.pdf
 +
:: Walker, A. M. (1971) On the estimation of a harmonic component in a time series with stationary independent residuals. Biometrika 58, 21–36.
 +
:: Приближаем сигнал моделью вида сумма синусоид с различными частотами + шум и приближаем все это наименьшими квадратами
 +
:: По понятным причинам не очень хорошо работает для квазипериодических рядов
 +
 
 +
: http://www.jstor.org/stable/3212772
 +
:: Hannan, E. J. (1973) The estimation of frequency. Journal of Applied Probability 10, 510–9.
 +
:: Почти такая же классика - максимизация периодограммы, асимптотически эквивалентная наименьшим квадратам (Quinn, B. G. (2009) Recent advances in rapid frequency estimation. DigitalSignalProcessing 19, 942–8, http://linkinghub.elsevier.com.sci-hub.org/retrieve/pii/S1051200408000559)
 +
:: как правило, осуществляется с помощью FFT
 +
 
 +
: http://biomet.oxfordjournals.org.sci-hub.org/content/78/3/489.short
 +
:: B.G. Quinn, J.M. Fernandes, A fast efficient technique for the estimation of frequency, Biometrika 78 (1991) 489–498
 +
:: Расширение методов фильтрации, основанных на применении FFT/максимизации периодограммы - поволяет отказаться от прдположений о независимости ошибок в модели
 +
:: Ряд приближается моделью ARMA(2,2), частота оценивается итеративно
 +
 
 +
: http://cseweb.ucsd.edu/~saul/papers/nmf_nips04.pdf
 +
:: Sha, F. and Saul, L. K. (2005) Real-time pitch determination of one or more voices by nonnegative matrix factorization
 +
:: Рассматривают аргумент гармоники как меняющуюся во времени фазу, а частоту определют как ее проиводную (instatenious frequency, IF). Также вводят понятие фундаментальной частоты - это самая низкая частота. Фундаментальная частота определяется как неподвижная точка преобразования, определяемого как производная фазы фурье-компонент (short time FT) исходного сигнала по времени. Неотрицательное разложение матриц используется для выделения разных голосов в обработке речи.
 +
 
 +
: http://www.wakayama-u.ac.jp/~kawahara/PSSws/k012.pdf
 +
:: Kawahara, H., Katayose, H., Cheveigne, A. de and Patterson, R. D. (1999) Fixed point analysis of frequency to instantaneous frequency mapping for
 +
:: accurate estimation of f0 and periodicity
 +
:: Развитие метода, предложенного в предыдущей статье: среди всех неподвижных точек выбирается точка с наименьшей оценкой Carrier-to-noise ratio. Для оценки C/N ration используется соображние о необходимости выполения основного тригонометрического тождества для первой и второй прозводных выделенного процесса. Также предлагается использовать квадратичное приближение кривых частоты-фазы для устранения размытия в области высоких частот (непонятная часть)
 +
 
 +
: http://qspace.qu.edu.qa/bitstream/handle/10576/10682/Boashash_1992_Proceedings%20of%20IEEE_tutorial%20on%20IF%20algorithms%20&%20applications.pdf?sequence=1
 +
:: Boashash, B. (1992b) Estimating and interpreting the instantaneous frequency of a signal–part 2: algorithms and applications
 +
:: переписывает множество оценок частоты непрерывного сигнала в дискретном случае
 +
 
 +
:: On multiple pattern extraction using singular value decomposition
 +
:: Partha Pratim Kanjilal, Sarbani Palit
 +
:: IEEE transactions on signal processing, Vol. 43, No. 6, pp. 1536-1540. 1995.
 +
 
 +
 +
:: Robust method for periodicity detection and characterization of irregular cyclical seriesin terms of embedded periodic components, 1999
 +
:: P. P. Kanjilal, J. Bhattacharya and G. Saha
 +
:: Про устойчивость сингулярного разложения: SVD is the most robust null-space detector
 +
:: of a matrix compared to other eigen decompositions [22]; it is numerically well conditioned and can be computed in a numerically stable way. The efficiency of SVD in noise separation and in estimating embedding dimension is well established [23]
 +
 
 +
: http://people.duke.edu/~mk176/publications/KumarEtAl_CRB_JofHydrology.pdf
 +
:: Выбор главных компонент на основе анализа пространства сингулярные величины главных компонент - соответствующие им частоты
*[[Построение ансамблей моделей для порождения простых выборок (Сергей Иванычев – диплом) ]]
*[[Построение ансамблей моделей для порождения простых выборок (Сергей Иванычев – диплом) ]]
Строка 244: Строка 147:
*[[Сегментация временного ряда (Технологическая - прогнозирование времени отключения акселерометра)]]
*[[Сегментация временного ряда (Технологическая - прогнозирование времени отключения акселерометра)]]
 +
 +
:http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics
 +
:: Aligned Cluster Analysis for Temporal Segmentation of Human Motion
 +
:: Feng Zhou, Fernando De la Torre
 +
:: Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.
 +
:: Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.
 +
:: Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно плавно и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.
 +
 +
:http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162
 +
:: Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion
 +
::Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.
 +
 +
:https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf
 +
:: Temporal Segmentation of Facial Behavior
 +
:: Fernando De la Torre
 +
:: Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их в динамические выражения лица (видимо, слова).
 +
:: Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.
 +
:: Затем они хотят выделять слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв) и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.
 +
:: Статья написана достаточно мутно
 +
 +
: http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf
 +
:: Segmenting Motion Capture Data into Distinct Behaviors
 +
:: Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos
 +
:: Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения
 +
:: Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения
 +
:: Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки
 +
 +
: http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf
 +
:: O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data
 +
:: Тоже PCA, для разрезов берутся
 +
:: 1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.
 +
:: 2) минимумы угловой скорости, видимо, из тех же соображений
 +
 +
: http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf
 +
:: further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion
 +
 +
: http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf
 +
:: P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.
 +
:: Developed a string-based motif-finding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.
 +
:: 1) уменьшают размерность с помощью PCA
 +
:: 2) каждому отсчету времени - по букве с помощью k-means кластеризации
 +
:: 3) повторения одной и той же буквы сокращаются до одного
 +
:: 4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами подразумевает возможность построить разумное соответствие между ними
 +
:: Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?
 +
:: 5) Для порождающих целей строится направленный граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.
 +
: https://doi.org/10.1007/s11063-017-9592-8
: https://doi.org/10.1007/s11063-017-9592-8
: https://web.stanford.edu/~hallac/GGS.pdf
: https://web.stanford.edu/~hallac/GGS.pdf
Строка 275: Строка 224:
*[[Классификация движений человека. Обзор литературы по проекту “Весёлый строитель”]]
*[[Классификация движений человека. Обзор литературы по проекту “Весёлый строитель”]]
 +
 +
*[[Работы команды Стрижова по декодированию временных рядов]]
 +
 +
: Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article
*[[Работы команды Стрижова по акселерометрам]]
*[[Работы команды Стрижова по акселерометрам]]
-
: Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016. [URL]
+
: Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.
 +
 
 +
: Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.
 +
 
 +
: Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.
-
: Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. [URL]
+
: Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.
-
: Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. [URL]
+
: Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.
-
: Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. [URL]
+
: Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).
-
: Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99). [URL]
+
: Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov
-
: Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. [URL] И прочие работы по этой теме тут www.ccas.ru/strijov
+
: Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article

Текущая версия

Короткий адрес: http://bit.ly/2r3y70F

Содержание

Проекты

Задача

  • Название: Порождение признаков с помощью локально-аппроксимирующих моделей
  • Задача: Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
  • Данные:
    • WISDM (Kwapisz, J.R., G.M. Weiss, and S.A. Moore. 2011. Activity recognition using cell phone accelerometers. ACM SigKDD Explorations Newsletter. 12(2):74–82.), USC-HAD или сложнее. Данные акселерометра (Human activity recognition using smart phone embedded sensors: A Linear Dynamical Systems method, W Wang, H Liu, L Yu, F Sun - Neural Networks (IJCNN), 2014)
    • (Временной ряд (библиотека примеров), раздел Accelerometry).
  • Литература:
    • Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471-1483.[1]
    • Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.URL
    • Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. URL
    • Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. URL
    • Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. URL
    • Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. URL
    • Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. URL
    • Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145. [2]
    • Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. [3]
  • Базовый алгоритм: Описан в работе Кузнецова, Ивкина.
  • Решение: Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
  • Новизна: Создан стандарт построения локально-аппроксимирующих моделей.
  • Авторы: С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов

Данные, ссылки на коллекции

Smartphone Dataset for Human Activity Recognition, created 08/2017/
This dataset contains data from 30 users within the age group of 22-79 years.
A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.
This dataset contains data from 60 users.
Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,
high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.
Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.
“PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).”
WISDM

Библиографические коллекции

Категория:Статьи

http://libgen.asia/db54d550f5d5e7c8612212517e59adf0/fuchs2010.pdf
Эталон
Andre Gensler, Bernhard Sick. Novel Criteria to Measure Performance of Time Series
Segmentation Techniques // In: T. Seidl, M. Hassani, C. Beecks (Eds.): Proceedings of the LWA 2014 Workshops: KDML, IR, FGWM, Aachen, Germany, 8-10 September 2014
http://www.cl.cam.ac.uk/~ab818/StepDetectionSmartphones.pdf
обзор подходов к выдлению куска, где человек идет, и шагов на этом куске
Many algorithms search instead for the periods inherent in the cyclic nature of walking [1, 18, 24]. Technically the cycle is
across a stride (two steps), although a sensor sited along the body’s mid-axis can exhibit a one-step period if the user’s gait
is symmetric. Typical stride frequencies are around 1–2 Hz, a range that few activities other than walking exhibit.
http://nitarc.be/map/bachelor/Olaf/Sources/Projectcode%20Filters/Papers/Automatic%20Step%20Detection%20in%20the%20Accelerometer%20Signal.pdf
H. Ying, C. Silex, A. Schnitzer, S. Leonhardt, and M.Schiek,
“Automatic step detection in the accelerometer signal.”
1) определение пиков и их подсчет (trshold method, adaptive/dynamic treshold ).
2) Pan-Tompkins: применяется набор фильтров, после чего сигнал имеет дискретный вид типа -1 0 1
3) С использованием модели - сравнение с шаблоном (template matching) - DTW или кросскорреляция
http://nitarc.be/map/paper/AMBIT_ThuerVerwimp.pdf
Step Detection Algorithms for Accelerometers
Применяют все перечисленное + на выделенных шагах ищут момент heel strike - вроде как тоже модель
http://www.am.sanken.osaka-u.ac.jp/~makihara/pdf/accv2010_phase.pdf
Phase Registration of a Single Quasi-Periodic Signal Using Self Dynamic Time Warping
3 Hz-filtering: nobody can walk with a speed of more than three steps per second. [Accelerometry based assessment of gait parameters in children, https://www.mcroberts.nl/files/Brandes.pdf]
http://www.stat.tamu.edu/~suhasini/teaching613/walker71.pdf
Walker, A. M. (1971) On the estimation of a harmonic component in a time series with stationary independent residuals. Biometrika 58, 21–36.
Приближаем сигнал моделью вида сумма синусоид с различными частотами + шум и приближаем все это наименьшими квадратами
По понятным причинам не очень хорошо работает для квазипериодических рядов
http://www.jstor.org/stable/3212772
Hannan, E. J. (1973) The estimation of frequency. Journal of Applied Probability 10, 510–9.
Почти такая же классика - максимизация периодограммы, асимптотически эквивалентная наименьшим квадратам (Quinn, B. G. (2009) Recent advances in rapid frequency estimation. DigitalSignalProcessing 19, 942–8, http://linkinghub.elsevier.com.sci-hub.org/retrieve/pii/S1051200408000559)
как правило, осуществляется с помощью FFT
http://biomet.oxfordjournals.org.sci-hub.org/content/78/3/489.short
B.G. Quinn, J.M. Fernandes, A fast efficient technique for the estimation of frequency, Biometrika 78 (1991) 489–498
Расширение методов фильтрации, основанных на применении FFT/максимизации периодограммы - поволяет отказаться от прдположений о независимости ошибок в модели
Ряд приближается моделью ARMA(2,2), частота оценивается итеративно
http://cseweb.ucsd.edu/~saul/papers/nmf_nips04.pdf
Sha, F. and Saul, L. K. (2005) Real-time pitch determination of one or more voices by nonnegative matrix factorization
Рассматривают аргумент гармоники как меняющуюся во времени фазу, а частоту определют как ее проиводную (instatenious frequency, IF). Также вводят понятие фундаментальной частоты - это самая низкая частота. Фундаментальная частота определяется как неподвижная точка преобразования, определяемого как производная фазы фурье-компонент (short time FT) исходного сигнала по времени. Неотрицательное разложение матриц используется для выделения разных голосов в обработке речи.
http://www.wakayama-u.ac.jp/~kawahara/PSSws/k012.pdf
Kawahara, H., Katayose, H., Cheveigne, A. de and Patterson, R. D. (1999) Fixed point analysis of frequency to instantaneous frequency mapping for
accurate estimation of f0 and periodicity
Развитие метода, предложенного в предыдущей статье: среди всех неподвижных точек выбирается точка с наименьшей оценкой Carrier-to-noise ratio. Для оценки C/N ration используется соображние о необходимости выполения основного тригонометрического тождества для первой и второй прозводных выделенного процесса. Также предлагается использовать квадратичное приближение кривых частоты-фазы для устранения размытия в области высоких частот (непонятная часть)
http://qspace.qu.edu.qa/bitstream/handle/10576/10682/Boashash_1992_Proceedings%20of%20IEEE_tutorial%20on%20IF%20algorithms%20&%20applications.pdf?sequence=1
Boashash, B. (1992b) Estimating and interpreting the instantaneous frequency of a signal–part 2: algorithms and applications
переписывает множество оценок частоты непрерывного сигнала в дискретном случае
On multiple pattern extraction using singular value decomposition
Partha Pratim Kanjilal, Sarbani Palit
IEEE transactions on signal processing, Vol. 43, No. 6, pp. 1536-1540. 1995.


Robust method for periodicity detection and characterization of irregular cyclical seriesin terms of embedded periodic components, 1999
P. P. Kanjilal, J. Bhattacharya and G. Saha
Про устойчивость сингулярного разложения: SVD is the most robust null-space detector
of a matrix compared to other eigen decompositions [22]; it is numerically well conditioned and can be computed in a numerically stable way. The efficiency of SVD in noise separation and in estimating embedding dimension is well established [23]
http://people.duke.edu/~mk176/publications/KumarEtAl_CRB_JofHydrology.pdf
Выбор главных компонент на основе анализа пространства сингулярные величины главных компонент - соответствующие им частоты
https://doi.org/10.1109/TNNLS.2016.2531089
https://doi.org/10.1007/s10444-016-9483-y
https://doi.org/10.1007/s00521-015-2039-0
https://doi.org/10.1016/j.neucom.2018.02.074
https://academic.oup.com/biostatistics/advance-article/doi/10.1093/biostatistics/kxx070/4788724
https://doi.org/10.1016/j.ins.2018.02.041
https://doi.org/10.1016/j.asoc.2017.11.037
https://doi.org/10.1016/j.asoc.2018.01.002
https://doi.org/10.1002/bimj.201700021
http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics
Aligned Cluster Analysis for Temporal Segmentation of Human Motion
Feng Zhou, Fernando De la Torre
Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.
Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.
Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно плавно и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.
http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162
Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion
Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.
https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf
Temporal Segmentation of Facial Behavior
Fernando De la Torre
Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их в динамические выражения лица (видимо, слова).
Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.
Затем они хотят выделять слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв) и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.
Статья написана достаточно мутно
http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf
Segmenting Motion Capture Data into Distinct Behaviors
Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos
Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения
Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения
Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки
http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf
O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data
Тоже PCA, для разрезов берутся
1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.
2) минимумы угловой скорости, видимо, из тех же соображений
http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf
further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion
http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf
P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.
Developed a string-based motif-finding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.
1) уменьшают размерность с помощью PCA
2) каждому отсчету времени - по букве с помощью k-means кластеризации
3) повторения одной и той же буквы сокращаются до одного
4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами подразумевает возможность построить разумное соответствие между ними
Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?
5) Для порождающих целей строится направленный граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.
https://doi.org/10.1007/s11063-017-9592-8
https://web.stanford.edu/~hallac/GGS.pdf
http://eprints.lse.ac.uk/64863/8/Fryzlewicz_Multiple%20change-point%20detection_2017_published%20LSERO.pdf
https://doi.org/10.1177/0278364917713116
https://doi.org/10.1109/JSEN.2017.2703859
https://doi.org/10.1117/12.2262918
https://doi.org/10.1145/3014812.3014875
https://doi.org/10.1145/3056540.3076194
https://doi.org/10.1016/j.procs.2016.05.345
https://doi.org/10.1177/1550147716683687
https://doi.org/10.1109/35021BIGCOMP.2015.7072841
https://dl.acm.org/citation.cfm?id=2997017
https://doi.org/10.1016/j.ins.2017.11.045
http://www.mdpi.com/1424-8220/18/4/1126/htm
http://www.mdpi.com/1424-8220/18/2/623/htm
https://doi.org/10.1007/s11042-015-3188-y
https://doi.org/10.1142/S021951941850015X
https://doi.org/10.1016/j.ins.2017.11.045
Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article
Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.
Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.
Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.
Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.
Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.
Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).
Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov
Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article
Личные инструменты