Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 374, осень 2016

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Результаты)
Текущая версия (19:45, 25 декабря 2016) (править) (отменить)
 
(14 промежуточных версий не показаны.)
Строка 1: Строка 1:
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}}
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}}
-
 
-
{{tip|''Внимание! Страница в процессе наполнения. Пожалуйста, запишите свою фамилию.''}}
 
-
 
== Курс ==
== Курс ==
-
(раздел будет изменен)
 
-
 
'''Построение эксплуатируемых моделей''' машинного обучения
'''Построение эксплуатируемых моделей''' машинного обучения
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 274, весна 2015|Моя первая научная статья в журнале ВАК, группа 274]]
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 274, весна 2015|Моя первая научная статья в журнале ВАК, группа 274]]
Строка 12: Строка 7:
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014 | Группа 174, осень 2014: построение эксплуатируемых моделей и проведение вычислительного эксперимента, задачи из индустриальных и академических источников]]
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014 | Группа 174, осень 2014: построение эксплуатируемых моделей и проведение вычислительного эксперимента, задачи из индустриальных и академических источников]]
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013 | Группа 074, осень 2013: построение эксплуатируемых моделей и проведение вычислительного эксперимента]]
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013 | Группа 074, осень 2013: построение эксплуатируемых моделей и проведение вычислительного эксперимента]]
-
* Короткая ссылка на эту страницу: http://goo.gl/7wpPlp
+
* Короткая ссылка на эту страницу: http://bit.ly/2hlhHdm
-
* Проекты с готовой Web-частью располагаются по адресу http://mvr.jmlda.org
+
-
* Страница курса на английском [[Machine Learning and Data Analysis (Strijov's practice)/4th year, fall]]
+
-
* Короткий адрес страницы [http://bit.ly/1S4GPPp bit.ly/1S4GPPp]
+
== Результаты ==
== Результаты ==
Строка 24: Строка 16:
! Ссылка
! Ссылка
! Консультант
! Консультант
-
! Рецензент
 
! Доклады
! Доклады
! Буквы
! Буквы
! Сумма
! Сумма
-
! Оценка
 
-
|-
 
-
|Бочкарев Артем
 
-
|Анализ данных для выявления скрытых закономерностей в петрофизической информации, полученной лабораторными исследованиями керна
 
-
|[http://svn.code.sf.net/p/mlalgorithms/code/Group274/Bochkarev2015CorePatterns folder], [http://svn.code.sf.net/p/mlalgorithms/code/Group274/Bochkarev2015CorePatterns/doc/Bochkarev2015Systemdocs.doc?format=raw sysdoc],
 
-
[http://svn.code.sf.net/p/mlalgorithms/code/Group274/Bochkarev2015CorePatterns/doc/Bochkarev2015ProblemStatement.pdf?format=raw problem],
 
-
[http://svn.code.sf.net/p/mlalgorithms/code/Group274/Bochkarev2015CorePatterns/doc/Bochkarev2015CorePresentation.pdf?format=raw slides]
 
-
|Софронов И. Л.
 
-
|Жариков
 
-
|GM
 
-
|L--AICUT-DP-R-V-W
 
-
|
 
-
|
 
|-
|-
|Баяндина Анастасия
|Баяндина Анастасия
Строка 48: Строка 26:
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Bayandina2016DiscourseTopicModeling/doc/Bayandina2016Presentation.pdf?format=raw slides]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Bayandina2016DiscourseTopicModeling/doc/Bayandina2016Presentation.pdf?format=raw slides]
|В.Сафронов
|В.Сафронов
-
|
+
|BF
-
|B
+
|GALICUTDP0WRS
-
|GA0L0I0C0
+
|13
-
|
+
-
|
+
|-
|-
|Белозерова Анастасия
|Белозерова Анастасия
Строка 62: Строка 38:
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Belozerova2016Causality/doc/Belozerova2016Presentation.pdf?format=raw slides]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Belozerova2016Causality/doc/Belozerova2016Presentation.pdf?format=raw slides]
|Рябенко Е. А.
|Рябенко Е. А.
-
|
+
|BF
-
|B
+
|GALI0CU0T0DP0WRS
-
|G>A>L0I0C0
+
|10
-
|
+
-
|
+
|-
|-
|Владимирова Мария
|Владимирова Мария
Строка 74: Строка 48:
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Vladimirova2016MTL/doc/VladimirovaSlides.pdf?format=raw slides]
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Vladimirova2016MTL/doc/VladimirovaSlides.pdf?format=raw slides]
|Стрижов В. В.
|Стрижов В. В.
-
|
+
|BF
-
|B
+
|GALI0CU0T0DP0WRS
-
|GA0L0I0C0
+
|10
-
|
+
-
|
+
|-
|-
|Володин Сергей
|Володин Сергей
Строка 84: Строка 56:
|[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/ folder], [http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/doc/Volodin2016Systemdocs.doc?format=raw Sysdoc], [http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/doc/Volodin2016TimeSeries.pdf?format=raw Statement], [http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/doc/Volodin2016TimeSeriesSlides.pdf?format=raw Slides] [http://redecision.ru:5001/ Web]
|[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/ folder], [http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/doc/Volodin2016Systemdocs.doc?format=raw Sysdoc], [http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/doc/Volodin2016TimeSeries.pdf?format=raw Statement], [http://svn.code.sf.net/p/mlalgorithms/code/Group374/Volodin2016TimeSeries/doc/Volodin2016TimeSeriesSlides.pdf?format=raw Slides] [http://redecision.ru:5001/ Web]
|Стрижов В. В.
|Стрижов В. В.
-
|
+
|BF
-
|B
+
|GALI0CU0T0DP0WRS
-
|GA0L0I0C0
+
|10
-
|
+
-
|
+
|-
|-
|Городницкий Олег
|Городницкий Олег
-
|
+
|Scalable construction of power flow feasibility regions
-
|
+
|[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Gorodnitskii2016PFFR/ folder], [https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Gorodnitskii2016PFFR/doc/Gorodnitskii2016Systemdocs.odt?format=raw sysdoc], [https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Gorodnitskii2016PFFR/doc/Gorodnitskii_2016_PFF_Problem_Statement.pdf?format=raw problem], [https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Gorodnitskii2016PFFR/ENG_Scalable%20construction%20of%20power%20flow%20feasibility%20regions.pdf?format=raw slides]
-
|
+
|Максимов
-
|
+
|B0F
-
|
+
|GALI0CU0T0DP0WRS
-
|G>A>
+
|10
-
|
+
-
|
+
|-
|-
|Иванычев Сергей
|Иванычев Сергей
Строка 104: Строка 72:
|[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/ folder],
|[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/ folder],
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/docs/Ivanychev2016systemdocs.docx?format=raw sysdoc],
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/docs/Ivanychev2016systemdocs.docx?format=raw sysdoc],
-
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/docs/Ivanychev2016problem.pdf?format=raw problem]
+
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/docs/Ivanychev2016problem.pdf?format=raw problem],
-
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/docs/Slides2.pdf?format=raw slides]
+
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/docs/Slides2.pdf?format=raw slides],
-
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/src source]
+
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/src source],
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/src/Permeability.ipynb?format=raw ipynb]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Ivanychev2016CoreFeatureSelection/src/Permeability.ipynb?format=raw ipynb]
|И. Л. Софронов
|И. Л. Софронов
-
|
+
|BF
-
|B(F)
+
|GALICUTDPWRS
-
|GALICUTDPWR(S)
+
|14
-
|
+
-
|
+
|-
|-
|Ковалева Валерия
|Ковалева Валерия
Строка 121: Строка 87:
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Kovaleva2016DomainDetection/doc/Kovaleva2016Presentation.pdf?format=raw slides]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Kovaleva2016DomainDetection/doc/Kovaleva2016Presentation.pdf?format=raw slides]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Kovaleva2016DomainDetection/code/DomainDetection.ipynb?format=raw ipynb]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Kovaleva2016DomainDetection/code/DomainDetection.ipynb?format=raw ipynb]
-
|
+
|С.К. Нечаев
-
|
+
|BF
-
|
+
|GALI0CUTDP0WRS
-
|G0A0
+
|12
-
|
+
-
|
+
|-
|-
|Малыгин Виталий
|Малыгин Виталий
Строка 133: Строка 97:
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Malygin2016RegressionModel/doc/Malygin2016RegressionModel.pdf?format=raw slides]
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Malygin2016RegressionModel/doc/Malygin2016RegressionModel.pdf?format=raw slides]
|Ш. Ишкина
|Ш. Ишкина
-
|
+
|B0F0
-
|
+
|GALICU0T0DP0W0RS
-
|G0A0
+
|8
-
|
+
-
|
+
|-
|-
|Молибог Игорь
|Молибог Игорь
Строка 147: Строка 109:
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Molybog2016TrafficSplitting/doc/Molybog2016TrafficSplitPresent.pdf?format=raw slides]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Molybog2016TrafficSplitting/doc/Molybog2016TrafficSplitPresent.pdf?format=raw slides]
|Y. V. Chehovich
|Y. V. Chehovich
-
|
+
|B0F
-
|
+
|GALICUTDPWRS
-
|G0A0L0I0C0
+
|13
-
|
+
-
|
+
|-
|-
|Погодин Роман
|Погодин Роман
Строка 161: Строка 121:
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Pogodin2016BeliefPropagation/doc/presentation.pdf?format=raw slides]
[https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group374/Pogodin2016BeliefPropagation/doc/presentation.pdf?format=raw slides]
|Ю. Максимов
|Ю. Максимов
-
|
+
|B0F
-
|
+
|GALICUTDPWRS
-
|G>A>L0I0C0
+
|13
-
|
+
-
|
+
|-
|-
|Рязанов Андрей
|Рязанов Андрей
Строка 175: Строка 133:
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Ryazanov2016SDPKernelLearning/code/SVMSDP.ipynb?format=raw ipynb]
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Ryazanov2016SDPKernelLearning/code/SVMSDP.ipynb?format=raw ipynb]
|Ю. Максимов
|Ю. Максимов
-
|
+
|B0F
-
|
+
|GALICUTDP0WRS
-
|G>A>L0I0C0
+
|12
-
|
+
-
|
+
|-
|-
|Сафин Камиль
|Сафин Камиль
Строка 189: Строка 145:
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Safin2016ParaphraseDetection/code/sent2vec/run_alg.ipynb?format=raw ipynb]
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Safin2016ParaphraseDetection/code/sent2vec/run_alg.ipynb?format=raw ipynb]
|Кузнецова P.
|Кузнецова P.
-
|
+
|BF
-
|B
+
|GALICU0TDP0WRS
-
|GA0L0I0C0
+
|12
-
|
+
-
|
+
|-
|-
|Федоряка Дмитрий
|Федоряка Дмитрий
Строка 202: Строка 156:
[http://w37403.vdi.mipt.ru website], [https://www.youtube.com/watch?v=JSKMEtOWaOg video]
[http://w37403.vdi.mipt.ru website], [https://www.youtube.com/watch?v=JSKMEtOWaOg video]
|Воронцов К. В.
|Воронцов К. В.
-
|
+
|BF
-
|B(F)
+
|GALICUTDPWRS
|GALICUTDPWRS
|14
|14
-
|
 
|-
|-
|Цветкова Ольга
|Цветкова Ольга
Строка 213: Строка 165:
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Tsvetkova2016GatingFunction/code/Code.ipynb ipynb],
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Tsvetkova2016GatingFunction/code/Code.ipynb ipynb],
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Tsvetkova2016GatingFunction/doc/Tsvetkova2016GFPresentation.pdf?format=raw slides],
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Tsvetkova2016GatingFunction/doc/Tsvetkova2016GFPresentation.pdf?format=raw slides],
-
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Tsvetkova2016GatingFunction/doc/Tsvetkova2016SystemDocsGtF.pdf sysdoc],
+
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Tsvetkova2016GatingFunction/doc/Tsvetkova2016SystemDocsGtF.docx sysdoc],
-
|
+
|Воронцов К.В.
-
|
+
|B0F
-
|
+
|GALI0CU0T0DP0WRS
-
|G0A0
+
|9
-
|
+
-
|
+
|-
|-
|Чигринский Виктор
|Чигринский Виктор
-
|
+
| Исследование движения радужной оболочки глаза методом оптического потока
-
|[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Chigrinskiy2016IrisStructureAnalysis/doc/Chigrinskiy2016IrisStructureAnalysisSlides.pdf?format=raw slides]
+
|[https://svn.code.sf.net/p/mlalgorithms/code/Group374/Chigrinskiy2016IrisStructureAnalysis/ folder]
-
|
+
[https://svn.code.sf.net/p/mlalgorithms/code/Group374/Chigrinskiy2016IrisStructureAnalysis/doc/Chigrinskiy2016IrisStructureAnalysisSystemDocs.pdf?format=raw sysdoc]
-
|
+
[https://svn.code.sf.net/p/mlalgorithms/code/Group374/Chigrinskiy2016IrisStructureAnalysis/doc/Chigrinskiy2016IrisStructureAnalysisSlides.pdf?format=raw slides]
-
|
+
[https://svn.code.sf.net/p/mlalgorithms/code/Group374/Chigrinskiy2016IrisStructureAnalysis/code/script.ipynb ipynb]
-
|G0A0
+
[https://svn.code.sf.net/p/mlalgorithms/code/Group374/Chigrinskiy2016IrisStructureAnalysis/doc/Chigrinskiy2016IrisStructureAnalysisProblemStatement.pdf?format=raw problem]
-
|
+
|Матвеев И.А.
-
|
+
|B0F
 +
|GALI0CU0T0DP0WRS
 +
|9
|-
|-
|}
|}

Текущая версия

Содержание

Курс

Построение эксплуатируемых моделей машинного обучения

Результаты

Автор Тема научной работы Ссылка Консультант Доклады Буквы Сумма
Баяндина Анастасия Построение дерева сценариев дистанционных консультаций с помощью тематической модели коллекции диалогов folder, sysdoc,

problem, slides

В.Сафронов BF GALICUTDP0WRS 13
Белозерова Анастасия Выбор метода выявления причинно-следственных связей в данных folder

code sysdoc problem, slides

Рябенко Е. А. BF GALI0CU0T0DP0WRS 10
Владимирова Мария Предсказание временных рядов с помощью многозадачного обучения folder, sysdoc,

problem, slides

Стрижов В. В. BF GALI0CU0T0DP0WRS 10
Володин Сергей Классификация временных рядов при помощи локальной аппроксимации folder, Sysdoc, Statement, Slides Web Стрижов В. В. BF GALI0CU0T0DP0WRS 10
Городницкий Олег Scalable construction of power flow feasibility regions folder, sysdoc, problem, slides Максимов B0F GALI0CU0T0DP0WRS 10
Иванычев Сергей Regression and feature selection for optimising soil permeability measurement folder,

sysdoc, problem, slides, source, ipynb

И. Л. Софронов BF GALICUTDPWRS 14
Ковалева Валерия Macromolecule folding cluster analysis and globule classification folder, sysdoc,

problem slides ipynb

С.К. Нечаев BF GALI0CUTDP0WRS 12
Малыгин Виталий Построение регрессионной модели в задаче отбора признаков folder, sysdoc, problem, idef0,

slides

Ш. Ишкина B0F0 GALICU0T0DP0W0RS 8
Молибог Игорь Traffic splitting problem folder, sysdoc,

problem, idef0, ipynb, slides

Y. V. Chehovich B0F GALICUTDPWRS 13
Погодин Роман Belief Propagation Approach for Ensemble Clustering folder, sysdoc

problem idef ipynb slides

Ю. Максимов B0F GALICUTDPWRS 13
Рязанов Андрей Learning the Kernel Matrix with Semidefinite Programming folder, sysdoc

idef0 slides code ipynb

Ю. Максимов B0F GALICUTDP0WRS 12
Сафин Камиль Детектирование парафраз folder, sysdoc

problem slides code ipynb

Кузнецова P. BF GALICU0TDP0WRS 12
Федоряка Дмитрий Визуализация иерархических тематических моделей folder, sysdoc,

problem, slides, website, video

Воронцов К. В. BF GALICUTDPWRS 14
Цветкова Ольга Построение скоринговых мультимоделей folder,

ipynb, slides, sysdoc,

Воронцов К.В. B0F GALI0CU0T0DP0WRS 9
Чигринский Виктор Исследование движения радужной оболочки глаза методом оптического потока folder

sysdoc slides ipynb problem

Матвеев И.А. B0F GALI0CU0T0DP0WRS 9

Работа и консультации

  1. Работы сдаются в течение недели.
  2. Желательна итеративная сдача работ, начинать показ лучше в выходные.
  3. Дедлайн последней версии работы: среда 6:00am (проверка занимает всю среду).
  4. В отчет будет добавлен пункт об учете времени, затраченном на выполнение проекта по неделям.
  5. Каждый этап работ + 1 балл по системе (А--, А-, А, А+, А++). Несделанная работа — A0. Мотивированный перенос работы — знак «A>».
  6. Доклады обозначаются буквами B,M,F.

Расписание

Дата Что сделано Результат для обсуждения Буква
Сентябрь 7 Первая лекция. Представление нового курса, мотивация, организация работ.
14 Выбрана задача, рецензент. Заполнены разделы "Аннотация" и "Описание проекта" в Systemdocs. Доклад на 45 секунд о своем проекте. Запись в ML. Доклад B Go
21 Поставлена задача. Написаны математическая постановка в формате TeX и описание базового алгоритма. Постановка задачи и алгоритм. Algorithm
28 Собрана литература. Собрана и описана выборка, сделано описание данных. Описание данных. Список литературы. Literature
Октябрь 5 Разработана архитектура и интерфейс ядра системы. Архитектура описана в формате IDEF0. Описание архитектуры, интерфейсов в IDEF0. Idef
19 Детализирован интерфейс, написан код. Код для реальных данных. Code
26 Написаны юнит-тесты и модуль, их запускающий. Подготовлен доклад с обоснованием интерфейсов и IDEF-описания. Юнит-тесты, доклад M. Unit
Ноябрь 2 Собраны и подготовлены данные, необходимые для тестирования. Написаны и запущены системные тесты. Тесты, данные, доработанная схема IDEF0. Tests, Data
9 Код оптимизирован. Отчет профайлера до и после. Profiler
16 Сделан визуальный отчет. Завершенный тех.отчет с экспериментом, код на сайте, рецензия. Web, Report.
23 Сделан пользовательский интерфейс и неcколько примеров использования системы. Написана рецензия на работу. Доклад F первой группы. Slides, reView
30 Подготовлен доклад, приведены в порядок документация и код. Обсуждение результатов, доклад F второй группы. Slides

Доклады обозначаются буквами B, M, F.

Домашние задания

Подготовительное задание

  1. Получить доступ к проекту MLalgorithms на SourceForge через старосту группы, прочитать статью, загрузить MLalgorithms.
  2. Зарегистрироваться на сайте machinelearning.ru, послать логин старосте.
  3. В папке Group374 создать папку Surname2016PrijectName (См. Численные методы обучения по прецедентам (практика, В.В. Стрижов), раздел "Работа с репозиторием".)
  4. Подготовка инструментов: выполнить Домашее задание-1, часть 1 и 2 (часть 3 по желанию).


14 сентября

  • Выбрать задачу и подготовить доклад о выбранной задаче на 45 секунд (первая часть группы). Содержание доклада включает:
  1. Существо и цели проекта.
  2. Важность и применимость задачи.
  3. Описание предполагаемых методов решения.
  • Создать описание проекта, заполнить разделы «Мотивация» (1.1.2) и «Литература» (1.1.3) в SystemDocs


21 сентября

Создать отдельный файл LaTeX c постановкой задачи и базовым описанием алгоритма, включающими

  1. описание выборки,
  2. предположения и ограничения по составу выборки,
  3. статистические предположения о природе выборки (гипотезу порождения данных),
  4. определения (что такое модель, алгоритм),
  5. ограничения на множество допустимых моделей,
  6. функцию ошибки, критерий качества,
  7. оптимизационную постановку задачи,
  8. вид эксплуатационный модели.
  • Пример постановки задачи: [2].


28 сентября

  • Зафиксировать базовый алгоритм. При необходимости, расширить список литературы.
  • Собрать выборку и описать форматы и структуры данных в разделе 1.4 SystemDocs: состав выборки, основные статистики. Создать описание процедуры порождения выборки в формате IDEF0.
    • Скачать и установить Ramus, разобраться с нотацией IDEF0
  • Заполнить раздел Выполнимость задачи/Feasibility. Уточнить границы применимости предлагаемых методов, прописать условия отказа от классификации.
  • Подготовить доклад о выбранной задаче на 45 секунд (вторая часть группы).

IDEF0 организационный и содержательный.


7 октября

  • При необходимости, доработать постановку задачи. Сделать окончательное описание базового алгоритма.
  • Создать двухуровневую схему в IDEF0 (разделы 1.2.2 и 1.2.3), желательно, разделяя стадии обучения и использования модели.
  • Описать интерфейсы (раздел 2 SystemDocs).


14 октября Написать код.

Анализ ошибки в вычислительных экспериментах как анализ изменения функции ошибки при изменении состава выборки

Задана стратегия разбиения скользящего контроля. Поставлена задача оптимизации параметров для одного разбиения. Для набора разбиений получен набор значений векторов оптимальных параметров, набор значений функции ошибки на обучении и на контроле.Задан набор внешних критериев. Получен набор значений внешних критериев на обучении и контроле. Анализ ошибки содержит следующие базовые тесты.

  1. Анализ состава выборки:
    1. анализ простоты выборки по отдельным признакам (гистограммы признаков),
    2. анализ мультикоррелированности признаков, в частности анализ корреляционных или ковариационных матриц (визуализация результатов факторного анализа, метода Белсли, VIF, в частности, при изменении состава признаков),
    3. тест наличия выбросов в выборке (визуализация изменения функции ошибки при исключении выбросов),
    4. тест наличия мультимоделей (снижение ошибки при, например, использовании стратегии бустинга)
    5. оценка необходимой мощности выборки (по оси абсцисс - число объектов, по оси ординат - ошибка на обучении и ее стандартное отклонение),
    6. оценка необходимого числа признаков (по оси абсцисс - последовательно добавляемые признаки; признаки добавляются, например, по убыванию скорости изменения ошибки - т.н. ускорение и торможение ошибки)).
  2. Анализ дисперсии параметров и функции ошибки
    1. анализ стандартного отклонения функции ошибки (внутреннего критерия) и внешних критериев (в частности, визуализация ROC - обучение и контроль на каждом из разбиений),
    2. анализ изменения функции ошибки на итерациях оптимизации (ось абсцисс - итерации, ось ординат функция ошибки на обучении, контроле и ее стандартное отклонение),
    3. анализ изменения параметров и гиперпараметров модели (по оси абсцисс - итерации, по оси ординат - набор параметров, лапша и их стандартные отклонения или гиперпараметры),
    4. анализ изменения параметров и функций ошибки при из изменении структурных параметров или регуляризаторов (они по оси абсцисс, по оси ординат - не забываем о стандартном отклонении, получаемом скользящим контролем).
  3. Сложность алгоритма оптимизации функции ошибки в зависимости от объема выборки
    1. теоретическая,
    2. эмпирическая,
    3. аппроксимация эмпирической функции теоретической (по оси абсцисс - объем выборки, число признаков, число кластеров).
  4. Анализ свойств модели с помощью внешних критериев, учет возможных ограничений на параметры и структуру модели
    1. построение парето-оптимального фронта множества моделей, из которых производится выбор.

21 октября

  • Подготовить доклад, в котором обосновываются предлагаемые интерфейсы и IDEF-описания системы. Примерный план доклада.
    1. Титульный лист, см. пример и исходный код.
    2. Цель, мотивация и описание решаемой проблемы
    3. Проблема и вся работа в одном слайде
    4. Литература, какие методы развиваются
    5. Постановка задачи и, при необходимости, обозначения
    6. Теория в прямом или в теоремном (обратном) изложении
    7. Цель вычислительного эксперимента и описание данных
  • Написать юнит-тесты для каждого модуля.

5 октября

  • При необходимости, доработать постановку задачи. Сделать окончательное описание базового алгоритма.
  • Создать двухуровневую схему в IDEF0 (разделы 1.2.2 и 1.2.3), желательно, разделяя стадии обучения и использования модели.
  • Описать интерфейсы (раздел 2 SystemDocs).


19 октября Написать код.

Анализ ошибки в вычислительных экспериментах как анализ изменения функции ошибки при изменении состава выборки

Задана стратегия разбиения скользящего контроля. Поставлена задача оптимизации параметров для одного разбиения. Для набора разбиений получен набор значений векторов оптимальных параметров, набор значений функции ошибки на обучении и на контроле.Задан набор внешних критериев. Получен набор значений внешних критериев на обучении и контроле. Анализ ошибки содержит следующие базовые тесты.

  1. Анализ состава выборки:
    1. анализ простоты выборки по отдельным признакам (гистограммы признаков),
    2. анализ мультикоррелированности признаков, в частности анализ корреляционных или ковариационных матриц (визуализация результатов факторного анализа, метода Белсли, VIF, в частности, при изменении состава признаков),
    3. тест наличия выбросов в выборке (визуализация изменения функции ошибки при исключении выбросов),
    4. тест наличия мультимоделей (снижение ошибки при, например, использовании стратегии бустинга)
    5. оценка необходимой мощности выборки (по оси абсцисс - число объектов, по оси ординат - ошибка на обучении и ее стандартное отклонение),
    6. оценка необходимого числа признаков (по оси абсцисс - последовательно добавляемые признаки; признаки добавляются, например, по убыванию скорости изменения ошибки - т.н. ускорение и торможение ошибки)).
  2. Анализ дисперсии параметров и функции ошибки
    1. анализ стандартного отклонения функции ошибки (внутреннего критерия) и внешних критериев (в частности, визуализация ROC - обучение и контроль на каждом из разбиений),
    2. анализ изменения функции ошибки на итерациях оптимизации (ось абсцисс - итерации, ось ординат функция ошибки на обучении, контроле и ее стандартное отклонение),
    3. анализ изменения параметров и гиперпараметров модели (по оси абсцисс - итерации, по оси ординат - набор параметров, лапша и их стандартные отклонения или гиперпараметры),
    4. анализ изменения параметров и функций ошибки при из изменении структурных параметров или регуляризаторов (они по оси абсцисс, по оси ординат - не забываем о стандартном отклонении, получаемом скользящим контролем).
  3. Сложность алгоритма оптимизации функции ошибки в зависимости от объема выборки
    1. теоретическая,
    2. эмпирическая,
    3. аппроксимация эмпирической функции теоретической (по оси абсцисс - объем выборки, число признаков, число кластеров).
  4. Анализ свойств модели с помощью внешних критериев, учет возможных ограничений на параметры и структуру модели
    1. построение парето-оптимального фронта множества моделей, из которых производится выбор.

26 октября

  • Подготовить доклад, в котором обосновываются предлагаемые интерфейсы и IDEF-описания системы. Примерный план доклада.
    1. Титульный лист, см. пример и исходный код.
    2. Цель, мотивация и описание решаемой проблемы
    3. Проблема и вся работа в одном слайде
    4. Литература, какие методы развиваются
    5. Постановка задачи и, при необходимости, обозначения
    6. Теория в прямом или в теоремном (обратном) изложении
    7. Цель вычислительного эксперимента и описание данных
  • Написать юнит-тесты для каждого модуля.

2 ноября

  • Доделать IDEF0: детализировать блок обработки пользовательских данных, сделать второй уровень детализации. Второй уровень посвящен проверке адекватности пользовательских данных на:
  1. наличие вирусов в теле загружаемых данных (воздерживаться от выполнения команд, находящихся в теле файлов, например, mpeg),
  2. тип загружаемого файла,
  3. величину загружаемого файла,
  4. допустимость времени расчетов, сложности алгоритма распознавания (не более 15 сек, в противном случае обсуждается вариант фонового выполнения алгоритма или отправка результатов по почте),
  5. допустимость объема памяти (желательно не более 200 МБ),
  6. адекватность структуры входных данных (алгоритм не должен возвращать неадекватные результаты получив неадекватные данные, желательно сообщать о таком случае).
  • В папке data собрать реальные данные, предназначенные для демонстрации работы алгоритма (и, возможно, для тестирования, если объем данных невелик). При большом объеме данных в эту папку записываются файлы со ссылками в интернет, где можно скачать большую выборку. Вариант: ссылка находится в загрузчике данных. Подготовить описание данных в systemdocs.
  • Подготовить модель загрузки и проверки пользовательских данных. Модуль должен загружать один пользовательский файл.
  • Создать системные тесты: протестировать входные данные и запускаемый модуль. Поместить ссылку на него в раздел 5.2 SystemDocs

9 ноября

  • Используя профайлер, оптимизировать узкие места в коде. Проделанную работу описать в секции 5.3 systemdocs, используя отчеты профайлера и вставляя комментарии о проделанной работе.

На заметку:

  • Узкие места - те фрагменты кода, которые занимают значительное время при выполнении вычислительного эксперимента. Требуется показать, что при достигнуты улучшения кода при замене циклов на матричные операции или показать, что код достаточно хорошо оптимизирован. При этом необходимо в отчет вставить наиболее значимые строки из отчета профайлера. Это как правило, первые 10-15 строк. Копировать можно из html-отчета профайлера или воспользоваться функцией profile. В ней есть пример, как сохранить отчет профайлера в удобном формате. При оптимизации кода можно вставить в отчет те измерения кода, которые вы считаете удачными.
  • Также при оптимизации рекомендуется пользоваться функцией parfor - параллельный for. См. документацию "doc parfor" и пример, где показано как включать параллельный режим. Совет: конструкции вида x = x+1 или x(end+1) = y и подобные конструкции не распараллеливаются. Чтобы избежать таких конструкций, надо заранее создавать структуры/матрицы требуемого размера. Параллельные вычисления работают в Матлабе начиная с версии 2012.

16 ноября

Внимание! Рецензия находится в конце файла системдокс в специальном разделе. Нужны только замечания по тем пунктам, которые там приведены.


  • Написать рецензию, [назвать файл YourSurname2014Review]. В заголовке рецензии - название работы, имя автора работы. В рецензии отражается, насколько качественно сделана система; удобно ли пользоваться документацией. План рецензии [ПО СИСТЕМДОКС]:
  1. Введение и мотивация:
    • мотивация автора глазами рецензента
    • альтернативные источники информации
    • место работы в области
    • резюме по мотивации (актуальность и новизна)
  2. Техническая часть.
    1. Постановка задачи: подтвердить или предложить альтернативу с обоснованием
    2. IDEF: выразить мнение об организации структуры интерфейса, пояснениях, именовании переменных, детализации.
    3. Составлено ли описание структуры данных, списка модулей.
    4. Код:
      • читаемость,
      • наличие комментариев и вспомогательных файлов,
      • отступы и структура,
      • код работает отдельно от автора.
    5. Профилирование и SystemDocs.
    6. Вычислительный эксперимент.
      • Иллюстрации оформлены в соответствии с JMLDA/Figs.
  3. Резюме в целом, мнение рецензента о работе.
  • Подготовить доклад на 1-1,5 минуты о рецензируемой работе. Рецензией можно поделиться с автором и консультантом.
  • Используя результаты вычислительного эксперимента и системного тестирования, создать поясняющие графики и таблицы и поместить их в раздел 5.2. При оформления отчета желательно разделять текст по содержанию на адекватно поименованные параграфы. В отчет должны входить:
    • Визуализация процесса выбора модели и оптимизиции структурных параметров
    • Визуализации зависимости функции потерь от уровня шума или других факторов
    • ...

23 ноября

Создать папку «web», содержащую следующие файлы:

  1. Файл "config.json" (именно с такими именем и расширением). Заполнить файл, следуя примеру, представленному в папке "Group074/Kuznetsov2013SSAForecasting/web/"
  2. Файл "main.m". Функция main должна быть единственный аргумент funcname и возвращать только строку html: html = main(filename). filename - текстовая строка, содержащая имя обрабатываемого файла, html - текстовая строка, содержащая "web" отчет в формате html.
  3. Файл "test.csv" (можно использовать другие расширения). Этот файл должен содержать тестовые данные (текст, временные ряды, изображение, звук, видео, etc.) для анализа.
  4. Другие файлы, необходимые для корректной работы функции "main" (например, файл, содержащий структурные параметры

алгоритма прогнозирования)

В целях тестирования, рекомендуется использовать функцию writeHTML. Она вызывает функцию "main('test.csv')" сохраняет результаты в "out.html". В этом файле должны содержаться либо "web"-отчет, либо сообщение об ошибке (см. типы ошибок, перечисленные в задании Tests, Data).

Личные инструменты