Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014
Материал из MachineLearning.
(→Результаты) |
|||
Строка 7: | Строка 7: | ||
# эксплуатационная документация в формате systemdoics, | # эксплуатационная документация в формате systemdoics, | ||
# код вычислительного эксперимента и тесты, | # код вычислительного эксперимента и тесты, | ||
- | # версия кода для эксплуатаци[mvr.jmlda.org], | + | # версия кода для эксплуатаци[http://mvr.jmlda.org], |
# доклады и презентация. | # доклады и презентация. | ||
- | + | '''Результаты предыдущих курсов''' | |
+ | * [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, весна 2014 | Группа 174, весна 2014: первая научная статья]] | ||
+ | * [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013 | Группа 074, осень 2013: вычислительный эксперимент]] | ||
== Результаты == | == Результаты == | ||
Строка 188: | Строка 190: | ||
|} | |} | ||
- | == | + | == Расписание (до начала курса будет уточняться) == |
+ | {|class="wikitable" | ||
+ | ! Дата | ||
+ | ! | ||
+ | ! Что сделано | ||
+ | ! Результат для обсуждения | ||
+ | ! Буква | ||
+ | |- | ||
+ | |Сентябрь | ||
+ | |3 | ||
+ | |Представление нового курса, мотивация, организация работ. Две вводные лекции для новых студентов (по возможности). | ||
+ | |Обсудим прошлый семестр. | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |10 | ||
+ | |Выбрана задача, рецензент. Доклад на 45 секунд о своем проекте. | ||
+ | |Запись в ML. | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |17 | ||
+ | |Собрана литература, написаны комментарии. | ||
+ | |Список литературы и мини-сообщение. | ||
+ | |Literatura | ||
+ | |- | ||
+ | | | ||
+ | |24 | ||
+ | |Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX. | ||
+ | |Примерно страница текста. | ||
+ | |Statement | ||
+ | |- | ||
+ | |Октябрь | ||
+ | |1 | ||
+ | |Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные). | ||
+ | |Описание, IDEF0. | ||
+ | |Idef | ||
+ | |- | ||
+ | |8 | ||
+ | | | ||
+ | |Детализирован интерфейс, написан код первого приближения. | ||
+ | |Код для синтетических данных. | ||
+ | |Code | ||
+ | |- | ||
+ | | | ||
+ | |15 | ||
+ | |Написаны юнит-тесты и модуль, их запускающий. | ||
+ | |Юнит-тесты. | ||
+ | |Unit-test | ||
+ | |- | ||
+ | | | ||
+ | |22 | ||
+ | |Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. | ||
+ | |Данные, вторая схема IDEF0, модули. | ||
+ | |Data | ||
+ | |- | ||
+ | | | ||
+ | |29 | ||
+ | |Написаны и запущены системные тесты. По результатам доработки кода написана рецензия на работу. | ||
+ | |Тесты, рецензия. | ||
+ | |Tests | ||
+ | |- | ||
+ | |Ноябрь | ||
+ | |5 | ||
+ | |Код оптимизирован. | ||
+ | |Отчет профайлера до и после. | ||
+ | |Profiler | ||
+ | |- | ||
+ | | | ||
+ | |12 | ||
+ | |Сделан визуальный отчет. | ||
+ | |Завершенный тех.отчет. | ||
+ | |Report | ||
+ | |- | ||
+ | | | ||
+ | |19 | ||
+ | |Разработан веб-интерфейс. | ||
+ | |Код на сайте. | ||
+ | |Web | ||
+ | |- | ||
+ | | | ||
+ | |26 | ||
+ | |Сделан пользовательский интерфейс и неколько примеров использования системы. | ||
+ | |Обсуждение результатов, доклад первой группы. | ||
+ | |Show | ||
+ | |- | ||
+ | |Декабрь | ||
+ | |3 | ||
+ | |Подготовлен доклад, приведены в порядок документация и код. | ||
+ | |Доклад второй группы. | ||
+ | |Show | ||
+ | |- | ||
+ | |||
+ | |||
+ | |} | ||
+ | |||
+ | |||
+ | == Черновик описания курса == | ||
'''Анализ свойств''' включает следующие основные элементы: | '''Анализ свойств''' включает следующие основные элементы: | ||
Строка 199: | Строка 298: | ||
'''Результат''': | '''Результат''': | ||
- | * модуль для построения модели | + | * модуль для построения модели на языке Матлаб, |
* юнит-тесты модуля, | * юнит-тесты модуля, | ||
* вычислительный эксперимент, системные тесты: анализ свойств модели (то же), | * вычислительный эксперимент, системные тесты: анализ свойств модели (то же), | ||
Строка 218: | Строка 317: | ||
* Модуль на сервере mvr.jmlda.org. | * Модуль на сервере mvr.jmlda.org. | ||
- | '''Научная статья''': написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. <!---Предполагается, что студент - соавтор статьи - является участником уже сложившейся научной группы, которая обеспечивает качество статьи.---> | + | '''Научная статья''': написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. Так как на третьем курсе мы подали ряд статей в журналы ВАК, то имеет смысл для некоторых работ обсудить формат статьи в журнал WebOfKnowledge.<!---Предполагается, что студент - соавтор статьи - является участником уже сложившейся научной группы, которая обеспечивает качество статьи.---> |
- | '''Требования к слушателям''': слушатели знают базовый курс лекций К.В. Воронцова и программируют на | + | '''Требования к слушателям''': слушатели знают базовый курс лекций К.В. Воронцова и программируют на Матлабе. |
== Мотивация == | == Мотивация == | ||
- | |||
Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом: | Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом: | ||
1) ставим задачу в формальном наиболее детализированном варианте, | 1) ставим задачу в формальном наиболее детализированном варианте, | ||
2) делаем вычислительные эксперименты на Матлабе, | 2) делаем вычислительные эксперименты на Матлабе, | ||
3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета. | 3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета. | ||
- | |||
- | |||
== Сделать == | == Сделать == |
Версия 12:36, 26 августа 2014
Заметки и планы осеннего семестра. Материал будет убран на методическую страницу к концу августа. В сентябре тут будут опубликованы разделы Результаты, Расписание, Постановка задач. --Strijov 02:09, 15 мая 2014 (MSD) |
Этот семестр посвящен постановке вычислительных экспериментов. Результатом эксперимента является анализ свойств математической модели, получаемой в результате решения поставленной задачи машинного обучения анализа данных. Построенная модель подготавливается к эксплуатации и представляется на языке, наиболее подходящем для эксплуатации. Cоздаются эксплуатационные интерфейсы. Результатами работы являются:
- эксплуатационная документация в формате systemdoics,
- код вычислительного эксперимента и тесты,
- версия кода для эксплуатаци[1],
- доклады и презентация.
Результаты предыдущих курсов
Результаты
Автор | Тема научной работы | Ссылка | Консультант | Доклады | Буквы | Сумма | Оценка |
---|---|---|---|---|---|---|---|
Газизуллина Римма | Про | [2], pdf | |||||
Гринчук Алексей | Выб | [3], pdf | |||||
Гущин Александр | Пос | [4], pdf | |||||
Ефимова Ирина | Диф | [5], pdf | |||||
Жуков Андрей | Пос | [6], pdf | |||||
Игнатов Андрей | Обу | [7], pdf | |||||
Карасиков Михаил | Пои | [8], pdf | |||||
Кулунчаков Андрей | Обн | [9], pdf | |||||
Липатова Анна | Обн | [10], pdf | |||||
Макарова Анастасия | Исп | [11], pdf | |||||
Плавин Александр | Опт | [12], pdf | И.О. Консультанта | ||||
Попова Мария | Выб | [13], pdf | |||||
Швец Михаил | Инт | [14], pdf | |||||
Шинкевич Михаил | Вли | [15], pdf | |||||
Sk | Что | ||||||
Sk | Что | ||||||
ВШЭ | Что | ||||||
ВШЭ | Что |
Расписание (до начала курса будет уточняться)
Дата | Что сделано | Результат для обсуждения | Буква | |
---|---|---|---|---|
Сентябрь | 3 | Представление нового курса, мотивация, организация работ. Две вводные лекции для новых студентов (по возможности). | Обсудим прошлый семестр. | |
10 | Выбрана задача, рецензент. Доклад на 45 секунд о своем проекте. | Запись в ML. | ||
17 | Собрана литература, написаны комментарии. | Список литературы и мини-сообщение. | Literatura | |
24 | Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX. | Примерно страница текста. | Statement | |
Октябрь | 1 | Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные). | Описание, IDEF0. | Idef |
8 | Детализирован интерфейс, написан код первого приближения. | Код для синтетических данных. | Code | |
15 | Написаны юнит-тесты и модуль, их запускающий. | Юнит-тесты. | Unit-test | |
22 | Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. | Данные, вторая схема IDEF0, модули. | Data | |
29 | Написаны и запущены системные тесты. По результатам доработки кода написана рецензия на работу. | Тесты, рецензия. | Tests | |
Ноябрь | 5 | Код оптимизирован. | Отчет профайлера до и после. | Profiler |
12 | Сделан визуальный отчет. | Завершенный тех.отчет. | Report | |
19 | Разработан веб-интерфейс. | Код на сайте. | Web | |
26 | Сделан пользовательский интерфейс и неколько примеров использования системы. | Обсуждение результатов, доклад первой группы. | Show | |
Декабрь | 3 | Подготовлен доклад, приведены в порядок документация и код. | Доклад второй группы. | Show |
Черновик описания курса
Анализ свойств включает следующие основные элементы:
- тестирование постановки задачи и принятых (статистических) гипотез порождения данных
- анализ ошибки или анализ регрессионных остатков,
- анализ адекватности модели,
- анализ условий применимости модели,
- анализ сложности модели,
- анализ вычислительной сложности алгоритмов построения или эксплуатации модели.
Результат:
- модуль для построения модели на языке Матлаб,
- юнит-тесты модуля,
- вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
- модуль эксплуатации модели, код на языке эксплуатации (С, ++, #, Python, Java, CUDA, Ruby, VHDL, ...),
- юнит-тесты эксплуатируемой части,
- конструкторская документация в формате Systemdocs, в частности:
- мотивация проекта,
- формальная постановка задачи,
- IDEF модуля построения модели,
- IDEF модуля эксплуатации модели (если требуется),
- описание интерфейсов,
- описание системных тестов и их результатов,
- описание юнит-тестов,
- анализ производительности.
Эксплуатация модели предполагается в одном из вариантов, доступных для широкого круга пользователей:
- Модуль на Google Play / Apple Store,
- Модуль на сервере mvr.jmlda.org.
Научная статья: написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. Так как на третьем курсе мы подали ряд статей в журналы ВАК, то имеет смысл для некоторых работ обсудить формат статьи в журнал WebOfKnowledge.
Требования к слушателям: слушатели знают базовый курс лекций К.В. Воронцова и программируют на Матлабе.
Мотивация
Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом: 1) ставим задачу в формальном наиболее детализированном варианте, 2) делаем вычислительные эксперименты на Матлабе, 3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.
Сделать
Написать методические рекомендации для руководителей по планированию и проверке результатов работ.