Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 974, весна 2014

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Результаты)
(Результаты)
Строка 45: Строка 45:
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group974/Stenin2014Scoring/Stenin2014reportGeneration.pdf?format=raw]
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group974/Stenin2014Scoring/Stenin2014reportGeneration.pdf?format=raw]
|Методы решения задачи
|Методы решения задачи
-
|Основной раздел
+
|[http://www.google.ru/url?q=http://www.mathworks.com/matlabcentral/fileexchange/2529-matlab-programming-style-guidelines&sa=U&ei=3EtNU7bLAqf_ygOEwoGwDA&ved=0CB0QFjAA&sig2=tTQ8RY8YCPl7_8MJZFtptg&usg=AFQjCNHw8QipPeSqepbnxMDc2PQOa6Rdnw]
|Анализ ошибки, генерация отчета
|Анализ ошибки, генерация отчета
|P?
|P?

Версия 15:14, 15 апреля 2014


Курс "Программная инженения", лектор Л.Е. Карпов

  • Цель проекта: создать удобный документ описания систем (алгоритмов) построения и тестирования прогностических моделей.
  • Содержательная тема проекта: скоринговая система для моделирования социологических данных.


Результаты

Автор Роль технолога Роль руководителя Постановка задачи Введение Технологическая карта Программный модуль Буквы Оценка
Александра Кудряшова Контроль за данными Определение типа данных для каждого признака, преобразование типов данных [1] Раздел Введения Основной раздел Программный модуль 0
Александр Адуенко Контроль интерфейсов Выбор модели, построение мультимодели [2] Раздел Введения Основной раздел Программный модуль 0
Сергей Стенин Контроль стиля Анализ ошибки, генерация отчета [3] Методы решения задачи [4] Анализ ошибки, генерация отчета P?
Влада Целых Юнит-тестирование Вычисление и минимизация ошибки (N-fold CV) [5] Раздел Введения Основной раздел Программный модуль 0
Мария Стенина Системное тестироваие Группировка признаков, выбор признаков [6] Качество, системные требования Системное тестирование Программный модуль P
Арсентий Кузьмин Профилирование Порождение признаков (вычисление статистик, построение словарей) [7] Раздел Введения Основной раздел Программный модуль 0
Владимир Жуйков Сбор конструкторской документации Заполнение пропусков [8] Раздел Введения Основной раздел Программный модуль 0

Расписание

Дата ДЗ Что делаем Результат для обсуждения Код
Апрель 2 1 Выбрать роль руководителя и роль технолога; записть в таблицу. Написать формальну постановку содержательной задачи. Постановка задачи в формате эссе. Problem statement
9 \emptyset Прочитать версию документа Systemdocs. Просмотреть примеры его заполнения в проектах mvr.jmlda.org. Обсуждение формата документа, распределение работ по технологическим ролям. --
16 2 Прочитать вводный учебник Siddiqi по скорингу. Заполнить раздел Введения и основной раздел согласно роли технолога. Заполненные разделы согласно роли технолога. (На лекции обсуждаем заполненный документ, способы юнит-тестирования, системного тестирования'; если кто-то хочет выступить по своей технологической карте - ставим Talk). Document, Talk
23 3 Собрать работающую систему согласно роли руководителя. Проверить Поставить вычислительный эксперимент на основе предлагаемого алгоритма с учетом предыдущих результатов. Код, юнит-тесты, системные тесты. Code
30 4 Доработка документа и системы согласно плану составленному на обсуждении. Доработанные части документа и системы, персонально и в синхронизации. Personal, Syncro


Предыстория

Часть А

1. Объявляется формирование команды для выполнения коллективного проекта в рамках курса Л.Е. Карпова "Программная инженерия". Предложение о включение в состав команды действует ближайшие дни, до выходных. Оценка по курсу связана с выполнением проекта, сдача курса вне проекта не предполагается. Сам способ выставления оценки за курс определяет Леонид Евгеньевич (задавайте ему вопросы, это вне моей компетенции).

2. Проект называется "Скоринговая система для моделирования социологических данных". Цель проекта - создание комплекта документации, необходимого для построения системы.

3. Требование к системе: по заданной выборке "объекты-признаки в разнородных шкалах", двух или многоклассовой, построить прогностическую модель и автоматически сгенерировать отчет о вычислительном эксперименте, содержащий анализ ошибок.

4. Требования к документации: определяются Леонидом Евгеньевичем на следующей лекции. (До настоящего времени документация выполнялась в формате systemdocs).

5. Сейчас до выходных определяются следующие множества: 1) список участников; каждый участник является руководителем и технологом, 2) список работ, которые выполняются руководителями, 3) список технологий, которые выполняются технологами. Этот список формируется тут.

6. График работ Домашнее задание-A на второе апреля. Написать постановку задачи выбранного модуля в формате argmin. Список обозначений тут. Домашнее задание-B на девятое апреля. Написать документацию выбранного технологического шага в формате "Программная инженерия". Примеры обсуждаются с Леонидом Евгеньевичем. Домашнее задание-С на шестнадцатое апреля. Написать саму систему. Запустить, чтобы генерировала отчет. Домашнее задание-D на двадцать третье апреля (его нужно избежать). Запустить систему, синхронизировав работы руководителей и технологов.

7. Сейчас требуется подтвердить участие в этом проекте и выбрать пару "Работа-технология". Четвертый курс МФТИ может предложение игнорировать. Сколково - по желанию. Текущий состав Александр Адуенко, Владимир Жуйков, Александра Кудряшова, Арсентий Кузьмин, Мария Стенина, Сергей Стенин, Влада Целых

Часть B

Домашнее задание-B на девятое апреля. "Написать документацию выбранного технологического шага в формате Программная инженерия" сдвигается на неделю дальше.

За грядущую неделю требуется: 1) внимательно изучить файл системдокс. Примеры в папке группы 074. Шаблон в папке Kuznetsov2014SSA, 2) файл с форматом, который вам пришлет Леонид Евгеньевич.

Локальная цель: улучшить структуру файла системдокс, сделать этот формат простым, полным, непротиворечивым (определить формат "Программная инженерия"). Глобальная цель: получить такое описание системы, которое бы уменьшало трудозатраты на ее разработку (назначение системы в нашем случае - построение и тестирование прогностической модели).

На следующей лекции предлагается обсудить: 1) формат описания системы (построения моделей) в целом и по разделам, 2) состав системы по блокам в формате UML или IDEF, 3) пересмотреть состав технологических работ и связать технологии с разделами документации, 4) пересмотреть кто за какие технологические работы отвечает и в каком объеме выполняет, 5) скорректировать и утвердить список домашних заданий, 6) определить как будут оцениваться результаты.

Часть С

Часть D

Ссылка на таблицу синхронизации [9].

Личные инструменты