Преподавание машинного обучения

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Курсы)
Строка 1: Строка 1:
-
Данный [[:Категория:Виртуальные семинары|виртуальный семинар]] предназначен для обсуждения методических вопросов, связанных с преподаванием машинного обучения и смежных дисциплин в российских вузах.
+
{{TOCright}}
 +
Данный [[:Категория:Виртуальные семинары|виртуальный семинар]] предназначен для обсуждения методических вопросов, связанных с преподаванием [[Машинное обучение|машинного обучения]] и смежных дисциплин в российских вузах.
-
== Обсуждаемые вопросы ==
+
На данную страницу выносятся основные положения, результаты дискуссии и прочая хорошо структурированная информация.
-
* варианты преподавания (математический курс или инженерный курс)
+
Споры, как обычно, ведутся в [[Обсуждение:Преподавание машинного обучения|обсуждении]].
-
* методика преподавания (электронные слайды, практикумы, задачи, вопросы для контроля знаний)
+
-
* удачные методические приёмы
+
-
* доступные материалы курсов (англоязычные/русскоязычные), примеры удачных курсов
+
-
* книги, которые можно выбрать за «скелет» курса
+
-
* терминология
+
-
* материал из других курсов, необходимый для понимания
+
-
== Литература ==
+
Поскольку это семинар, на основной странице также можно высказывать личные мнения;
 +
желательно сопровождать их подписью участника.
 +
 
 +
== Машинное обучение — математический или инженерный курс? ==
 +
 
 +
Согласно международным рекомендациям по преподаванию информатики в университетах
 +
ACM/IEEE Computing Curricula 2001
 +
[[информатика]] (computer science)
 +
подразделяется на 14 областей, одна из которых —
 +
[[интеллектуальные системы]] (intelligent systems).
 +
Эта область, в свою очередь, имеет 10 разделов, один из них —
 +
'''машинное обучение и нейронные сети''' (machine learning and neural networks).
 +
Для непрофильных специальностей этот курс считается факультативным.
 +
 
 +
Типовые программы этого курса рассчитаны на расширение кругозора будущих IT-специалистов и, мягко говоря, поверхностны.
 +
Они ни в коей мере не рассчитаны на будущего научного работника или разработчика новых методов машинного обучения.
 +
Они лишь дают представление о том,
 +
какие задачи возникают на практике,
 +
какими методами их можно решать,
 +
в чём их основные принципы,
 +
какие существуют инструментальные средства,
 +
иногда — какие подводные камни ждут будущего BI-аналитика.
 +
Далеко не все методы освещаются.
 +
Теория вообще не рассматривается.
 +
 
 +
'''Вопрос:''' стоит ли ориентироваться на этот международный стандарт?
 +
 
 +
Стандарт оставляет большую свободу творчества преподавателю.
 +
Формально оставшись в рамках стандарта, можно сделать и полную профанацию, и удачный курс для инженеров, показывающий нетривиальные примеры реальных задач, процесс их решения, владение стандартным инструментарием.
 +
Заодно можно зацепить и кучу действительно глубоких вопросов, используя реальные задачи в качестве мотивации.
 +
Однако для преподавателя это на порядок сложнее.
 +
 
 +
'''Математический курс''' нужен узкому кругу специалистов, которые предположительно будут заниматься разработкой новых методов и решением принципиально новых задач. Потребность в таких специалистах — около 5%. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')
 +
 
 +
'''Инженерный курс''' нужен широкому кругу специалистов, которые предположительно будут заниматься применением стандартных методов для решения более-менее типичных задач. Он также нужен будущим IT-руководителям, которые обязаны не только знать о возможностях современных методов анализа данных, но и уметь доносить своё понимание до лиц, принимающих решения. Потребность в таких специалистах — около 95%. Кстати, без этих 95% инженеров те 5% математиков вообще не имеют шансов найти работу по специальности. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')
 +
 
 +
Курсов машинного обучения «для инженеров» в мире очень много.
 +
Математических курсов очень мало, и они очень разные; каждый несёт на себе отпечаток конкретной школы.
 +
Обычно это курсы на кафедрах соотвествующего профиля.
 +
 
 +
== Методика преподавания ==
 +
 
 +
Предлагается обсуждать удачный и неудачный опыт.
 +
* насколько повышается эффективность преподавания при использовании слайдов?
 +
* используются ли наряду со слайдами раздаточные материалы?
 +
* как строятся практикумы?
 +
* какие задачи и вопросы даются для контроля знаний?
 +
 
 +
== Некоторые удачные методические приёмы ==
 +
Предлагается пополнять коллекцию.
 +
 
 +
* В начале курса посвятить одну лекцию описанию примеров разнообразных прикладных задач «из жизни». (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')
 +
* В конце курса (например, на консультации перед экзаменом) нарисовать «карту курса», где показать взаимосвязи и сходства между различными методами. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')
 +
* Рассказав метод, в явном виде перечислить его достоинства и недостатки; затем рассказать о путях устранения недостатков. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')
 +
 
 +
== Терминология ==
 +
Предлагается обсуждать список терминов, которые либо не понятно, как переводить на русский, либо «де факто» они уже переведены разными авторами по-разному, и необходимо приходить к единству.
 +
 
 +
Возможно, для этого обсуждения надо завести отдельную страницу...
 +
 
 +
* Business-intelligence — интеллектуальные бизнес-системы или бизнес-интеллект?
 +
* Data mining — [[интеллектуальный анализ данных]]
 +
* Optimal brain damage — ?
 +
* Optimal brain surgery — [[оптимальное прореживание нейронных сетей]]
 +
* Shatter coeffiсient — [[коэффициент разнообразия]]
 +
* Target function — [[целевая зависимость]] или [[восстанавливаемая зависимость]]? [[Целевая функция]] вызывает ненужные ассоциации с оптимизируемым функционалом.
 +
 
 +
== Книги, которые можно выбрать за «скелет» курса ==
# {{П:Hastie 2001 The Elements of Statistical Learning}}
# {{П:Hastie 2001 The Elements of Statistical Learning}}
 +
 +
== Дополнительная литература ==
# {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}}
# {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}}
# {{П:Журавлёв 2006 Распознавание}}
# {{П:Журавлёв 2006 Распознавание}}
== Курсы ==
== Курсы ==
 +
* [http://courses.csail.mit.edu/6.867/lectures.html Machine Learning (Fall 2007)] [http://people.csail.mit.edu/tommi Prof. Tommi Jaakkola], MIT.
 +
* [https://www.seas.upenn.edu/~cis520/schedule.html Machine Learning (Fall 2007)] Prof. Lyle Ungar, University of Pennsylvania - School of Engineering & Applied Science.
* [[Машинное обучение (курс лекций, К.В.Воронцов)]]
* [[Машинное обучение (курс лекций, К.В.Воронцов)]]
* [[Машинное обучение (курс лекций, Н.Ю.Золотых)]]
* [[Машинное обучение (курс лекций, Н.Ю.Золотых)]]
* [[Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)]]
* [[Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)]]
 +
{{stub}}
{{stub}}
 +
[[Категория:Виртуальные семинары]]
[[Категория:Виртуальные семинары]]
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Версия 18:33, 10 июля 2008

Содержание

Данный виртуальный семинар предназначен для обсуждения методических вопросов, связанных с преподаванием машинного обучения и смежных дисциплин в российских вузах.

На данную страницу выносятся основные положения, результаты дискуссии и прочая хорошо структурированная информация. Споры, как обычно, ведутся в обсуждении.

Поскольку это семинар, на основной странице также можно высказывать личные мнения; желательно сопровождать их подписью участника.

Машинное обучение — математический или инженерный курс?

Согласно международным рекомендациям по преподаванию информатики в университетах ACM/IEEE Computing Curricula 2001 информатика (computer science) подразделяется на 14 областей, одна из которых — интеллектуальные системы (intelligent systems). Эта область, в свою очередь, имеет 10 разделов, один из них — машинное обучение и нейронные сети (machine learning and neural networks). Для непрофильных специальностей этот курс считается факультативным.

Типовые программы этого курса рассчитаны на расширение кругозора будущих IT-специалистов и, мягко говоря, поверхностны. Они ни в коей мере не рассчитаны на будущего научного работника или разработчика новых методов машинного обучения. Они лишь дают представление о том, какие задачи возникают на практике, какими методами их можно решать, в чём их основные принципы, какие существуют инструментальные средства, иногда — какие подводные камни ждут будущего BI-аналитика. Далеко не все методы освещаются. Теория вообще не рассматривается.

Вопрос: стоит ли ориентироваться на этот международный стандарт?

Стандарт оставляет большую свободу творчества преподавателю. Формально оставшись в рамках стандарта, можно сделать и полную профанацию, и удачный курс для инженеров, показывающий нетривиальные примеры реальных задач, процесс их решения, владение стандартным инструментарием. Заодно можно зацепить и кучу действительно глубоких вопросов, используя реальные задачи в качестве мотивации. Однако для преподавателя это на порядок сложнее.

Математический курс нужен узкому кругу специалистов, которые предположительно будут заниматься разработкой новых методов и решением принципиально новых задач. Потребность в таких специалистах — около 5%. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))

Инженерный курс нужен широкому кругу специалистов, которые предположительно будут заниматься применением стандартных методов для решения более-менее типичных задач. Он также нужен будущим IT-руководителям, которые обязаны не только знать о возможностях современных методов анализа данных, но и уметь доносить своё понимание до лиц, принимающих решения. Потребность в таких специалистах — около 95%. Кстати, без этих 95% инженеров те 5% математиков вообще не имеют шансов найти работу по специальности. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))

Курсов машинного обучения «для инженеров» в мире очень много. Математических курсов очень мало, и они очень разные; каждый несёт на себе отпечаток конкретной школы. Обычно это курсы на кафедрах соотвествующего профиля.

Методика преподавания

Предлагается обсуждать удачный и неудачный опыт.

  • насколько повышается эффективность преподавания при использовании слайдов?
  • используются ли наряду со слайдами раздаточные материалы?
  • как строятся практикумы?
  • какие задачи и вопросы даются для контроля знаний?

Некоторые удачные методические приёмы

Предлагается пополнять коллекцию.

  • В начале курса посвятить одну лекцию описанию примеров разнообразных прикладных задач «из жизни». (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
  • В конце курса (например, на консультации перед экзаменом) нарисовать «карту курса», где показать взаимосвязи и сходства между различными методами. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
  • Рассказав метод, в явном виде перечислить его достоинства и недостатки; затем рассказать о путях устранения недостатков. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))

Терминология

Предлагается обсуждать список терминов, которые либо не понятно, как переводить на русский, либо «де факто» они уже переведены разными авторами по-разному, и необходимо приходить к единству.

Возможно, для этого обсуждения надо завести отдельную страницу...

Книги, которые можно выбрать за «скелет» курса

  1. Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning, 2nd edition. — Springer, 2009. — 533 p.  (подробнее)

Дополнительная литература

  1. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. — 270 с. — ISBN 5-86134-060-9  (подробнее)
  2. Журавлёв, Ю. И., Рязанов, В. В., Сенько, О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: ФАЗИС, 2006. — 176 с.  (подробнее)

Курсы

Личные инструменты