MachineLearning:Концепция ресурса
Материал из MachineLearning.
(→Цели создания Ресурса MachineLearning.Ru) |
(→Научные направления: переставил ссылку) |
||
(9 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | {{Shortcut|ML:КР}}'''MachineLearning.Ru''' — профессиональный русскоязычный информационно-аналитический ресурс по машинному обучению и интеллектуальному анализу данных. | + | {{Shortcut|ML:КР}}'''MachineLearning.Ru''' — профессиональный русскоязычный информационно-аналитический ресурс по машинному обучению, распознаванию образов и интеллектуальному анализу данных. |
+ | {{TOCright}} | ||
== Цели создания Ресурса MachineLearning.Ru == | == Цели создания Ресурса MachineLearning.Ru == | ||
* Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]]. | * Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]]. | ||
* Способствовать обмену опытом, накоплению и распространению научных знаний в этой области. | * Способствовать обмену опытом, накоплению и распространению научных знаний в этой области. | ||
- | * Способствовать структурированию и оценке научной информации, | + | * Способствовать структурированию и оценке научной информации, выработке единой терминологии и решению других проблем, связанных с информационной разобщённостью исследователей. |
* Предоставить площадку для виртуальных научных семинаров и обсуждений. | * Предоставить площадку для виртуальных научных семинаров и обсуждений. | ||
* Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]]. | * Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]]. | ||
== Научные направления == | == Научные направления == | ||
+ | [[Машинное обучение]] (Machine Learning) — это обширный подраздел прикладной математики, находящийся на стыке [[Математическая статистика|математической статистики]], [[Методы оптимизации|оптимизации]], [[Искусственный интеллект|искусственного интеллекта]], изучающий методы построения алгоритмов, способных обучаться по эмпирическим (прецедентным) данным. | ||
+ | |||
+ | [[Интеллектуальный анализ данных]] в широком смысле слова — это совокупность концепций, подходов, методов, алгоритмов, применяемых для автоматического получения каких-либо нетривиальных выводов на основе каких-либо эмпирических данных, в том числе сигналов, изображений, текстов, и т. д. В более узком смысле ''интеллектуальный анализ данных'' можно понимать как попытку русского перевода термина Data Mining. | ||
+ | |||
+ | Некоторые '''[[:Категория:Научные направления|научные направления]]''' Ресурса имеют значительные пересечения с [[Машинное обучение|машинным обучением]], но не является его частью. | ||
+ | Например, [[:Категория:Прикладная статистика|прикладная статистика]] с одной стороны существенно шире машинного обучения, с другой стороны существуют и не-статистические подходы к обучению. | ||
+ | [[:Категория:Распознавание образов|Распознавание образов]], | ||
+ | [[:Категория:Анализ изображений|анализ изображений]], | ||
+ | [[:Категория:Компьютерное зрение|компьютерное зрение]], | ||
+ | [[:Категория:Обработка и анализ текстов|обработка и анализ текстов]] | ||
+ | активно используют методы [[машинное обучение|машинного обучения]] в качестве инструментария, но имеют также массу собственных подходов, методов, алгоритмов, которые не принято рассматривать в рамках Machine Learning. | ||
+ | Эти и другие научные направления можно относить к [[Интеллектуальный анализ данных|интеллектуальному анализу данных]] в широком смысле. Они несомненно также попадают в сферу научных интересов Ресурса MachineLearning.Ru. | ||
+ | |||
Ниже приводится примерный перечень направлений. | Ниже приводится примерный перечень направлений. | ||
- | Тематическая иерархия Ресурса начинается в корневой категории [[:Категория:Научные направления| | + | Тематическая иерархия Ресурса начинается в корневой категории '''[[:Категория:Научные направления|Научные направления]]''' и постоянно уточняется участниками проекта. |
* [[:Категория:Машинное обучение|Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам: | * [[:Категория:Машинное обучение|Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам: | ||
** [[:Категория:Классификация|классификация]] (classification); | ** [[:Категория:Классификация|классификация]] (classification); | ||
- | ** [[ | + | ** [[кластеризация]] (clustering); |
** [[:Категория:Регрессионный анализ|регрессия]] (regression); | ** [[:Категория:Регрессионный анализ|регрессия]] (regression); | ||
** [[:Категория:Прогнозирование|прогнозирование]] (forecasting). | ** [[:Категория:Прогнозирование|прогнозирование]] (forecasting). | ||
+ | |||
+ | * [[:Категория:Распознавание образов|Распознавание образов]]: | ||
+ | ** [[:Категория:Анализ изображений|анализ]], [[:Категория:Распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding); | ||
+ | ** [[:Категория:Компьютерное зрение|компьютерное зрение]] (computer vision); | ||
+ | ** [[анализ речи|анализ]], [[распознавание речи|распознавание]] и [[понимание речи|понимание]] речи (speach analysis, recognition & understanding); | ||
* [[:Категория:Интеллектуальный анализ данных|Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам: | * [[:Категория:Интеллектуальный анализ данных|Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам: | ||
** [[добыча знаний]] (knowledge discovery in databases); | ** [[добыча знаний]] (knowledge discovery in databases); | ||
- | ** [[анализ | + | ** [[:Категория:Обработка и анализ текстов|обработка и анализ текстов]], [[понимание текстов]] (text mining); |
- | + | ** [[:Категория:Анализ веба|анализ информации в сети Интернет]] (web mining). | |
- | + | ||
- | + | ||
- | ** [[ | + | |
* [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам: | * [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам: | ||
** [[:Категория:Прикладная статистика|прикладная статистика]] (applied statistics); | ** [[:Категория:Прикладная статистика|прикладная статистика]] (applied statistics); | ||
** [[:Категория:Обработка сигналов|обработка сигналов]] (signal processing); | ** [[:Категория:Обработка сигналов|обработка сигналов]] (signal processing); | ||
- | ** [[ | + | ** [[:Категория:Обработка изображений|обработка]] и [[:Категория:Синтез изображений|синтез]] изображений (image analysis & synthesis); |
- | ** [[поиск информации]] (information retrieval). | + | ** [[:Категория:Поиск информации|поиск информации]] (information retrieval). |
- | * [[:Категория:Прикладные | + | * [[:Категория:Прикладные исследования|Прикладные задачи]] и [[:Категория:Прикладные системы анализа данных|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях: |
** [[:Категория:приложения в биоинформатике|приложения в биоинформатике]]; | ** [[:Категория:приложения в биоинформатике|приложения в биоинформатике]]; | ||
** [[:Категория:приложения в медицине|приложения в медицине]]; | ** [[:Категория:приложения в медицине|приложения в медицине]]; | ||
Строка 50: | Строка 66: | ||
=== Соблюдение тематики === | === Соблюдение тематики === | ||
* Ресурс не претендует на охват всей прикладной математики и, тем более, всей науки (есть пример проекта с противоположной концепцией — [http://ru.science.wikia.com Викинаука]). | * Ресурс не претендует на охват всей прикладной математики и, тем более, всей науки (есть пример проекта с противоположной концепцией — [http://ru.science.wikia.com Викинаука]). | ||
- | * Статьи по смежным областям знания допускаются | + | * Статьи по смежным областям знания допускаются в контексте их связи с [[:Категория:Научные направления|основной тематикой]] Ресурса. |
* В рамках основной тематики Ресурса категоризация областей и направлений может свободно изменяться участниками проекта, отражая текущие тенденции и приоритеты. | * В рамках основной тематики Ресурса категоризация областей и направлений может свободно изменяться участниками проекта, отражая текущие тенденции и приоритеты. | ||
Строка 86: | Строка 102: | ||
** [[:Категория:Публикации|публикации]] — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётов {{S|и т. д.}}; | ** [[:Категория:Публикации|публикации]] — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётов {{S|и т. д.}}; | ||
** [[:Категория:Конкурсы|конкурсы]] — открытые конкурсы по решению задач интеллекуального анализа данных; | ** [[:Категория:Конкурсы|конкурсы]] — открытые конкурсы по решению задач интеллекуального анализа данных; | ||
- | |||
** [[:Категория:Страницы участников|страницы участников]] — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах. | ** [[:Категория:Страницы участников|страницы участников]] — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах. | ||
+ | |||
+ | * [[MachineLearning:Учебный процесс|Использование Ресурса в учебном процессе]]: | ||
+ | ** [[:Категория:Учебные курсы|учебные курсы]]; | ||
+ | ** [[:Категория:Учебные материалы|учебные материалы]]; | ||
+ | ** [[:Категория:Рекомендации для студентов|рекомендации для студентов и аспирантов]]; | ||
+ | ** [[:Категория:Учебные задачи|коллекция учебных задач]]; | ||
+ | ** возможна (и поощряется) совместная работа преподавателей и студентов над содержимым учебных материалов; | ||
* Значительная часть работы учёного может вестись на страницах Ресурса: | * Значительная часть работы учёного может вестись на страницах Ресурса: | ||
Строка 100: | Строка 122: | ||
** контроль за выполнением студенческих работ. | ** контроль за выполнением студенческих работ. | ||
- | * Образно говоря, ''MachineLearning.Ru'' — это инструмент для огранизации научной работы, совмещающий в себе энциклопедию, научную конференцию, учебный семинар и блокнот для черновых записей. | + | * Образно говоря, ''MachineLearning.Ru'' — это инструмент для огранизации научной работы, совмещающий в себе энциклопедию, научную конференцию, учебный семинар и блокнот для черновых записей. |
== Перспективы == | == Перспективы == | ||
Строка 112: | Строка 134: | ||
== История == | == История == | ||
* '''2007, 3 октября.''' Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции [[ММРО|ММРО-13]]. | * '''2007, 3 октября.''' Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции [[ММРО|ММРО-13]]. | ||
- | * '''2008, | + | * '''2008, 1 января.''' Ресурс открыт для общего доступа и подготовлен к массовому наполнению. |
+ | * '''2008, 13 июня.''' Ресурс представлен на международной конференции [[Интеллектуализация обработки информации (конференция)|Интеллектуализация обработки информации 2008]]. | ||
- | [[Новости|Полный архив новостей]] Ресурса MachineLearning.Ru. | + | [[Шаблон:Новости|Полный архив новостей]] Ресурса MachineLearning.Ru. |
== Адреса == | == Адреса == | ||
Строка 121: | Строка 144: | ||
[http://recognition.su recognition.su]. | [http://recognition.su recognition.su]. | ||
- | [[Категория:MachineLearning|Концепция ресурса]] | + | [[Категория:MachineLearning:Руководства|Концепция ресурса]] |
Текущая версия
MachineLearning.Ru — профессиональный русскоязычный информационно-аналитический ресурс по машинному обучению, распознаванию образов и интеллектуальному анализу данных.
|
Цели создания Ресурса MachineLearning.Ru
- Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области машинного обучения и интеллектуального анализа данных.
- Способствовать обмену опытом, накоплению и распространению научных знаний в этой области.
- Способствовать структурированию и оценке научной информации, выработке единой терминологии и решению других проблем, связанных с информационной разобщённостью исследователей.
- Предоставить площадку для виртуальных научных семинаров и обсуждений.
- Предоставить доступ к распределенной системе тестирования алгоритмов классификации и прогнозирования.
Научные направления
Машинное обучение (Machine Learning) — это обширный подраздел прикладной математики, находящийся на стыке математической статистики, оптимизации, искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться по эмпирическим (прецедентным) данным.
Интеллектуальный анализ данных в широком смысле слова — это совокупность концепций, подходов, методов, алгоритмов, применяемых для автоматического получения каких-либо нетривиальных выводов на основе каких-либо эмпирических данных, в том числе сигналов, изображений, текстов, и т. д. В более узком смысле интеллектуальный анализ данных можно понимать как попытку русского перевода термина Data Mining.
Некоторые научные направления Ресурса имеют значительные пересечения с машинным обучением, но не является его частью. Например, прикладная статистика с одной стороны существенно шире машинного обучения, с другой стороны существуют и не-статистические подходы к обучению. Распознавание образов, анализ изображений, компьютерное зрение, обработка и анализ текстов активно используют методы машинного обучения в качестве инструментария, но имеют также массу собственных подходов, методов, алгоритмов, которые не принято рассматривать в рамках Machine Learning. Эти и другие научные направления можно относить к интеллектуальному анализу данных в широком смысле. Они несомненно также попадают в сферу научных интересов Ресурса MachineLearning.Ru.
Ниже приводится примерный перечень направлений. Тематическая иерархия Ресурса начинается в корневой категории Научные направления и постоянно уточняется участниками проекта.
- Машинное обучение (machine learning) — теория, подходы и методы обучения по прецедентам:
- классификация (classification);
- кластеризация (clustering);
- регрессия (regression);
- прогнозирование (forecasting).
- Распознавание образов:
- анализ, распознавание и понимание изображений (image analysis, recognition & understanding);
- компьютерное зрение (computer vision);
- анализ, распознавание и понимание речи (speach analysis, recognition & understanding);
- Интеллектуальный анализ данных (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам:
- добыча знаний (knowledge discovery in databases);
- обработка и анализ текстов, понимание текстов (text mining);
- анализ информации в сети Интернет (web mining).
- Анализ данных — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам:
- прикладная статистика (applied statistics);
- обработка сигналов (signal processing);
- обработка и синтез изображений (image analysis & synthesis);
- поиск информации (information retrieval).
- Прикладные задачи и системы анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях:
Для кого предназначен Ресурс
Аудитория Ресурса — русскоязычная, включающая следующие уровни:
- Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
- Эксперты в прикладных областях. Для них публикуется энциклопедия анализа данных, рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач.
- Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе, производстве и других сферах.
- Студенты, аспиранты, преподаватели, использующие Ресурс в образовательных целях.
Принципы построения Ресурса
Соблюдение тематики
- Ресурс не претендует на охват всей прикладной математики и, тем более, всей науки (есть пример проекта с противоположной концепцией — Викинаука).
- Статьи по смежным областям знания допускаются в контексте их связи с основной тематикой Ресурса.
- В рамках основной тематики Ресурса категоризация областей и направлений может свободно изменяться участниками проекта, отражая текущие тенденции и приоритеты.
Открытость
- Содержимое Ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением GNU FDL.
- Создатели Ресурса (научная школа академика РАН Ю. И. Журавлёва и чл.-корр. РАН К. В. Рудакова) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.
Сходство с Википедией
Ресурс строится по принципам Википедии — свободной энциклопедии и обладает всеми её основными возможностями и преимуществами:
- каждый пользователь ресурса может создать или изменить страницу (статью) или раздел (категорию) в любое время, в любом месте, располагая только доступом в Интернет;
- любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру Ресурса;
- история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
- с каждой статьёй связана страница обсуждения;
Отличия от Википедии
Имеются концептуальные отличия от Википедии, из-за которых данный Ресурс не может быть частью Википедии:
- тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
- Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
- статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ;
- любой участник Википедии имеет право модифицировать личные страницы других участников — здесь эта возможность запрещена.
Имеющиеся отличия не исключают возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.
Создание пространства для совместной работы
- С технической точки зрения MediaWiki даёт только одну ключевую возможность — совместно править страницы Ресурса. Однако использовать её можно не только для создания общедоступной энциклопедии, но и для организации совместной работы научных групп, обмена информацией по текущим исследованиям, поиска и привлечения новых заинтересованных участников в свои проекты.
- Основные категории Ресурса, поддерживающие создание энциклопедии:
- энциклопедия анализа данных — терминологические, популярные и обзорные статьи;
- инструменты и технологии — статьи по инструментальным средствам для автоматизации научной деятельности и решения задач анализа данных;
- теоретические и прикладные исследования — статьи об оригинальных исследованиях.
- Основные категории Ресурса (см. полный перечень), поддерживающие различные формы научного общения:
- научные конференции — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций;
- виртуальные семинары — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям;
- публикации — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётов и т. д.;
- конкурсы — открытые конкурсы по решению задач интеллекуального анализа данных;
- страницы участников — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах.
- Использование Ресурса в учебном процессе:
- учебные курсы;
- учебные материалы;
- рекомендации для студентов и аспирантов;
- коллекция учебных задач;
- возможна (и поощряется) совместная работа преподавателей и студентов над содержимым учебных материалов;
- Значительная часть работы учёного может вестись на страницах Ресурса:
- поиск научной информации и новых идей;
- установление научных контактов, образование научных сообществ;
- работа с литературой, коллекционирование ссылок, реферирование и обсуждение статей;
- совместное ведение черновых записей;
- документирование и обсуждение результатов текущих исследований;
- проведение семинаров и дискуссий с коллегами, находящимися как в других городах, так и в соседней комнате;
- обмен исходными кодами программ и алгоритмов;
- размещение в широком доступе учебных материалов: лекций, заданий, практикумов;
- контроль за выполнением студенческих работ.
- Образно говоря, MachineLearning.Ru — это инструмент для огранизации научной работы, совмещающий в себе энциклопедию, научную конференцию, учебный семинар и блокнот для черновых записей.
Перспективы
- Благодаря Ресурсу научное знание становится общедоступным практически в момент его появления.
- Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области машинного обучения и интеллектуального анализа данных.
- Значительная часть рабочего времени учёного может проходить на страницах Ресурса. Здесь можно жить — читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, Ресурс должен быть, во-первых, наполнен полезной информацией, во-вторых, популярен и признан научной общественностью. Второе без первого невозможно, а первое без второго неэффективно. Становление такого Ресурса — постепенный (итерационный) процесс.
Поддержка проекта
Создание и развитие Ресурса MachineLearning.Ru поддержано Российским фондом фундаментальных исследований (проект № 07-07-00372) и компанией Forecsys.
История
- 2007, 3 октября. Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции ММРО-13.
- 2008, 1 января. Ресурс открыт для общего доступа и подготовлен к массовому наполнению.
- 2008, 13 июня. Ресурс представлен на международной конференции Интеллектуализация обработки информации 2008.
Полный архив новостей Ресурса MachineLearning.Ru.
Адреса
Ресурс MachineLearning.Ru доступен по адресам www.machinelearning.ru и recognition.su.