MachineLearning:Концепция ресурса
Материал из MachineLearning.
м |
|||
Строка 2: | Строка 2: | ||
== Цели создания Ресурса MachineLearning.Ru == | == Цели создания Ресурса MachineLearning.Ru == | ||
- | * Сконцентрировать информацию о достижениях | + | * Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]]. |
* Способствовать обмену опытом, накоплению и распространению научных знаний в этой области. | * Способствовать обмену опытом, накоплению и распространению научных знаний в этой области. | ||
* Предоставить площадку для виртуальных научных семинаров и обсуждений. | * Предоставить площадку для виртуальных научных семинаров и обсуждений. | ||
* Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]]. | * Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]]. | ||
- | |||
== Научные направления == | == Научные направления == | ||
- | * [[Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам: | + | * [[:Категория:Машинное обучение|Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам: |
- | ** [[классификация]] (classification); | + | ** [[:Категория:Классификация|классификация]] (classification); |
- | ** [[кластеризация]] (clustering); | + | ** [[:Категория:Кластеризация|кластеризация]] (clustering); |
- | ** [[Регрессионный анализ|регрессия]] (regression); | + | ** [[:Категория:Регрессионный анализ|регрессия]] (regression); |
- | ** [[прогнозирование]] (forecasting). | + | ** [[:Категория:Прогнозирование|прогнозирование]] (forecasting). |
- | * [[Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам: | + | * [[:Категория:Интеллектуальный анализ данных|Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам: |
** [[добыча знаний]] (knowledge discovery in databases); | ** [[добыча знаний]] (knowledge discovery in databases); | ||
** [[анализ изображений|анализ]], [[распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding); | ** [[анализ изображений|анализ]], [[распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding); | ||
Строка 24: | Строка 23: | ||
* [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам: | * [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам: | ||
- | ** [[прикладная статистика]] (applied statistics); | + | ** [[:Категория:Прикладная статистика|прикладная статистика]] (applied statistics); |
- | ** [[обработка сигналов]] (signal processing); | + | ** [[:Категория:Обработка сигналов|обработка сигналов]] (signal processing); |
** [[обработка изображений|обработка]] и [[синтез изображений|синтез]] изображений (image analysis & synthesis); | ** [[обработка изображений|обработка]] и [[синтез изображений|синтез]] изображений (image analysis & synthesis); | ||
** [[поиск информации]] (information retrieval). | ** [[поиск информации]] (information retrieval). | ||
- | * [[Прикладные задачи]] и [[Прикладные системы|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях: | + | * [[:Категория:Прикладные задачи анализа данных|Прикладные задачи]] и [[:Категория:Прикладные системы анализа данных|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях: |
** [[:Категория:приложения в биоинформатике|приложения в биоинформатике]]; | ** [[:Категория:приложения в биоинформатике|приложения в биоинформатике]]; | ||
** [[:Категория:приложения в медицине|приложения в медицине]]; | ** [[:Категория:приложения в медицине|приложения в медицине]]; | ||
Строка 36: | Строка 35: | ||
** [[:Категория:приложения в технике|приложения в технике]]. | ** [[:Категория:приложения в технике|приложения в технике]]. | ||
- | + | Выше приведён примерный список направлений. | |
+ | Тематическая иерархия Ресурса начинается в корневой категории [[:Категория:Научные направления|научные направления]] и будет постоянно уточняться всеми участниками проекта. | ||
== Для кого предназначен Ресурс == | == Для кого предназначен Ресурс == | ||
- | Аудитория | + | Аудитория Ресурса — русскоязычная, включающая следующие уровни: |
* Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний. | * Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний. | ||
- | * Эксперты в прикладных областях. Для них публикуется [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]], рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач. | + | * Эксперты в прикладных областях. Для них публикуется [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]], рекомендации по практическому применению методов анализа данных, примеры решённых [[:Категория:Прикладные исследования|прикладных задач]]. |
- | * Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе. | + | * Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе, производстве и других сферах. |
- | * Студенты, аспиранты, преподаватели, использующие | + | * Студенты, аспиранты, преподаватели, использующие Ресурс в образовательных целях. |
== Принципы построения Ресурса == | == Принципы построения Ресурса == | ||
=== Открытость === | === Открытость === | ||
- | * Содержимое | + | * Содержимое Ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением [http://ru.wikipedia.org/wiki/FDL GNU FDL]. |
* Создатели Ресурса (научная школа академика РАН [[Журавлёв, Юрий Иванович|{{S|Ю. И. Журавлёва}}]] и чл.-корр. РАН [[Рудаков, Константин Владимирович|К. В. Рудакова]]) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом. | * Создатели Ресурса (научная школа академика РАН [[Журавлёв, Юрий Иванович|{{S|Ю. И. Журавлёва}}]] и чл.-корр. РАН [[Рудаков, Константин Владимирович|К. В. Рудакова]]) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом. | ||
Строка 54: | Строка 54: | ||
Ресурс строится по принципам [http://ru.wikipedia.org Википедии — свободной энциклопедии] и обладает всеми её основными возможностями и преимуществами: | Ресурс строится по принципам [http://ru.wikipedia.org Википедии — свободной энциклопедии] и обладает всеми её основными возможностями и преимуществами: | ||
* каждый пользователь ресурса может создать или изменить страницу (статью) или [[MachineLearning:Категоризация|раздел (категорию)]] в любое время, в любом месте, располагая только доступом в Интернет; | * каждый пользователь ресурса может создать или изменить страницу (статью) или [[MachineLearning:Категоризация|раздел (категорию)]] в любое время, в любом месте, располагая только доступом в Интернет; | ||
- | * любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру | + | * любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру Ресурса; |
* история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить; | * история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить; | ||
* с каждой статьёй связана страница обсуждения; | * с каждой статьёй связана страница обсуждения; | ||
- | |||
=== Отличия от Википедии === | === Отличия от Википедии === | ||
Строка 63: | Строка 62: | ||
* тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных; | * тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных; | ||
* Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных; | * Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных; | ||
- | * статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ. | + | * статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ; |
+ | * любой участник Википедии имеет право модифицировать личные страницы других участников — здесь эта возможность запрещена. | ||
- | + | Имеющиеся отличия не исключают возможность обмена материалами с Википедией и другими сетевыми энциклопедиями. | |
- | === | + | === Широкие возможности === |
- | * | + | * С технической точки зрения MediaWiki даёт только одну ключевую возможность — совместно править страницы Ресурса. Однако это позволяет не только создавать общедоступную энциклопедию, но и организовывать совместную работу научных групп, вести обмен информацией по текущим исследованиям, находить и привлекать новых заинтересованных участников в свои проекты. |
- | * Основные категории Ресурса | + | * Основные категории Ресурса, поддерживающее наполнение энциклопедической составляющей Ресурса: |
- | + | ||
- | + | ||
** [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]] — терминологические, популярные и обзорные статьи; | ** [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]] — терминологические, популярные и обзорные статьи; | ||
** [[:Категория:Инструменты и технологии|инструменты и технологии]] — статьи по инструментальным средствам для автоматизации научной деятельности и решения задач анализа данных; | ** [[:Категория:Инструменты и технологии|инструменты и технологии]] — статьи по инструментальным средствам для автоматизации научной деятельности и решения задач анализа данных; | ||
+ | ** [[:Категория:Теоретические исследования|теоретические]] и [[:Категория:Прикладные исследования|прикладные]] исследования — статьи об оригинальных исследованиях. | ||
+ | |||
+ | * Основные категории Ресурса (см. [[Шаблон:Заглавная страница Основные категории|полный перечень]]), поддерживающие различные формы научного общения: | ||
+ | ** [[:Категория:Научные конференции|научные конференции]] — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций; | ||
+ | ** [[:Категория:Виртуальные семинары|виртуальные семинары]] — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям; | ||
+ | ** [[:Категория:Публикации|публикации]] — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётоы {{S|и т. д.}}; | ||
** [[:Категория:Конкурсы|конкурсы]] — открытые конкурсы по решению задач интеллекуального анализа данных; | ** [[:Категория:Конкурсы|конкурсы]] — открытые конкурсы по решению задач интеллекуального анализа данных; | ||
- | ** [[:Категория: | + | ** [[:Категория:Учебные курсы|учебные курсы]] — страницы учебных курсов, которые не исключают совместную работу преподавателей и студентов над содержимым отдельных страниц; |
** [[:Категория:Страницы участников|страницы участников]] — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах. | ** [[:Категория:Страницы участников|страницы участников]] — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах. | ||
- | * | + | * Итак, значительная часть работы учёного может вестись на страницах Ресурса: |
** поиск научной информации и новых идей; | ** поиск научной информации и новых идей; | ||
** установление научных контактов, образование научных сообществ; | ** установление научных контактов, образование научных сообществ; | ||
Строка 90: | Строка 94: | ||
** контроль за выполнением студенческих работ. | ** контроль за выполнением студенческих работ. | ||
- | == | + | == Перспективы == |
- | + | * Благодаря Ресурсу научное знание становится общедоступным практически в момент его появления. | |
- | + | * Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]]. | |
+ | * Значительная часть рабочего времени учёного может проходить на страницах Ресурса. Здесь можно жить — читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, Ресурс должен быть во-первых, наполнен полезной информацией, во-вторых, популярен и признан научной общественностью. Второе без первого невозможно, а первое без второго неэффективно. Становление такого Ресурса — постепенный (итерационный) процесс. | ||
== Поддержка проекта == | == Поддержка проекта == |
Версия 07:04, 5 апреля 2008
MachineLearning.Ru — русскоязычный информационно-аналитический профессиональный ресурс по интеллектуальному анализу данных и машинному обучению.
Содержание |
Цели создания Ресурса MachineLearning.Ru
- Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области машинного обучения и интеллектуального анализа данных.
- Способствовать обмену опытом, накоплению и распространению научных знаний в этой области.
- Предоставить площадку для виртуальных научных семинаров и обсуждений.
- Предоставить доступ к распределенной системе тестирования алгоритмов классификации и прогнозирования.
Научные направления
- Машинное обучение (machine learning) — теория, подходы и методы обучения по прецедентам:
- классификация (classification);
- кластеризация (clustering);
- регрессия (regression);
- прогнозирование (forecasting).
- Интеллектуальный анализ данных (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам:
- добыча знаний (knowledge discovery in databases);
- анализ, распознавание и понимание изображений (image analysis, recognition & understanding);
- компьютерное зрение (computer vision);
- анализ, распознавание и понимание речи (speach analysis, recognition & understanding);
- анализ и понимание текста (text mining);
- анализ информации в сети Интернет (web mining).
- Анализ данных — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам:
- прикладная статистика (applied statistics);
- обработка сигналов (signal processing);
- обработка и синтез изображений (image analysis & synthesis);
- поиск информации (information retrieval).
- Прикладные задачи и системы анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях:
Выше приведён примерный список направлений. Тематическая иерархия Ресурса начинается в корневой категории научные направления и будет постоянно уточняться всеми участниками проекта.
Для кого предназначен Ресурс
Аудитория Ресурса — русскоязычная, включающая следующие уровни:
- Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
- Эксперты в прикладных областях. Для них публикуется энциклопедия анализа данных, рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач.
- Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе, производстве и других сферах.
- Студенты, аспиранты, преподаватели, использующие Ресурс в образовательных целях.
Принципы построения Ресурса
Открытость
- Содержимое Ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением GNU FDL.
- Создатели Ресурса (научная школа академика РАН Ю. И. Журавлёва и чл.-корр. РАН К. В. Рудакова) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.
Сходство с Википедией
Ресурс строится по принципам Википедии — свободной энциклопедии и обладает всеми её основными возможностями и преимуществами:
- каждый пользователь ресурса может создать или изменить страницу (статью) или раздел (категорию) в любое время, в любом месте, располагая только доступом в Интернет;
- любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру Ресурса;
- история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
- с каждой статьёй связана страница обсуждения;
Отличия от Википедии
Имеются концептуальные отличия от Википедии, из-за которых данный Ресурс не может быть частью Википедии:
- тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
- Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
- статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ;
- любой участник Википедии имеет право модифицировать личные страницы других участников — здесь эта возможность запрещена.
Имеющиеся отличия не исключают возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.
Широкие возможности
- С технической точки зрения MediaWiki даёт только одну ключевую возможность — совместно править страницы Ресурса. Однако это позволяет не только создавать общедоступную энциклопедию, но и организовывать совместную работу научных групп, вести обмен информацией по текущим исследованиям, находить и привлекать новых заинтересованных участников в свои проекты.
- Основные категории Ресурса, поддерживающее наполнение энциклопедической составляющей Ресурса:
- энциклопедия анализа данных — терминологические, популярные и обзорные статьи;
- инструменты и технологии — статьи по инструментальным средствам для автоматизации научной деятельности и решения задач анализа данных;
- теоретические и прикладные исследования — статьи об оригинальных исследованиях.
- Основные категории Ресурса (см. полный перечень), поддерживающие различные формы научного общения:
- научные конференции — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций;
- виртуальные семинары — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям;
- публикации — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётоы и т. д.;
- конкурсы — открытые конкурсы по решению задач интеллекуального анализа данных;
- учебные курсы — страницы учебных курсов, которые не исключают совместную работу преподавателей и студентов над содержимым отдельных страниц;
- страницы участников — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах.
- Итак, значительная часть работы учёного может вестись на страницах Ресурса:
- поиск научной информации и новых идей;
- установление научных контактов, образование научных сообществ;
- работа с литературой, коллекционирование ссылок, реферирование и обсуждение статей;
- совместное ведение черновых записей;
- документирование и обсуждение результатов текущих исследований;
- проведение семинаров и дискуссий с коллегами, находящимися как в других городах, так и в соседней комнате;
- обмен исходными кодами программ и алгоритмов;
- размещение в широком доступе учебных материалов: лекций, заданий, практикумов;
- контроль за выполнением студенческих работ.
Перспективы
- Благодаря Ресурсу научное знание становится общедоступным практически в момент его появления.
- Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области машинного обучения и интеллектуального анализа данных.
- Значительная часть рабочего времени учёного может проходить на страницах Ресурса. Здесь можно жить — читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, Ресурс должен быть во-первых, наполнен полезной информацией, во-вторых, популярен и признан научной общественностью. Второе без первого невозможно, а первое без второго неэффективно. Становление такого Ресурса — постепенный (итерационный) процесс.
Поддержка проекта
Создание и развитие Ресурса MachineLearning.Ru поддержано Российским фондом фундаментальных исследований (проект № 07-07-00372) и компанией Forecsys.
История
- 2007, 3 октября. Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции ММРО-13.
- 2008, 5 февраля. Ресурс открыт для общего доступа и подготовлен к массовому наполнению.
Полный архив новостей Ресурса MachineLearning.Ru.
Адреса
Ресурс MachineLearning.Ru доступен по адресам www.machinelearning.ru и recognition.su.